Model Summary

GritLM is a generative representational instruction tuned language model. It unifies text representation (embedding) and text generation into a single model achieving state-of-the-art performance on both types of tasks.

Repository: ContextualAI/gritlm
Paper: https://arxiv.org/abs/2402.09906
Logs: https://wandb.ai/muennighoff/gritlm/runs/0uui712t/overview
Script: https://github.com/ContextualAI/gritlm/blob/main/scripts/training/train_gritlm_7b.sh

Model	Description
GritLM 7B	Mistral 7B finetuned using GRIT
GritLM 8x7B	Mixtral 8x7B finetuned using GRIT

Use

The model usage is documented here.

Citation

@misc{muennighoff2024generative,
 title={Generative Representational Instruction Tuning}, 
 author={Niklas Muennighoff and Hongjin Su and Liang Wang and Nan Yang and Furu Wei and Tao Yu and Amanpreet Singh and Douwe Kiela},
 year={2024},
 eprint={2402.09906},
 archivePrefix={arXiv},
 primaryClass={cs.CL}
}

Downloads last month: 10,075

Safetensors

Model size

7B params

Tensor type

BF16

Model tree for GritLM/GritLM-7B

Base model

mistralai/Mistral-7B-v0.1

Finetuned

(936)

this model

Adapters

4 models

Finetunes

2 models

Merges

4 models

Quantizations

6 models

Dataset used to train GritLM/GritLM-7B

Spaces using GritLM/GritLM-7B 49

Collection including GritLM/GritLM-7B

Generative Representational Instruction Tuning (GRIT) • 63 items • Updated Mar 2 • 9

Paper for GritLM/GritLM-7B

Paper • 2402.09906 • Published Feb 15, 2024 • 54

Evaluation results

mteb/arguana leaderboard
ArguAna Default Test View evaluation results
👁 Image

source
Obtained using MTEB v1.12.75
63.17 ^*
ArguAna View evaluation results
👁 Image

source
Obtained using MTEB v1.12.75
63.17 ^*

accuracy on MTEB AmazonCounterfactualClassification (en)
test set self-reported
81.179
ap on MTEB AmazonCounterfactualClassification (en)
test set self-reported
46.263
f1 on MTEB AmazonCounterfactualClassification (en)
test set self-reported
75.446
accuracy on MTEB AmazonPolarityClassification
test set self-reported
96.516
ap on MTEB AmazonPolarityClassification
test set self-reported
94.791

URL: https://huggingface.co/GritLM/GritLM-7B

⇱ GritLM/GritLM-7B · Hugging Face

Model Summary

Use

Citation

Model tree for GritLM/GritLM-7B

Dataset used to train GritLM/GritLM-7B

Spaces using GritLM/GritLM-7B 49

Collection including GritLM/GritLM-7B

Paper for GritLM/GritLM-7B

Evaluation results