Paper • 2302.13971 • Published • 24
FLAMA: Model 3B ChatML en Català i Castellà. Versió 0.5
FLAMA és el primer model petit 3B bilingüe en català i castellà. És el resultat de finetunejar el model open_llama_3b_v2 amb les instruccions d'OpenAssistant v2 traduïdes automàticament al català i al castellà amb recursos de Helsinki-NLP i tractades en format ChatML.
Novetats de la versió 0.5
- Català millorat
- Afegit el Castellà
Prompt Template
FLAMA usa ChatML com a prompt template:
<|im_start|>user
Qui va ser Isaac Newton?<|im_end|>
<|im_start|>assistant\n
<|im_start|>user
Quien fué Isaac Newton?<|im_end|>
<|im_start|>assistant\n
Referències
@software{xaviviro2023flama,
author = {xaviviro},
title = {FLAMA: Model 3B ChatML en Català. Versió 0.5},
month = January,
year = 2024,
url = {https://huggingface.co/xaviviro/FLAMA-0.5-3B}
}
@software{openlm2023openllama,
author = {Geng, Xinyang and Liu, Hao},
title = {OpenLLaMA: An Open Reproduction of LLaMA},
month = May,
year = 2023,
url = {https://github.com/openlm-research/open_llama}
}
@software{together2023redpajama,
author = {Together Computer},
title = {RedPajama-Data: An Open Source Recipe to Reproduce LLaMA training dataset},
month = April,
year = 2023,
url = {https://github.com/togethercomputer/RedPajama-Data}
}
@article{touvron2023llama,
title={Llama: Open and efficient foundation language models},
author={Touvron, Hugo and Lavril, Thibaut and Izacard, Gautier and Martinet, Xavier and Lachaux, Marie-Anne and Lacroix, Timoth{\'e}e and Rozi{\`e}re, Baptiste and Goyal, Naman and Hambro, Eric and Azhar, Faisal and others},
journal={arXiv preprint arXiv:2302.13971},
year={2023}
}
- Downloads last month
- 43
GGUF
Model size
3B params
Architecture
llama
Hardware compatibility
Log In to add your hardware
2-bit
3-bit
4-bit
5-bit
6-bit
8-bit
16-bit
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support
Model tree for xaviviro/FLAMA-0.5-3B-GGUF
Base model
openlm-research/open_llama_3b_v2 Finetuned
xaviviro/FLAMA-0.5-3B