Alpaca: GPT-3.5 düzeyinde güçlü bir açık kaynak Instruction-Following modeli
(crfm.stanford.edu)- Stanford CRFM, Meta'nın LLaMA 7B modelini 52K Instruction-Following verisiyle fine-tune etti
- OpenAI'nin GPT-3.5'i (
text-davinci-003) ile benzer şekilde çalışıyor, ancak çok daha küçük ve ucuz - Eğitim reçetesini ve verileri paylaşıyor; ileride model ağırlıklarını da yayımlamayı planlıyor
- Yalnızca araştırma amacıyla sunuluyor; ticari kullanım yasak
- Fine-tuning işlemi 8 adet 80GB A100 üzerinde 3 saat sürdü ve bulutta yaklaşık 100 doların altında gerçekleştirilebildi
1 yorum
Repo: https://github.com/tatsu-lab/stanford_alpaca
Web demo: https://crfm.stanford.edu/alpaca/
LLaMA'nın yayımlanması gerçekten bir Stable Diffusion Moment yaratıyor. Her şey gerçekten çok hızlı değişiyor.