Alpaca: GPT-3.5 düzeyinde güçlü bir açık kaynak Instruction-Following modeli

xguru · 2023-03-14T11:21:01+09:00

Stanford CRFM, Meta'nın LLaMA 7B modelini 52K Instruction-Following verisiyle fine-tune etti OpenAI'nin GPT-3.5'i (text-davinci-003) ile benzer şekilde çalışıyor, ancak çok daha küçük ve ucuz Eğitim reçetesini ve verileri paylaşıyor; ileride model ağırlıklarını da yayımlamayı planlıyor Yalnızca araştırma amacıyla sunuluyor; ticari kullanım yasak Fine-tuning işlemi 8 adet 80GB A100 üzerinde 3 saat sürdü ve bulutta yaklaşık 100 doların altında gerçekleştirilebildi

(crfm.stanford.edu)

19 puan yazan xguru 2023-03-14 | 1 yorum | WhatsApp'ta paylaş

Stanford CRFM, Meta'nın LLaMA 7B modelini 52K Instruction-Following verisiyle fine-tune etti
OpenAI'nin GPT-3.5'i (text-davinci-003) ile benzer şekilde çalışıyor, ancak çok daha küçük ve ucuz
Eğitim reçetesini ve verileri paylaşıyor; ileride model ağırlıklarını da yayımlamayı planlıyor
Yalnızca araştırma amacıyla sunuluyor; ticari kullanım yasak
Fine-tuning işlemi 8 adet 80GB A100 üzerinde 3 saat sürdü ve bulutta yaklaşık 100 doların altında gerçekleştirilebildi

1 yorum

xguru 2023-03-14

Repo: https://github.com/tatsu-lab/stanford_alpaca
Web demo: https://crfm.stanford.edu/alpaca/

LLaMA'nın yayımlanması gerçekten bir Stable Diffusion Moment yaratıyor. Her şey gerçekten çok hızlı değişiyor.

Alpaca: GPT-3.5 düzeyinde güçlü bir açık kaynak Instruction-Following modeli

İlgili okumalar

1 yorum