19 puan yazan xguru 2023-03-14 | 1 yorum | WhatsApp'ta paylaş
  • Stanford CRFM, Meta'nın LLaMA 7B modelini 52K Instruction-Following verisiyle fine-tune etti
  • OpenAI'nin GPT-3.5'i (text-davinci-003) ile benzer şekilde çalışıyor, ancak çok daha küçük ve ucuz
  • Eğitim reçetesini ve verileri paylaşıyor; ileride model ağırlıklarını da yayımlamayı planlıyor
  • Yalnızca araştırma amacıyla sunuluyor; ticari kullanım yasak
  • Fine-tuning işlemi 8 adet 80GB A100 üzerinde 3 saat sürdü ve bulutta yaklaşık 100 doların altında gerçekleştirilebildi

1 yorum

 
xguru 2023-03-14

Repo: https://github.com/tatsu-lab/stanford_alpaca
Web demo: https://crfm.stanford.edu/alpaca/

LLaMA'nın yayımlanması gerçekten bir Stable Diffusion Moment yaratıyor. Her şey gerçekten çok hızlı değişiyor.