LLaMA - Meta'nın yayımladığı 65B parametreli LLM

xguru · 2023-02-28T10:49:01+09:00

7B, 13B, 33B, 65B olmak üzere 4 farklı boyutta yayımlandı Çok daha küçük ölçekte olmasına rağmen, veri eğitimi güçlendirilip ince ayar yapılarak daha büyük modellerle karşılaştırılabilecek verimli bir model 33B/65B, 1,4 trilyon token ile eğitildi (7B ise 1 trilyon) "13B model, 175B olan GPT-3'ten daha iyi ve 65B ise çok daha büyük Chinchilla70B ve PaLM-540B ile rekabet edebilir" Yapay zeka araştırmaları gibi yalnızca ticari olmayan amaçlarla kullanılabilir (başvuru ve onay gerekli)

(ai.facebook.com)

7 puan yazan xguru 2023-02-28 | Henüz yorum yok. | WhatsApp'ta paylaş

7B, 13B, 33B, 65B olmak üzere 4 farklı boyutta yayımlandı
Çok daha küçük ölçekte olmasına rağmen, veri eğitimi güçlendirilip ince ayar yapılarak daha büyük modellerle karşılaştırılabilecek verimli bir model
33B/65B, 1,4 trilyon token ile eğitildi (7B ise 1 trilyon)
"13B model, 175B olan GPT-3'ten daha iyi ve 65B ise çok daha büyük Chinchilla70B ve PaLM-540B ile rekabet edebilir"
Yapay zeka araştırmaları gibi yalnızca ticari olmayan amaçlarla kullanılabilir (başvuru ve onay gerekli)

LLaMA - Meta'nın yayımladığı 65B parametreli LLM

İlgili okumalar

Henüz yorum yok.