7 puan yazan xguru 2023-02-28 | Henüz yorum yok. | WhatsApp'ta paylaş
  • 7B, 13B, 33B, 65B olmak üzere 4 farklı boyutta yayımlandı
  • Çok daha küçük ölçekte olmasına rağmen, veri eğitimi güçlendirilip ince ayar yapılarak daha büyük modellerle karşılaştırılabilecek verimli bir model
  • 33B/65B, 1,4 trilyon token ile eğitildi (7B ise 1 trilyon)
  • "13B model, 175B olan GPT-3'ten daha iyi ve 65B ise çok daha büyük Chinchilla70B ve PaLM-540B ile rekabet edebilir"
  • Yapay zeka araştırmaları gibi yalnızca ticari olmayan amaçlarla kullanılabilir (başvuru ve onay gerekli)

Henüz yorum yok.

Henüz yorum yok.