19 puan yazan xguru 2023-07-19 | 3 yorum | WhatsApp'ta paylaş
  • Hem araştırma hem de ticari kullanım için uygun açık kaynaklı büyük dil modeli
  • Llama 1’e kıyasla %40 daha fazla, 2 trilyon token verisiyle eğitildi
  • 2 kat daha uzun bağlam uzunluğu: 4096
  • Üç farklı model boyutu: 7B, 13B, 70B
  • Akıl yürütme, kodlama, yeterlilik ve bilgi testleri gibi birçok benchmark’ta diğer açık kaynaklı dil modellerinden daha iyi performans (MPT, Falcon, Llama-1)
  • Açık veri kaynaklarıyla eğitildi; ayrıca ince ayar yapılmış Llama-2-chat de açık komut veri setleri ve bir milyondan fazla insan anotasyonundan yararlanıyor
  • İndirmeye dahil olanlar
    • Model code
    • Model Weights
    • README (User Guide)
    • Responsible Use Guide
    • License
    • Acceptable Use Policy
    • Model Card

3 yorum

 
kuroneko 2023-07-19

Bu kez de biri "kamu yararı" amacıyla torrent magnet bağlantısını ortalığa saçar mı?

 
tpdns90321 2023-07-19

Bu kez buna gerek kalmadan doğrudan yayınlandı

 
xguru 2023-07-19

Alana göre farklar var ama değerlendirmeler neredeyse GPT-3.5 seviyesine yaklaştığını, hatta onu aştığını gösteriyor.

Tamamen açık gibi görünse de önemli bir kısıt var. "MAU'su 700 milyonu aşan hizmetler" Meta'dan lisans talep etmek zorunda ve Meta bunu reddedebilir.

Sanki "Google, TikTok siz kullanmayın!" diyorlar.

Microsoft da hızlı davranıp Llama 2'nin Azure üzerinde kullanılabileceğini duyurdu. https://blogs.microsoft.com/blog/2023/…

Görünüşe göre Microsoft, OpenAI'da olduğu gibi Meta ile de iyi ilişkilerini koruyor.