22 puan yazan xguru 2023-08-09 | 3 yorum | WhatsApp'ta paylaş
  • LLaMA 2'nin çıkışından sonra ortam daha da ısındı
    • Neredeyse tüm açık kaynak model grupları kendi modellerini yeni temel modelle güncelliyor
      • WizardLM, Airoboros, Hermes vb.
    • Şu anda en güçlü model StabilityAI'nin Stable Beluga 2'si
      • Llama2 70B modeli, Orca tarzı veri setiyle fine-tune edildi
      • ChatGPT ile karşılaştırılabilir
  • Uzun bağlamlı modeller
    • LLaMA 7B 16K, LLaMA 13B 16K, LLaMA 7B 32K
  • Küçük ama güçlü modeller
    • 7B kadar güçlü 3B parametreli modeller
    • Henüz sınıra ulaşılmadı ve ilerlenebilecek çok alan var
    • SlimPajama, SwiGLU, ALiBI, Variable Sequence Length, Maximal update parameterization (muP)
  • Açık model, MMLU'da ChatGPT'yi geçti: llama-2-70b-guanaco-qlora
  • Çok turlu sohbet: llama2-13b-orca-8k-3319
  • Çinli modeller rekabet ediyor: CodeGeex2
  • Açık modeller ChatGPT seviyesine ulaştı mı?
    • Henüz değil, ama yakında ulaşabilir

3 yorum

 
botplaysdice 2023-08-10

Herkes kendi rolünde parayı nasıl kazanması gerektiği konusunda, yani monetization üzerine, epey kafa yoracak gibi görünüyor.

 
geekbini 2023-08-09

Çeşit çeşit AI hizmeti arttıkça seçim yapmak zorlaşıyor; hem genel amaçlı AI hizmetleri var hem de geliştiricilere özel AI hizmetleri~

 
kuroneko 2023-08-09

Umarım Korece modeller de gelişir.