- LLaMA 2'nin çıkışından sonra ortam daha da ısındı
- Neredeyse tüm açık kaynak model grupları kendi modellerini yeni temel modelle güncelliyor
- WizardLM, Airoboros, Hermes vb.
- Şu anda en güçlü model StabilityAI'nin Stable Beluga 2'si
- Llama2 70B modeli, Orca tarzı veri setiyle fine-tune edildi
- ChatGPT ile karşılaştırılabilir
- Uzun bağlamlı modeller
- LLaMA 7B 16K, LLaMA 13B 16K, LLaMA 7B 32K
- Küçük ama güçlü modeller
- 7B kadar güçlü 3B parametreli modeller
- Henüz sınıra ulaşılmadı ve ilerlenebilecek çok alan var
- SlimPajama, SwiGLU, ALiBI, Variable Sequence Length, Maximal update parameterization (muP)
- Açık model, MMLU'da ChatGPT'yi geçti: llama-2-70b-guanaco-qlora
- Çok turlu sohbet: llama2-13b-orca-8k-3319
- Çinli modeller rekabet ediyor: CodeGeex2
- Açık modeller ChatGPT seviyesine ulaştı mı?
- Henüz değil, ama yakında ulaşabilir
3 yorum
Herkes kendi rolünde parayı nasıl kazanması gerektiği konusunda, yani monetization üzerine, epey kafa yoracak gibi görünüyor.
Çeşit çeşit AI hizmeti arttıkça seçim yapmak zorlaşıyor; hem genel amaçlı AI hizmetleri var hem de geliştiricilere özel AI hizmetleri~
Umarım Korece modeller de gelişir.