Meta Llama 3 duyurusundan sonra ilk haftada yaşananlar

xguru · 2024-04-29T09:46:01+09:00

18/4'te Llama 3 modelinin yayımlanmasının ardından geliştirici topluluğunun tepkisi muazzamdı Model 1,2 milyondan fazla indirildi ve geliştiriciler Hugging Face'te 600'den fazla türev model paylaştı Llama 3 GitHub deposu 17.000'den fazla yıldız aldı LMSYS Chatbot Arena liderlik tablosunda Llama 3 70B Instruct modeli, yalnızca İngilizce değerlendirmede 1. sırayı aldı ve genel sıralamada 6. olarak açık modeller arasında en yüksek sıraya yerleşti (kapalı sahipli modellerin ardından) Llama 3'ün ilk kullanım örnekleri Silikon, donanım ve bulut sağlayıcısı iş ortakları Llama 3'ü kullanıcılarına sunmaya başladı Yale Üniversitesi Tıp Fakültesi, EPFL Bilgisayar ve İletişim Bilimleri Okulu ile birlikte, Llama 3'ün çıkışından 24 saat sonra modeli fine-tune ederek tıp alanındaki ilk Llama 3 8B modeli olan Llama-3[8B]-MeditronV1.0'ı tanıttı Bu yeni model, MedQA ve MedMCQA gibi standart benchmark'larda aynı parametre sınıfındaki tüm güncel açık modelleri geride bıraktı Yale Üniversitesi ve EPFL'nin Llama 2 tabanlı Meditron'un ilk sürümünü nasıl geliştirdiğine dair ayrıntılar ilgili bağlantıda bulunabilir Llama 3 için gelecek planları Önümüzdeki birkaç ay içinde multimodal, çok dilli diyalog, daha uzun context window ve genel yetenek iyileştirmeleri gibi yeni özelliklere sahip modeller yayımlanacak Yakında daha fazla ayrıntı paylaşılması ve topluluk odaklı inovasyonun bir sonraki dalgasının görülmesi bekleniyor

(ai.meta.com)

13 puan yazan xguru 2024-04-29 | 3 yorum | WhatsApp'ta paylaş

18/4'te Llama 3 modelinin yayımlanmasının ardından geliştirici topluluğunun tepkisi muazzamdı
- Model 1,2 milyondan fazla indirildi ve geliştiriciler Hugging Face'te 600'den fazla türev model paylaştı
- Llama 3 GitHub deposu 17.000'den fazla yıldız aldı
- LMSYS Chatbot Arena liderlik tablosunda Llama 3 70B Instruct modeli, yalnızca İngilizce değerlendirmede 1. sırayı aldı ve genel sıralamada 6. olarak açık modeller arasında en yüksek sıraya yerleşti (kapalı sahipli modellerin ardından)

Llama 3'ün ilk kullanım örnekleri

Silikon, donanım ve bulut sağlayıcısı iş ortakları Llama 3'ü kullanıcılarına sunmaya başladı
Yale Üniversitesi Tıp Fakültesi, EPFL Bilgisayar ve İletişim Bilimleri Okulu ile birlikte, Llama 3'ün çıkışından 24 saat sonra modeli fine-tune ederek tıp alanındaki ilk Llama 3 8B modeli olan Llama-3[8B]-MeditronV1.0'ı tanıttı
- Bu yeni model, MedQA ve MedMCQA gibi standart benchmark'larda aynı parametre sınıfındaki tüm güncel açık modelleri geride bıraktı
- Yale Üniversitesi ve EPFL'nin Llama 2 tabanlı Meditron'un ilk sürümünü nasıl geliştirdiğine dair ayrıntılar ilgili bağlantıda bulunabilir

Llama 3 için gelecek planları

Önümüzdeki birkaç ay içinde multimodal, çok dilli diyalog, daha uzun context window ve genel yetenek iyileştirmeleri gibi yeni özelliklere sahip modeller yayımlanacak
Yakında daha fazla ayrıntı paylaşılması ve topluluk odaklı inovasyonun bir sonraki dalgasının görülmesi bekleniyor

3 yorum

gcback 2024-04-29

Yerli büyük şirketlerin LLM’leri giderek rekabet gücünü daha da kaybediyor. Eğer stratejileri kapalı model olmaksa, performans açısından yeterince rekabetçi olmaları gerekir; yok performans düşük olsa bile kullanım alanlarını genişletmek stratejiyse, o zaman Korece merkezli olmayı öne çıkarmamaları gerekir; ama şu anda tam tersini yapıyorlar.

cosine20 2024-04-30

Korece leaderboard’da anlamsız ağırlık rekabeti yapıp bununla haber çıkararak hisse fiyatını korumaya çalışıyorlar, hahaha

2024-04-30

[Bu yorum gizlendi.]

Meta Llama 3 duyurusundan sonra ilk haftada yaşananlar

Llama 3'ün ilk kullanım örnekleri

Llama 3 için gelecek planları

İlgili okumalar

3 yorum