Gerçek anlamda açık bir LLM: Hello OLMo sahnede
(blog.allenai.org)-
AI2, OLMo 7B modelini duyurdu. Bu model, ön eğitim verileri ve eğitim kodu birlikte yayımlandığı için kelimenin tam anlamıyla açık kaynaklı bir büyük dil modeli.
- Araştırmacıların ve geliştiricilerin en iyi açık modelleri kullanarak dil modeli bilimini kolektif biçimde ilerletmesini sağlıyor.
- Meta'nın yapay zeka bilim insanı Yann LeCun, açık kaynak topluluğunun yapay zekanın geleceğini en hızlı ve en etkili şekilde inşa edebileceğini söyledi.
-
OLMo çerçevesinin başlıca özellikleri:
- Tam ön eğitim verisi: AI2'nin Dolma veri kümesini kullanıyor ve eğitim verisini üreten kodu da içeriyor.
- Eğitim kodu ve model ağırlıkları: 7B ölçeğinde 4 model varyantı için tam model ağırlıkları, çıkarım kodu, eğitim metrikleri ve eğitim günlükleri sağlanıyor.
- Değerlendirme: Catwalk projesi kapsamında 500'den fazla checkpoint, değerlendirme kodu ve geliştirmede kullanılan değerlendirme araçları yayımlanıyor.
-
OLMo sayesinde yapay zeka araştırmacıları ve geliştiriciler şu deneyimleri yaşayabilir:
- Daha doğru analiz: Eğitim verisine dair tam görünürlük sayesinde daha hızlı çalışabilirler.
- Karbon emisyonlarının azaltılması: Tüm eğitim ve değerlendirme ekosisteminin açılmasıyla yinelenen geliştirme azaltılabilir.
- Süreklilik gösteren sonuçlar: Model ve veri kümeleri yayımlanarak önceki modellerden öğrenme ve onların üzerine inşa etme imkanı sağlanır.
-
OLMo'nun geliştirilmesi; AMD, CSC(Lumi Supercomputer), University of Washington, Databricks ve diğerleriyle yapılan iş birlikleri sayesinde mümkün oldu.
GN⁺ görüşü
- Yapay zeka modellerinde şeffaflığı artırmak için eğitim verileri ve kodun yayımlanması büyük önem taşıyor gibi görünüyor. Ancak veri önyargısı gibi sorunlar olabileceğinden, bunların da incelenmesi gerekiyor.
- Açık kaynak dil modeli ekosisteminin canlanmasıyla teknolojik gelişmenin hızlanması bekleniyor. Yine de büyük BT şirketlerinin kapalı yapay zeka modelleriyle rekabette nasıl bir sonuç çıkacağını görmek gerekiyor.
- Yapay zeka geliştirme için gereken devasa hesaplama kaynaklarını sağlamak adına farklı kurumlarla iş birliği çok önemli görünüyor. Bu, akademi-sanayi iş birliği modeli için iyi bir örnek olabilir.
- OLMo sayesinde dil modellerinin çalışma prensiplerine ilişkin bilimsel araştırmaların canlanması bekleniyor. Bu da daha güvenli ve daha güvenilir yapay zeka geliştirilmesine katkı sağlayabilir.
1 yorum
Hacker News görüşleri