Upstage, 10.7B SOLAR modelini ticari kullanıma uygun bir lisansla yayımladı

xguru · 2023-12-15T08:52:33+09:00

Mevcut Llama2 7B'nin yeteneklerini en üst düzeye çıkarmak için Depth Up-Scaling tekniğini geliştirip uyguladı Benchmark sonuçlarına göre, 30 milyardan az parametreye sahip modeller arasında üstün performans gösteriyor ve kendisinden 6 kat büyük QWEN ile yakın zamanda çıkan Mixtral 8x7B modelini geride bırakıyor OpenLLM liderlik tablosunda 74.2 puanla 1. sırada. Alibaba'nın QWEN-72B modeli 73.6, Mixtral-8x7B ise 72.6 puanda Instruction fine-tuning iyi şekilde uygulanmış Bu kez yayımlanan model İngilizce tabanlı olduğu için Türkçe dışındaki dillerde olduğu gibi Korece performansı da düşük olabilir

(huggingface.co)

9 puan yazan xguru 2023-12-15 | 1 yorum | WhatsApp'ta paylaş

Mevcut Llama2 7B'nin yeteneklerini en üst düzeye çıkarmak için Depth Up-Scaling tekniğini geliştirip uyguladı
Benchmark sonuçlarına göre, 30 milyardan az parametreye sahip modeller arasında üstün performans gösteriyor ve kendisinden 6 kat büyük QWEN ile yakın zamanda çıkan Mixtral 8x7B modelini geride bırakıyor
- OpenLLM liderlik tablosunda 74.2 puanla 1. sırada. Alibaba'nın QWEN-72B modeli 73.6, Mixtral-8x7B ise 72.6 puanda
Instruction fine-tuning iyi şekilde uygulanmış
Bu kez yayımlanan model İngilizce tabanlı olduğu için Türkçe dışındaki dillerde olduğu gibi Korece performansı da düşük olabilir

1 yorum

xguru 2023-12-15

Upstage, KakaoTalk'ta kullanılabilen yapay zeka AskUp'ın geliştiricisidir.
Alibaba, açık kaynak yapay zeka modeli QWEN'i duyurdu
Mistral AI, Llama 2 70B modelinden daha iyi Mixtral 8x7B modelini duyurdu

Upstage, 10.7B SOLAR modelini ticari kullanıma uygun bir lisansla yayımladı

İlgili okumalar

1 yorum