- Mevcut Llama2 7B'nin yeteneklerini en üst düzeye çıkarmak için Depth Up-Scaling tekniğini geliştirip uyguladı
- Benchmark sonuçlarına göre, 30 milyardan az parametreye sahip modeller arasında üstün performans gösteriyor ve kendisinden 6 kat büyük QWEN ile yakın zamanda çıkan Mixtral 8x7B modelini geride bırakıyor
- OpenLLM liderlik tablosunda 74.2 puanla 1. sırada. Alibaba'nın QWEN-72B modeli 73.6, Mixtral-8x7B ise 72.6 puanda
- Instruction fine-tuning iyi şekilde uygulanmış
- Bu kez yayımlanan model İngilizce tabanlı olduğu için Türkçe dışındaki dillerde olduğu gibi Korece performansı da düşük olabilir
1 yorum
Upstage, KakaoTalk'ta kullanılabilen yapay zeka AskUp'ın geliştiricisidir.
Alibaba, açık kaynak yapay zeka modeli QWEN'i duyurdu
Mistral AI, Llama 2 70B modelinden daha iyi Mixtral 8x7B modelini duyurdu