9 puan yazan xguru 2023-12-15 | 1 yorum | WhatsApp'ta paylaş
  • Mevcut Llama2 7B'nin yeteneklerini en üst düzeye çıkarmak için Depth Up-Scaling tekniğini geliştirip uyguladı
  • Benchmark sonuçlarına göre, 30 milyardan az parametreye sahip modeller arasında üstün performans gösteriyor ve kendisinden 6 kat büyük QWEN ile yakın zamanda çıkan Mixtral 8x7B modelini geride bırakıyor
    • OpenLLM liderlik tablosunda 74.2 puanla 1. sırada. Alibaba'nın QWEN-72B modeli 73.6, Mixtral-8x7B ise 72.6 puanda
  • Instruction fine-tuning iyi şekilde uygulanmış
  • Bu kez yayımlanan model İngilizce tabanlı olduğu için Türkçe dışındaki dillerde olduğu gibi Korece performansı da düşük olabilir