Yi - Yeni Nesil Açık Kaynak İki Dilli LLM
(github.com/01-ai)- Geliştiriciler tarafından sıfırdan eğitilmiş yeni nesil açık kaynak büyük dil modeli
- İki dilli bir model hedefiyle 3T çok dilli corpus üzerinde eğitildi; dil anlama, sağduyulu akıl yürütme ve okuduğunu anlama gibi alanlarda güçlü performans gösteriyor
- 6B ve 34B önceden eğitilmiş dil modellerini temel alıyor ve chatbot modeli, 200K uzun bağlam modeli, derinlik upscale modeli ve vision-language modeli olarak genişletiliyor
- Yi-34B-Chat modeli
- AlpacaEval liderlik tablosunda GPT-4 Turbo'nun ardından 2. sırayı alarak diğer LLM'leri geride bırakıyor
- Hem İngilizce hem Çince'de mevcut açık kaynak modelleri geride bırakıyor ve çeşitli benchmark'larda 1. sırayı alıyor
- Llama ile aynı model mimarisini benimsiyor ancak Llama'dan türetilmiş bir model değil. Llama ağırlıkları kullanılmıyor
- Farklı boyutlarda sunuluyor ve belirli gereksinimlere göre model fine-tune edilebiliyor
- Sohbet modelleri
- Yi-34B-Chat, Yi-34B-Chat-4bits, Yi-34B-Chat-8bits
- Yi-6B-Chat, Yi-6B-Chat-4bits, Yi-6B-Chat-8bits
- Temel modeller
- Yi-34B, Yi-34B-200K
- Yi-9B
- Yi-6B, Yi-6B-200K
- Sohbet modelleri
1 yorum
Hacker News görüşleri