KoAlpaca - Korece Alpaca modeli
(github.com/Beomi)- Stanford'un Alpaca modelinin eğitim yöntemiyle aynı şekilde eğitildi
- Omurga model olarak Polyglot-ko 5.8B ve LLaMA 7B kullanıldı
- LLaMA, Korece veri kümesi eğitimi yetersiz olduğu için Korece performansı düşük; bu nedenle Korece model ayrıca eğitildi
- LLaMA'nın 52k komut veri kümesi DeepL API ile çevrildi
1 yorum
Vay... Bu ekosistem gerçekten inanılmaz hızlı gelişiyor. Mevcut Transformer modellerinde bile Koreceye yerelleştirilmiş modeller ile genel amaçlı modeller arasındaki performans farkı çok büyük; güzel bir açık kaynak projesi.