33 puan yazan xguru 2023-03-19 | 1 yorum | WhatsApp'ta paylaş
  • Stanford'un Alpaca modelinin eğitim yöntemiyle aynı şekilde eğitildi
  • Omurga model olarak Polyglot-ko 5.8B ve LLaMA 7B kullanıldı
    • LLaMA, Korece veri kümesi eğitimi yetersiz olduğu için Korece performansı düşük; bu nedenle Korece model ayrıca eğitildi
  • LLaMA'nın 52k komut veri kümesi DeepL API ile çevrildi

1 yorum

 
luckydaun 2023-03-19

Vay... Bu ekosistem gerçekten inanılmaz hızlı gelişiyor. Mevcut Transformer modellerinde bile Koreceye yerelleştirilmiş modeller ile genel amaçlı modeller arasındaki performans farkı çok büyük; güzel bir açık kaynak projesi.