- "Less Is More for Alignment"
- Pekiştirmeli öğrenme veya tercih modellemesi olmadan, iyi kürasyon yapılmış yalnızca 1000 prompt ile fine-tune edilen LLaMA modeli
- Vakaların %43'ünde GPT-4 ile eşdeğer ya da daha çok tercih ediliyor; Bard ile karşılaştırıldığında bu oran %58, insan geri bildirimiyle eğitilmiş DaVinci003'e kıyasla %65 daha yüksek
- Makalenin hipotezi, LLM'lerin neredeyse tüm bilgisinin pretraining sırasında öğrenildiği ve alignment'ın kullanıcıyla etkileşim kurma biçimini/stilini öğrenen basit bir süreç olduğu yönünde
- Meta AI'ın yeni makalesi
4 yorum
Sejong projesi sürdürülerek Korece dil modeli verileri açık kaynak olarak biriktirilmeliydi. Gerçekten çok üzücü bir proje...
İngilizce performansı bu kadar hızlı gelişirken, GPT dışındaki çoğu modelin Koreceyi hâlâ iyi anlayamaması gerçekten üzücü...
Anthropic Claude'un Korece eğitimi oldukça iyi bir seviyede, ancak ifade yeteneği bazı açılardan hâlâ ChatGPT'den farklı.
Üzgün yüz, doğru. Korece konusunda GPT API dışındakilerin hepsi neredeyse çöp seviyesinde...