GPT-NeoX-20B’ye dört işlem soruları sordum
(twitter.com/moyix)-
GPT-3 ölçeğindeki modeli açık kaynak olarak sunan GPT-NeoX’e basit dört işlem soruları soruldu
-
100 sorudan yalnızca 10’una doğru cevap verdi. Ancak çoğu cevap doğru sonuca yakın
Q: "What is 2653 * 30641?"
A: 82356113 (yanlış)
Doğru cevap 81290573
- "Dil modellerinin" temelde matematikte çok iyi olmadığı biliniyor (muhtemelen kısmen sayıları tokenleştirme biçimlerinden dolayı)
4 yorum
Gerçek doğru cevap 81290573 ve GPT-NeoX’un cevabı 82356113 değil mi?
Ben de doğrudan zihinden hesaplamayı denedim ve hesap makinesiyle de kontrol ettim; doğru cevap 81290573 gibi görünüyor!
(Bağlantıdaki görselde de Correct kısmının No olarak göründüğünü görebilirsiniz.
Eğer değilse lütfen beni düzeltin!)
Aman of of, sanırım yazarken başla sonu ters çevirmişim. Düzelttim of
Aksine, yaklaşık değeri doğru cevap olarak vermesi daha insansı geldiği için daha da şaşırtıcı.
Bununla ilgili daha ayrıntılı konuşmalar HN yorumlarında var: https://news.ycombinator.com/item?id=30299360