1 puan yazan GN⁺ 2024-12-03 | 1 yorum | WhatsApp'ta paylaş
  • Prosedürel bilginin büyük dil modellerinin akıl yürütmesi üzerindeki etkisi

  • Büyük dil modellerinin (LLM) yetenekleri ve sınırları son yıllarda ayrıntılı biçimde incelendi. LLM'ler problem çözme becerisi gösterse de, insanlarla karşılaştırıldığında akıl yürütmede bir fark bulunuyor ve bu da genelleme stratejilerinin sağlamlığı hakkında soru işaretleri doğuruyor.

  • LLM tasarımında kullanılan verinin muazzam hacmi nedeniyle, geleneksel genelleme ölçüm yöntemi olan eğitim-test kümesi ayrımı zorlaşıyor. Bunu aşmak için, LLM'lerin akıl yürütme görevlerini yerine getirirken kullandığı genelleme stratejileri ön eğitim verilerinde inceleniyor.

  • İki farklı model boyutu (7B ve 35B) ve 2.5B ön eğitim token'ı kullanılarak, üç basit matematiksel akıl yürütme görevi için model çıktısını etkileyen belgeler belirlendi ve bunlar, olgusal soruları yanıtlarken etkili olan verilerle karşılaştırıldı.

  • Model her bir olgusal soru için çoğunlukla birbirinden ayrı veri kümeleri kullanırken, aynı görev içindeki farklı akıl yürütme sorularında da belgelerin benzer etkiler gösterdiği sıkça görülüyor; bu da prosedürel bilginin varlığına işaret ediyor.

  • Olgusal soruların yanıtları en etkili verilerde sıkça görünürken, akıl yürütme sorularında yanıtların ya da ara akıl yürütme adımlarının yanıtlarının yüksek etki göstermediği görülüyor.

  • Akıl yürütme sorularına ilişkin üst sıralardaki belgelerin nitel analizinde, etkili belgelerin çoğu zaman formüller veya kod aracılığıyla çözüm yöntemini gösteren prosedürel bilgi içerdiği doğrulanıyor.

  • Bu bulgular, modelin kullandığı akıl yürütme yaklaşımının basit bir bilgi geri getirme işleminden ibaret olmadığını; benzer biçimde akıl yürütme yapan belgelerdeki prosedürel bilgiyi sentezleyen, genellenebilir bir strateji olduğunu düşündürüyor.

1 yorum

 
GN⁺ 2024-12-03
Hacker News görüşü
  • LLM'lerin her sorunun örneğini eğitim verilerinde bulamayacağına dikkat çekiliyor ve bilgi erişimi tarzı arama için gereken olgusal sorgulama örneklerinin yeterli olmadığı belirtiliyor

    • Bunun Apple LLM makalesiyle çelişmediği, LLM'lerin mevcut örnekler üzerinde yalnızca küçük varyasyonlar yapabildiğine inanıldığı ifade ediliyor
    • "akıl yürütme" teriminin kullanımından rahatsızlık duyulduğu, bunun LLM şirketlerinin teknolojiyi duygusal bir dille ifade etmek için ortaya attığı bir terim olduğu savunuluyor
    • Makinelere doğal dille talimat verebilme yeteneğinin büyük bir ilerleme olduğu vurgulanıyor
  • İnsanların sorunları adım adım çözmesi gerektiği, ancak o zaman sinir ağlarının bunu taklit edebileceği belirtiliyor

    • Kod eğitiminin beklenmedik faydaları açıklanıyor
  • LLM'lerin problem çözme yeteneği gösterdiği, ancak insanlarla kıyaslandığında akıl yürütme açısından bir fark olduğu belirtiliyor

    • LLM'leri yalnızca bir sonraki token tahmin edicisi olarak gören çok sayıda kullanıcı olduğu ifade ediliyor
  • Dil modellerinin akıl yürütme sorularını yanıtlarken çoğu zaman sınırlı bir belge kümesinden bilgi getirdiği açıklanıyor

    • Buna karşılık, soruyla soyut olarak ilişkili çeşitli belgelerden bilgi çekmenin daha genelleşmiş bir akıl yürütme stratejisi olması gerektiği öne sürülüyor
  • Google'ın ön eğitiminin çip tasarımında önemli rol oynadığı savunuluyor

    • Ön eğitim olmadan yapılan denemelerin mevcut teknoloji seviyesine ulaşamamasının doğal olduğu açıklanıyor
  • Üretilen görüntülerin neden kâbus gibi olduğunu soruyor ve daha fazla akıl yürütme eğitim verisine ihtiyaç olduğunu savunuyor

    • Matematiksel ispatların sentetik olmayan veride en kolay ulaşılabilir fırsat olabileceği belirtiliyor
  • AlphaGo ve AlphaZero karşılaştırması üzerinden, insanların prosedürel bilgisinin ML eğitimine yardımcı olduğunu ancak bunun sınırları olabileceğini açıklıyor

  • Öğrenci notları, sınavlar, kitap incelemeleri gibi içeriklerle eğitim verilirse LLM'lerin daha iyi hale gelebileceği öneriliyor ve bunun oldukça ilginç olacağı belirtiliyor