3 puan yazan GN⁺ 2025-02-10 | Henüz yorum yok. | WhatsApp'ta paylaş
  • Araştırmaya genel bakış

    • LIMO modeli, büyük dil modellerinde karmaşık akıl yürütme yeteneklerinin nasıl ortaya çıktığını yeniden anlamamızı sağlayan bir bulgu sunuyor.
    • Mevcut düşüncenin aksine, karmaşık matematiksel akıl yürütme az sayıda örnekle de etkili biçimde tetiklenebiliyor.
    • LIMO, yalnızca 817 eğitim örneğiyle AIME'de %57,1, MATH'ta %94,8 doğruluğa ulaşıyor.
    • Bu sonuç, önceki SFT tabanlı modellerin %6,5 ve %59,2'lik sonuçlarına kıyasla büyük bir iyileşme anlamına geliyor ve önceki yaklaşımların eğitim verisinin yalnızca %1'ini kullanıyor.
  • LIMO'nun performansı

    • LIMO, 10 farklı benchmark'ta mutlak olarak %40,5'lik performans artışı gösteriyor ve 100 kat daha fazla veriyle eğitilmiş modelleri geride bırakıyor.
    • Bu durum, SFT'nin ezberden çok genellemeye yol açtığına dair mevcut anlayışa meydan okuyor.
  • LIMO hipotezi

    • LIMO hipotezi, temel modelde alan bilgisinin ön eğitim sırasında tamamen kodlandığı durumlarda, karmaşık akıl yürütme yeteneklerinin çok az sayıda gösterimle de ortaya çıkabileceğini öne sürüyor.
    • Karmaşık akıl yürütmeyi tetikleyen eşik iki ana faktör tarafından belirleniyor:
      1. Ön eğitim sırasında modelin kodlanmış bilgi tabanının ne kadar eksiksiz olduğu.
      2. Modelin karmaşık akıl yürütme görevlerini çözmek için bilgi tabanını nasıl kullanacağını gösteren bir "bilişsel şablon" olarak sonradan eğitim örneklerinin etkililiği.
  • Açık kaynak olarak sunulması

    • Veri açısından verimli akıl yürütmeye ilişkin yeniden üretilebilirliği ve gelecekteki araştırmaları teşvik etmek için LIMO, kapsamlı bir açık kaynak paketi olarak sunuluyor.

Henüz yorum yok.

Henüz yorum yok.