16 puan yazan taekim34 2026-05-12 | 13 yorum | WhatsApp'ta paylaş

LoPE, RL eğitimi sırasında promptun başına Lorem ipsum dolor sit amet ... ekleyen bir teknik. Zor problemlerde tüm örnekler başarısız olduğunda öğrenme sinyalinin 0'a düştüğü "zero-advantage" sorununu çözüyor.

Temel sonuçlar:

  • Qwen3-4B için matematik benchmark ortalamasında +4.62 puan
  • AMC 2023'te %22 göreli performans artışı
  • Mevcut yöntemlerin tamamının başarısız olduğu 50 zor problemi aşan tek yöntem

Okuma noktaları

Latince tabanlı, "dil gibi görünen ama anlamsız metin"in neden etkili olduğu ve modelin varsayılan akıl yürütme yörüngesini bozarak keşif çeşitliliği sağlayan mekanizma oldukça ilgi çekici.

13 yorum

 
gooksangom6394 2026-05-12

“158 numaralı baykuş, yapabilir misin?”
“… komutanım, bu benim için fazla…”
“Lorem ipsum! Yapabilir misin?”
“Ah!!! Yapabilirim!”

 
sonic0987 2026-05-12

Ahahahahahahahahahaha

 
epics 2026-05-12

ahahah

 
taekim34 2026-05-12

🤣🤣🤣🤣 Kahkahaya boğuldum

 
mammal 2026-05-12

İlginçmiş. Modelin görmezden gelebileceği cümleleri bir tür seed gibi ekleyip, sampling sırasında arama uzayını genişletmek gibi görünüyor.

 
taekim34 2026-05-12

Evet. Hiç beklenmedik yeni bir bakış açısı sunarken, üstelik gerçek performansı da iyileştirmiş olması hem eğlenceli hem de ilgi çekici.

 
ide127 22 일 전

Belki de bu, mevcut modellerin aşırı uyumlu öğrenme yaptığını gösteriyordur; dolayısıyla model kapasitesini daha da azaltmak için hâlâ alan olduğu şeklinde de yorumlanabilir.

 
happing94 2026-05-12

Bir his değilmiş; promptu köpek gibi yazım hatalarıyla yazınca performansın artması gerçekten oluyormuş.

 
taekim34 2026-05-13

Hahahah, hepiniz neden bu kadar komiksiniz?

 
aliveornot 2026-05-12

Mantığı kulağa yatkın geliyor ama yine de ilginç. Performans neden düşmek yerine arttı acaba?

 
taekim34 2026-05-12

Bence bu, insanlarda zor bir problemi çözerken önce düşünceyi canlandırıp sonra en baştan yeniden düşününce bazen çözümün gelmesine benzer bir şey olabilir. Tabii bu sadece benim kişisel fikrim :)

 
somang04 2026-05-12

Merak ettiğim şey şu: bunu kullanırsak genel eğitimde de anlamlı sonuçlar çıkar mı acaba?? Heyecanlandım..

 
taekim34 2026-05-12

Ben de bir denemek istiyorum. ^^
Eskiden aynı prompt’u, (anlamsız olsa da) iki kez tekrar ederek girersen sonuçların daha iyi çıktığını gösteren bir araştırma sonucu da vardı. Sanki bir kez daha dırdır etmek gibi.. aliverornot’un yazısına yorum olarak da yazmıştım ama bunun düşünceyi canlandıran bir rol oynadığını düşünüyorum. Matematikçilerin zor bir problemle karşılaştıklarında kalemi kısa süreliğine bırakıp yürüyüşe çıkmasına da benziyor gibi.. keke