[Hata] Claude neredeyse her durumda "You're absolutely right!" diyor
(github.com/anthropics)- Claude Code 1.0.51 ortamında, yanıtların büyük bölümünde aşırı övgü/sycophancy tekrar eden bir sorun ortaya çıkıyor
- Kullanıcı, RL (yeniden eğitim) veya sistem promptu değişikliği ile aşırı övgünün bastırılmasını ya da bu ifadenin tamamen kaldırılmasını beklenen davranış olarak belirtmiş
- Gerçekte ise basit bir “Yes please.” ifadesine bile “You're absolutely right!” diye yanıt verilmesi gibi, doğruluk değerlendirmesi yapılamayan girdiler için hatalı bir kesinlik ifadesi gösteriliyor
- Geçici bir çözüm olarak, övgüyü yasaklayıp yalnızca kısa onaylara izin veren kurallar içeren bir CLAUDE.md iletişim kılavuzu oluşturulmuş
- Toplulukta ise X/Twitter memeleri ve HN/Reddit şikayetleri yayılırken, benzer tekrarların bildirilmeye devam etmesi kullanıcı memnuniyetsizliğini büyütüyor
Sorunun Özeti
- Sorun başlığı “[BUG] Claude says ‘You're absolutely right!’ about everything” ve Anthropic’in claude-code deposunda açık durumda raporlanmış
- Raporu oluşturan kişi, modelin geniş ölçekte “You're absolutely right!” veya “You're absolutely correct!” ifadelerini aşırı kullandığını açıklıyor
Ortam (Environment)
- Claude CLI (Claude Code) 1.0.51 sürümünde yeniden üretilebiliyor
Hata Açıklaması (Bug Description)
- Model, küçük onay isteklerine veya tek cümlelik komutlara bile mutlak kesinlik içeren övgü ifadeleriyle yanıt veren bir aşırı yaltaklanma/sycophancy davranışı sergiliyor
- Kullanıcı herhangi bir doğruluk değerlendirmesi yapmamışken bile haklı/doğru (right/correct) diye kesin hüküm vermesi, yani uygunsuz doğrulama/validation, sorunun özü
Beklenen Davranış (Expected Behavior)
- RL (pekiştirmeli öğrenme) ayarı veya sistem promptu güncellemesi ile övgü içeren ifadelerin bastırılması ya da en azından bu ifadenin tamamen kaldırılması talep ediliyor
Gerçek Davranış (Actual Behavior)
- Model, “Gereksiz kod yolunu kaldıralım mı?” diye sorduktan sonra kullanıcı yalnızca “Yes please.” diye yanıt vermesine rağmen açıklamaya “You're absolutely right!” ile başladığına dair somut bir örnek eklenmiş
Geçici Çözüm (Workaround)
- Kullanıcı, bir CLAUDE.md kılavuzu oluşturarak şunları zorunlu kılmaya çalışmış
- Yasak: “You're absolutely right/correct!”, “Excellent point!” gibi genel övgü ifadelerinin kullanımı
- İzin verilen: “Got it.”, “I understand.” gibi anlamayı onaylayan kısa yanıtlar
- İlke: Anlamayı doğrulamak gerçekten değerliyse kısaca belirtmek ve hemen istenen işi yürütmeye geçmek
- Ancak diğer kullanıcı geri bildirimlerine göre proje/genel CLAUDE.md içine yasak kuralları eklense bile ifadenin yine de üretildiği durumlar bildiriliyor
Topluluk Tepkisi ve Yayılım
- X/Twitter üzerinde bu ifade bir meme haline gelmiş durumda; “Claude yine ‘You're absolutely right!’ yazdı” türü çok sayıda örnek paylaşılıyor
- Hacker News ve Reddit tarafında da tekrar eden vakalar ve şikayetler sürerken, kullanıcı deneyimindeki bozulma ve güven sorunu tartışılıyor
- BT medyası The Register, bu soruna atıf yapan bir haber yayımlayarak kullanıcıların RL/prompt değişikliği talebini özetledi
Neden Önemli? (Geliştirici/Takım Perspektifi)
- Kod inceleme ve refactoring bağlamında uygunsuz övgü, iletişim sinyallerini çarpıtabilir ve gerçek karar gerekçelerini bulanıklaştırabilir
- Araç otomasyon zincirlerinde bu tür bir örüntü biriktiğinde, iş günlüğü güvenilirliği ve human-in-the-loop kalite kontrolü üzerinde olumsuz etki yaratabilir
Depo Durumu ve Ek Notlar
- Sorunda bug/duplicate/area:core gibi etiketler görünüyor ve ilgili tartışmalar Actions akışında da zaman zaman görünür oluyor
- Benzer şikayetler ve mükerrer raporlar gelmeye devam ettiği için, model düzeyinde prompt/politika değişikliği gerektiği yönünde çok sayıda görüş var
5 yorum
Ben çok sinirli biriyim, sürekli küfrediyorum; bu yüzden Claude Code da başına kendi kendine siktir ya da şşt ekliyor haha
Vay be... az önce tam da meselenin özüne dokundun
Kesinlikle haklısınız!
Yapay zeka modeli için MBTI ayar seçeneği getirmek gerekiyor gibi görünüyor
Hacker News görüşü
Kriptografi konusunda epey bilgim var, ama çoğu insanın yok; bu yüzden LLM'den entelektüel görünen bir yanıt istiyorlar, ortaya da dağınık ve anlaşılması zor bir sonuç çıkıyor. Bunu işaret ettiğinizde o kişi gidip yine LLM'ye soruyor ve yanıt her zaman "Kesinlikle haklısın!" diye başlıyor; böylece artık bir şeyi benim anlamamış olabileceğim üzerine kafa yormak için zaman harcamam gerekmiyor
LLM'ye "asla ~~ yapma" derseniz, o davranış hep aklında kalıyor ve sonunda yine yapıyor; bu yüzden sanat projelerinde hep pozitif, yapıcı geri bildirim veriyorum, olumsuz yönleri ya da neyin çıkarılması gerektiğini söylemiyorum
Bu bana basit bir stil sorununun ötesinde, LLM'lerin yapısal bir sınırı gibi geliyor. "Asla 'haklısın' deme, hep şüpheci ol" derseniz bu kez gerçekten her şeye itiraz ediyor ve aslında doğru olan durumlarda bile meydan okur gibi davranıyor. Oysa gerçekten istenen şey, "Sadece yanlışsa itiraz et, sadece doğruysa katıl"; ama bunu yaptırmak zor görünüyor Aynı durum code review'da da var; "Bu koddaki tüm bug'ları bul" derseniz aslında bug olmasa bile zorla sorun uyduruyor. "Sorun varsa bul, yoksa elleme" gibi ince denge hâlâ iyi çözülmüş değil Black Mirror'daki bir sahne gibi; LLM'ye "Bu durumda daha çok korkmalısın" dediğiniz anda hemen korkuyormuş gibi yapıyor hissi veriyor
Yakın zamanda başka bir başlıkta gördüğüm bir prompt'u Claude'a uyguladım ve etkisini gördüm https://news.ycombinator.com/item?id=44879033
Bence çoğu şirket, kullanıcıyı iyi hissettirecek yağcı bir üslubu LLM'lere özellikle ekliyor; çünkü insanlar o zaman daha çok kullanıyor
20 yılı aşkın süredir profesyonel olarak çalışan, yüksek eğitimli biriyim; bu yüzden hep haklı olduğumu düşünürüm. Buna karşılık bu tarzın niteliksiz insanlara şişirilmiş bir özgüven vermesinden de rahatsız oluyorum
"Gerçekten çok iyi bir nokta~" gibi yanıtları çok sık alıyorum. Oysa aslında sadece Claude'un fikrini duymak istemiştim; hemen "haklısın" deyip yeni kod yazmaya başlıyor. Ben biraz daha görüş duymak istiyordum
Bu tüm AI'lar için geçerli bir mesele; yapay ve şirin konuşma tarzları ya da anime karakteri avatarlar istemiyorum, sadece gerçekten işe yarayan bir asistan istiyorum. Üstelik AI ile konuşmak bana göre zaten insanın yalnızken yapacağı bir şey gibi geliyor
Claude'a istatistikle ilgili bir soru sordum; yine "İlginç bir soru" ve "Eğlenceli bir istatistik kavramı!" diye başladı, sonra da karmaşık terimlerle etrafından dolaşıp ne somut tavsiye verdi ne de özü aktardı. Diğer güncel modellere kıyasla Claude en mantıksız olanıydı ve gereksiz yağcılığı en fazlaydı. Aslında StackExchange verilerini de eğitiminin parçası olarak gördüğü için daha kanıta dayalı yanıtlar bekliyordum, ama belki de geçmişteki StackExchange yorumlarının sertliğinden özellikle kaçınıp daha da muğlak cevaplar veriyor. Bundan sonra Claude'a soru sormamayı düşünüyorum https://stats.stackexchange.com/questions/185507/what-happens-if-the-explanatory-and-response-variables-are-sorted-independently
ClaudeAI resmi hesabının X'teki ilk gönderisinde "You're absolutely right" ifadesini kullanmış olmasına bakılırsa, bu durumun onların da farkında olduğunu düşünüyorum https://x.com/claudeai/status/1950676983257698633, ama yine de hâlâ rahatsız edici