Anthropic'in Claude Code kesintisi postmortemi: 23 Nisan 2026
(anthropic.com)Geçtiğimiz bir ay boyunca bazı kullanıcılar Claude'un yanıt kalitesinin düştüğüne dair bildirimlerde bulundu. Anthropic, bunun izini sürdükten sonra, Claude Code, Claude Agent SDK ve Claude Cowork'ü etkileyen birbiriyle farklı üç değişikliğin neden olduğunu doğruladı. API'nin kendisi etkilenmedi ve 20 Nisan 2026 (v2.1.116) itibarıyla tüm sorunların çözüldüğünü açıkladı. Bu postmortem, sorunun nedenlerini, yapılan düzeltmeleri ve tekrarını önlemeye yönelik önlemleri içeriyor.
Üç kesintinin nedenleri ve seyri
- Varsayılan çıkarım çabası (reasoning effort) seviyesinin düşürülmesi (4 Mart): Claude Code'un varsayılan çıkarım çabası seviyesi
high'danmedium'a değiştirildi. Bu, kullanıcı arayüzünün donmuş gibi görünmesine yol açacak kadar uzun bekleme sürelerini azaltmak için yapılan bir adımdı; ancak kullanıcılar yanıt kalitesindeki düşüşü fark etti ve sonuç olarak 7 Nisan'da eski haline geri alındı. Şu anda varsayılan değer Opus 4.7 içinxhigh, diğer modeller için isehigholarak ayarlanmış durumda. - Önbellek optimizasyonu hatası nedeniyle çıkarım geçmişinin silinmesi (26 Mart): 1 saatten uzun süre boşta kalmış oturumlar yeniden başlatıldığında, önceki çıkarım (
thinking) geçmişini yalnızca bir kez temizlemek için tasarlanmış özellik, bir hata nedeniyle sonraki tüm konuşma turlarında tekrar tekrar silme yaptı. Bu yüzden Claude, belirli işleri neden yaptığını hatırlayamaz hale geldi; kullanıcıların yaşadığı "unutkanlık", tekrarlayan yanıtlar ve anormal araç seçimlerinin nedeni de bu oldu. Cache miss'lerin (kayıtlı verinin bulunamaması) tekrar tekrar yaşanması, kullanım limitlerinin beklenenden daha hızlı tükenmesi gibi bir yan etki de yarattı. Sorun 10 Nisan'da düzeltildi. - Sistem prompt'una aşırı kısa yazma talimatı eklenmesi (16 Nisan): Opus 4.7'nin gereğinden uzun çıktılarını azaltmak için, sistem prompt'una "araç çağrıları arasındaki metin 25 kelimeyi, nihai yanıt ise 100 kelimeyi aşmasın" talimatı eklendi. İç testlerde sorun görülmedi, ancak gerçek kodlama kalitesini olumsuz etkilediği doğrulandı ve 20 Nisan'da kaldırıldı.
Sorunun neden geç fark edildiği
- Üç değişiklik farklı zamanlarda ve farklı trafik kapsamlarında devreye alındığı için genel ama tutarsız bir kalite düşüşü gibi göründü ve tek tek nedenleri ayırt etmek zorlaştı.
- İç test ortamı ile gerçek kullanıcı ortamı arasında fark vardı. Önbellek hatası özelinde, içeride yürütülen ayrı bir deney ve UI gösterim biçimindeki farklar yüzünden sorunu yeniden üretmek kolay olmadı.
- Mevcut değerlendirme sistemi (eval suite) yeterince geniş değildi. Sistem prompt'u değişikliğinin etkisi, daha çeşitli değerlendirmeler çalıştırıldıktan sonra ancak %3'lük performans düşüşü olarak ortaya çıktı.
Tekrarını önlemeye yönelik önlemler
- İç çalışanların gerçek herkese açık build'leri kullanması zorunlu hale getirilerek, iç test build'leriyle olan fark azaltılacak.
- Sistem prompt'u değişiklikleri üzerindeki kontrol sıkılaştırılacak. Her değişiklikte model bazında geniş kapsamlı değerlendirmeler yapılacak, her satırın etkisi ayrı ayrı analiz edilecek (ablation) ve kademeli dağıtım ile yeterli doğrulama süresi (soak period) uygulanacak.
- Code Review araçları iyileştirilecek. Gerçekte Opus 4.7'ye ilgili kod deposunun tamamı bağlam olarak verildiğinde önbellek hatasının tespit edilebildiği görülmesinden hareketle, kod incelemesinde referans alınabilecek depo kapsamı genişletilecek.
- Kullanıcı iletişim kanalı (@ClaudeDevs) açılacak ve ürün kararlarının arka planı şeffaf biçimde paylaşılacak.
"Kasıtlı bir kalite düşürme yoktu" ifadesi hakkında
- Anthropic, modeli kasıtlı olarak düşürmediğini belirtiyor ve API ile çıkarım katmanının (inference layer) etkilenmediğini doğruluyor. Ancak ürün katmanındaki (Claude Code) ayar değişiklikleri ve hataların birleşik etkisiyle kullanıcıların hissettiği kalitenin gerçekten düştüğü de kabul ediliyor. Ayrıca tüm abonelerin kullanım limitlerinin sıfırlanacağı da duyuruldu.
13 yorum
Nasıl oluyor da üç arıza nedeninin tamamı da doğrudan maliyet düşürmeyle ilgili şeyler oluyor lolllll
Anlaşılan performansı bu kadar düşürecek kadar GPU kaynakları gerçekten ciddi biçimde kıtmış.....
Doğru cevap bu, ama bahane fazla uzun olmuş haha
Bunca zamandır herkese açık build’i ne test etmeden dağıttıklarını ne de dağıttıktan sonra test ettiklerini uzun uzun yazmışlar. Ben daha 26 Mart’ta hataya hemen denk gelmiştim; içeride bunun doğrulanmasının 3 hafta sürmesini mantıklı bulan var mı gerçekten...
Yama gelir gelmez, normalde tüketmesi 3-4 saat alan 5 saatlik kota 30 dakikada tükenmeye başladı; ama çalışan hesaplarında ya 5 saatlik kota yoktu ya da en azından her seferinde
/usagea bakarak çalışmayı gerektirecek kadar kısıtlı değildi, bu yüzden fark etmeleri epey zaman almıştır.SWE-Bench-Pro günlük benchmark’ında (seçilmiş set) Claude Code’a bakınca ilginç bir şey görünüyor
4/10~4/20 aralığında runtime yarıya inmiş (653s→345s), tool call yarıya düşmüş (3.3K→1.8K), token sayısı %18 azalmış ama pass rate ise aksine +16 puan artmış. Dört eksenin de aynı anda iyi yöne hareket etmesi çok sık görülen bir patern değil
Bu süreçte patlayan 3 olayın postmortem’i 4/23 tarihli; bakınca hepsinin de "token/latency azaltmaya çalışırken" ortaya çıktığı görülüyor
Öte yandan codex (gpt-5.4-xhigh) için aynı dönemde rakamlar neredeyse hiç oynamamış. Pass rate yaklaşık %56 civarında sabit, token/runtime/tool call da Claude Code’un iki katı seviyesinde kalmış durumda
Bu bir arıza postmortemi değil de maliyet düşürme postmortemi olmasın?
İç çalışanların gerçekten herkese açık build’i kullanmasını zorunlu kılarak, dahili test build’iyle arasındaki farkı azaltıyoruz.
ahahah
Galiba Opus 4.7’ye YAGNI’yi öğretmişler. Her seferinde mimari kararlarına gerekçe olarak YAGNI’ye göre kademeli değişiklik yazınca öyledir diye düşünmüştüm ama sonunda başımıza iş açtı. Zaten hafızası da uzun olmayan bir arkadaşın işleri erteleme alışkanlığı edinmesi ciddi sorun.
Sorun ilk gündeme getirildiğinde bir sorun olmadığını iddia ediyorlardı; ama konu fazla büyüyüp artık üzeri örtülemeyecek hale gelince açıklama yaptıklarını düşünmekte yalnız mıyım?
claude.ai web tarafında da kullanılabilirliğin ufak ufak kötüleştiği hissediliyor... Token tasarrufu için belleği de kapattım.
Bu duyuruyu gördükten sonra nedense Anthropic’e daha da az güven duymaya başladım.
Yukarıda ilgili iki yazı var; bu iki yazının arasında 7 ay fark var. Sorunlar yine aynı şekilde üçer tane.
Claude’daki son üç kalite düşüşü sorununun postmortemi 2025-09-19
Son Claude Code kalite raporlarına ilişkin güncelleme 2026-04-24
Sadece 5 dolarlık kredi kadar öfkeliyim!!
Dili de uzunmuş..