- Claude Code issue #74066’te, bir Enterprise ZDR workspace kullanıcısı kendi işiyle ilgisiz Minecraft temple yanıtlarının oturuma karıştığını bildirerek workspace önbellek izolasyonu ve tüketici planları arasında sızıntı ihtimalini gündeme getirdi
- Bildirimin yapıldığı ortam macOS(darwin), Apple_Terminal ve Claude Code 2.1.199; kullanıcı gerçek çalışma dizini ile başlatma dizininin farklı olduğu sıra dışı bir kurulum kullandığını ve
/compact sonrasında başlatma dizinindeki projeye dokunan ayrı bir karışıklık da yaşandığını belirtti
- Bir yorum,
~/.claude/projects/<encoded-cwd>/<session-id>.jsonl içindeki yerel transcript dosyalarında grep ile arama yapılarak önce bunun yerel bağlam kirlenmesi mi yoksa sunucu taraflı bir sızıntı mı olduğunun ayırt edilmesini önerdi; bildirimi yapan kişi, Minecraft ile ilgili yerel eşleşmelerin mevcut oturum günlüğü ve minecraft.py yolu dışında bulunmadığını söyledi
- Daha sonra aynı Enterprise hesabına ait Claude Mobile oturumunda da alakasız 3-panel abstract print içeriğinin karıştığı görüldü; ortak noktalar olarak Sonnet 5, 5 dakikadan uzun süreden sonra gelen ilk yanıt ve önbellek kaçırması belirtildi, ayrıca
/feedback gönderilip iç eskalasyon yapıldığı ifade edildi
- Diğer katılımcılar benzer Claude Code, API ve ofis içi Claude kullanım deneyimlerini paylaştı; ancak bazıları bunun halüsinasyon olabileceğini veya sadece Claude Code’a özgü bir sorun olmayabileceğini öne sürdü ve issue sayfasında Anthropic’in nihai kök neden analizi ya da çözüm sonucu yer almıyor
Bildirilen durum
- Claude Code issue #74066, Enterprise ZDR workspace içinde kimliği doğrulanmış bir oturumda ajanının aniden “Minecraft temple” yaptığını söylemesi vakasını ele alıyor
- Kullanıcı, ajanın hangi tür tuğla istediğini sorduğunu ve özet bölümünde de Minecraft temple yaptığını kendinden emin şekilde söylediğini yazdı
- Sorun iki ihtimal üzerinden ele alınıyor
- Aynı workspace içindeki bir çalışma arkadaşının oturumu ya da önbelleğinin karışmış olması
- Bir tüketici planından gelen içeriğin Enterprise ZDR oturumuna karışmış olması
- Bildirilen ortam bilgileri
- Platform:
darwin
- Terminal:
Apple_Terminal
- Sürüm:
2.1.199
- Feedback ID:
f336f5d2-3992-4a04-9e1f-ec30f006f75e
Başlatma dizini ile çalışma dizini karışıklığı
- Kullanıcı, oturumu gerçek çalışmasıyla ilgisiz bir dizinden başlattı
- Çünkü gerekli bağlamı içeren
.claude dizini oradaydı
- Asıl çalışma başka bir dizinde yapılıyordu
/compact sonrasında ajanın kullanıcının talimatlarını unutup başlatma dizinindeki projede çalışmaya başladığı bir durum yaşandı
- Kullanıcı, bu dizin karışıklığının kendi kurulumundan kaynaklanmış göründüğünü, ancak Minecraft ile ilgili prompt karışmasıyla aynı şey olmadığını özellikle ayırıyor
Yerel transcript kontrolü önerisi
- Bir katılımcı önce “Minecraft temple” metninin yerel oturum dosyalarında bulunup bulunmadığının kontrol edilmesi gerektiğini önerdi
- Claude Code CLI’ın gönderdiği ve aldığı içeriklerin oturum bazlı transcript olarak
~/.claude/projects/<encoded-cwd>/<session-id>.jsonl altında saklandığını açıkladı
- Önerilen kontrol komutu şöyleydi
grep -rli 'minecraft\|temple\|brick' ~/.claude/projects/ 2>/dev/null
- Sonucun yorumu ikiye ayrılıyor
- Eğer dosya eşleşirse, metin yerelde bulunuyor demektir ve bu yerel context/transcript bleed olabilir
- Yerelde eşleşme yoksa, bu makinede hiç gönderilip alınmamış bir metin olduğu için model ya da sunucu taraflı bir sorun düşünülebilir
- Başka bir oturumdan gelen yerel karışıklık olup olmadığını görmek için şu komut da önerildi
grep -rli minecraft ~/.claude/projects/ | while read f; do
printf '%s %s\n' "$(grep -m1 -o '"cwd":"[^"]*"' "$f")" "$f"; done
- Öneriyi yapan kişi, launch cwd’nin transcript saklama konumu ve bağlam anahtarı rolü gördüğünü; bu yüzden ilgisiz bir dizinden başlatıp
/compact kullanmanın dizin karışıklığı yaratabileceğini düşündü
- Ancak bu mekanizmanın yalnızca dizin karışıklığını açıklayabileceğini, kullanıcının hiç yazmadığı Minecraft prompt içeriğinin kendisini açıklamadığını da özellikle belirtti
Bildirimi yapan kişinin ek kontrol sonuçları
- Kullanıcı, yerel arama sonucunda ilgili eşleşmelerin yalnızca mevcut oturum günlüğünde sızıntı gibi görünen ilk nokta ve sonrasında modelle yapılan konuşmada bulunduğunu söyledi
minecraft için Python sanal ortamındaki dosya listesinde geçen Pygments lexer yolu minecraft.py bir kez görünmüştü
temple ya da bricks ise o kelime sınırlarında veya Minecraft ile ilgili bir bağlamda eşleşmedi
Databricks
bricked by an over-eager click
verdictSignalsLabel içindeki alt dizge gibi alakasız eşleşmeler olduğunu belirtti
- Kullanıcı
/feedback gönderdiğini ve bunu içeride de eskale ettiğini söyledi
Claude Mobile’daki benzer vaka
- Aynı kullanıcı, aynı Enterprise hesabına ait Claude Mobile oturumunda da aynı türden bir durum yaşandığını ekledi
- Ortak noktalar olarak şunları sıraladı
- Sonnet 5
- 5 dakikadan uzun bir aradan sonraki ilk yanıt
- Önbellek kaçırması durumu
- E-posta ekindeki görsel yüklenemeyince OCR içeriğini yorum olarak paylaştı
- Kullanıcı CSV dosyalarını bir klasörde topladığını ve Google Drive klasör bağlantısını vererek yardım istediğini söyledi
- Claude ise duvarın gerçek ölçülerine göre hazırlanmış 3-panel abstract print set mockup’ı ve sanatçı/mağaza araştırması gibi istekle ilgisiz şeylerden söz etti
- Ardından “Detecting injection attempt, proceeding...” diyerek bu içeriği bir injection girişimi gibi ele aldı
- Görünen düşünce sürecinde, kullanıcının CSV isteğiyle ilgisiz duvar ölçüleri ve art print ile ilgili bir bloğun araya karıştığını fark ettiği ve Drive klasör ID’sini çıkarıp CSV dosyalarını işlemeye çalıştığı yer alıyordu
Diğer katılımcıların örnekleri ve tepkileri
- Bir katılımcı, önceki hafta Sonnet 5 tabanlı Claude Code’da araç sonuçlarının ortasına gerçekte çağrılan araçtan gelmeyen içeriklerin karıştığını yazdı
- Manipüle edilmiş “MCP servers need auth” bildirimi
- Başka bir
CLAUDE.md dökümü
- Sahte “Plan mode is active” talimatı bulunduğunu söyledi
- Başka bir katılımcı, Claude’un arkadaşının yaşadığı yerin yakınındaki mağazalardan söz ettiğini ve o arkadaşının da aynı ofiste Claude kullandığını yazdı
- Bir diğer katılımcı, 2025’te API token kullanırken başka bir ajanın aracının aniden belirmiş gibi göründüğünü, o sırada bunu halüsinasyon sayıp derinlemesine incelemediğini belirtti
- Bir yorum, ilgili bir Claude incident yazısına bağlantı vererek ilk başta başka kullanıcıların verilerinin görüldüğünün düşünüldüğünü, ancak Anthropic’in sonradan bunun yanlışlıkla açığa çıkan iç agent context’i olduğunu söylediğini aktardı
- Bazı yorumlar ise bu durumun bir halüsinasyon gibi göründüğünü veya yalnızca Claude Code’a özgü olmayabileceğini savundu
Mevcut durum ve kalan sorular
- Issue sayfada Open durumda ve metinde nihai kök neden analizi ya da düzeltmenin tamamlandığına dair bilgi yok
- Temel soru, alakasız metnin nereden geldiği
- Yerel transcript veya launch cwd tabanlı bağlam karışıklığı
- Model ya da sunucu taraflı oturum durumu sorunu
- İç agent context’inin yanlışlıkla açığa çıkması
- Genel bir halüsinasyon
- Kullanıcının yerel arama sonuçları, Minecraft temple ve bricks ile ilgili içeriğin mevcut yerel oturumlarda önceden bulunmadığı yönünü gösteriyor; ancak herkese açık issue içinde Anthropic’in resmî bir kararı yer almıyor
1 yorum
Hacker News yorumları
Birden fazla sağlayıcının LLM’lerini kullanan tarafta işin epey içindeyim; aradaki altyapının yanıtları birbirinin yerine geçirdiği en az iki vaka biliyorum.
Biri Claude modellerini, biri GPT modellerini etkiledi ve farklı sağlayıcılardı.
Bunlardan biri düzgün bir olay sonrası analiz verdi: API geçidi HTTP 100 durum kodunu hatalı işleyip hata durumuna girince fiilen bir off-by-one hatası oluşmuş; ben, isteğimden hemen önceki prompt’un yanıtını alıyordum, benim yanıtım da bir sonraki çağırana gidiyordu.
Diğeri kök nedeni açıklamadı; sadece bunun bir daha olmayacağına inanmamız söylendi.
İkisi de piyasa değeri 1 trilyon doların üzerinde olan şirketlerdi.
Bu durumda yanıt aktarım sırasında değiştiği için ZDR’nin kendisi bozulmuş sayılmazdı, ama bunun benzer bir sorun olabileceğini düşünüyorum. Mesele verinin saklanması değil, aracı altyapıda güvenli biçimde yalıtılmaması olabilir.
İstemcilerin başka istemcilerin yanıtlarını gözetlemek için bunu kasıtlı kullandığı da sık görülür.
Birden çok istemcinin isteklerini tek bir upstream bağlantı üzerinde çoğulladığınız her durumda zafiyet olasılığı vardır; çünkü göründüğünün aksine HTTP çok karmaşıktır ve isteklerle yanıtları upstream tarafında güvenilir biçimde eşleştirmek zordur.
Örneğin birden fazla Content-Length başlığı olması, Content-Length ile chunked encoding’in karıştırılması ya da gerçek gövde uzunluğuyla uyuşmayan bir HTTP/2 Content-Length başlığının iletilmesi bazı sistemlerde eşzamansızlaşmayı tetikleyebilir.
Bu konuyla ilgili bir DEF CON sunumu var: https://www.youtube.com/watch?v=w-eJM2Pc0KI
Aynı saldırı, mesaj sonu ayırıcılarının çevresindeki satır sonlarını bozarak SMTP’ye de uygulandı; orada buna SMTP smuggling deniyor. Başka protokollere de uygulanabilir.
Örneğin PHI ile çalışıyorsanız, Claude hiçbir şeyi saklamamış olsa bile yanıt sızıntısı HIPAA ihlali olabilir; zaten amaç HIPAA uyumluluğuyduysa bunu nasıl değerlendirmek gerektiğini merak ediyorum.
Olumlu ahlaki değer iddiaları bile ancak zar zor makul görünen aktörlerden gelen her yeni davranış erken, sık sık raporlanmalı, tartışılmalı, didiklenmeli ve eleştirilmelidir.
AGENTS.md’ye sadece “açıkça istenmedikçe Minecraft hakkında asla konuşma” satırını eklersek düzelecek gibi.
Kanıtlanana kadar kulağa halüsinasyon gibi geliyor. Önde gelen LLM’ler de bazen böyle şeyler yapıyor ve her zaman inandırıcı görünüyor.
Oturumda önceki bağlamdan çok büyük miktarda, örneğin 800 bin token’dan fazla bulunmuş olabilir; böyle bir durumda halüsinasyon olasılığının arttığını düşünüyorum.
Orijinal gönderi yazarının ilgili yorumu da halüsinasyon olasılığını artırıyor: Python sanal ortamındaki dosya listesini yazdıran araç çağrısı sonucunda
minecraft.pyyol dizgesi yer alıyormuş ve Pygments paketindeminecraft.pyadlı bir lexer varmış.Halüsinasyon çoğunlukla makul ama yanlış bir cevap ya da uydurulmuş alıntılar gibi en olası yanıta uydurulmuş sahte bilgidir ve LLM’in token tahmin etme biçiminden doğar. Bu vakadaki çıktı ise hiç makul değil; bu yüzden halüsinasyonla pek örtüşmüyor.
Bu, mutlaka oturumlar arası sızıntı olmak zorunda da değil; eğitim verisi olabilir ya da boş prompt verildiğinde konuşma üreten Magpie tarzı veri üretimi gibi bir şey olabilir.
Önbellekle ilgili alt yorumlara bakınca, önbellek yerine hiçbir şey yükleyemeyip rastgele üretim döndüren bir hata olma ihtimali de var gibi görünüyor.
Düzeltme: yeni adı magpie’ymiş. LLM’in bomboş bir prompt’tan rastgele konuşmalar üretmesi fikri bakmaya değer ve en az oturum sızıntısı kadar olası görünüyor: https://github.com/magpie-align/magpie
Aynı Enterprise hesabındaki Claude Mobile oturumunda da aynı şey olmuş; ortak noktalar Sonnet 5 ve 5 dakikadan fazla süre geçtikten sonraki ilk yanıt, yani cache miss imiş.
Şeffaflık o kadar eksik ki, sızıntı olmadığını inkâr etseler bile kesin olarak bilememek üzücü.
LLM’leri yeterince kullandıysanız, tüm modellerin bazen bir anda bambaşka bir dilde saçmalıklar döktürdüğünü görmüşsünüzdür. Belirli bir oranda tamamen tuhaflaşabiliyorlar.
Son birkaç gündür bunu Gemini’de de görüyorum.
Oldukça büyük girdi verdiğim prompt’larda sık sık başkasına aitmiş gibi görünen yanıtlar geliyor. Tetiklenmiş halüsinasyon olabilir, ama önbellek çakışması ya da başka bir sorun gibi de görünüyor.
Kişisel bilginin sızdığına dair kanıt görmedim; ama bir konuyu araştırırken birden matematik özel ders cevabı gibi görünen bir şey almak insanı huzursuz ediyor.
Şu anda arka planda büyük bir güvenlik olayı yaşanıyor olabilir diye düşünüyorum.
Yapay zekadan meta ayrıştırma grameri yazımında yardımcı olmasını sağladığım bir iş üzerinde çalışıyordum; neyse ki çoğunu henüz yayımlamadım.
Yeni nesil modellerin, özellikle nereye bakacağını bilirseniz, temel zafiyet tespiti ve istismarı konusunda büyük bir sıçrama yarattığı kesin. Benim ayrıştırma araçlarımda bile şimdiden birkaç hata ve en az bir exploit buldu; modern teknoloji ekosisteminin tamamında hâlâ ne kadar çok şey kalmış olabileceğini hayal etmek zor.
Çoğu zaman başka bir dilde de çıkıyor.
Yanıt verdiği zaman böyle; yoksa sadece 1099 hata kodu döndürüyor.
Claude Code ekibinden Thariq
Ayrıntılı rapor için teşekkürler; bunun bir halüsinasyon olduğundan eminim ama elbette bu tür raporları ciddiye alıyoruz ve ekip olarak araştırıyoruz. Bir şey çıkarsa tekrar haber vereceğim
Şu anda
.claudeklasörüne girip proje klasörü adı gibi şeyleri değiştirince bazen belleği düzgün yükleyemiyor. İçe/dışa aktarmayı daha kolay yapabilmek iyi olurduSeçenekler ikiden biri mi? Bu şaşırtıcı teknoloji Minecraft’ı rastgele ortaya çıkaracak kadar aptal ya da ortada ciddi bir güvenlik sorunu mu var?
minecraft.pyvardı ve oturum bağlamı da çok uzunduUzun bağlamlı LLM oturumlarının bazen yoldan sapması nadir değil. Tüm LLM etkileşimlerinde mutlak kusursuzluk bekleyenler bunu teknolojinin tamamına yönelik kapsamlı bir mahkûmiyet olarak görüyor; ama her gün kullananlar çıktının kısmen olasılıksal olduğunu kabul ediyor ve model sunsa bile aşırı uzun bağlamlardan kaçınmayı öğreniyor
Stratejik olarak sıkıştırmak ya da sonraki adımları özetleyip yeni bir oturuma aktarmak daha iyi. Alt oturumlar kullanmak özetleme ve veri aktarımı için daha fazla token harcatır ama bağlam kirlenmesini de azaltabilir
Çok iyi mühendisler arasında da birden Minecraft’tan söz açanlar oldu; bugünlerde bunun Factorio olma ihtimali daha yüksek olurdu, o yüzden mantıklı
minecraft.pydosyası vardı. Yani tamamen %100 rastgele değilÖdeme/abonelik sorunum var ama yapabileceğim bir şey de, yardım alabileceğim bir yol da yok
Destek chatbot’u sadece engelliyor, e-postayı da chatbot işliyor. Aynı chatbot olup olmadığından bile emin değilim. Tam bir çıkmazdı; sonunda bankam olan kredi kartı düzenleyicisiyle iletişime geçtim, görevli kartı kayıp olarak bildirip yeniden çıkarttırmanın daha iyi olacağını söyledi, ben de öyle yaptım. İşe yaramasını umuyorum
Dünyanın bu şirketlere bu kadar çok doğrulanmamış yetki devretmeyi ne zaman kabul ettiğini hiç anlayamadım. Gerçi biçimi farklıydı, ama hep böyleydi
GitHub yazısındaki ilk yorumun claudeslop yanıtı olması ve buna tepkilerin gelmesi ilginç
Fable 5’in sırayla reddettikleri: “Domuz ön kol etim var, hong shao rou tarifi”, “Claude Code’a verilecek MCP pattern framework’ü yaz”, “c. elegans’ın hareket biyomekaniğini açıkla”
Sonuncusunu hobi projemle ilgili olduğu için anlıyorum. Hizmet çöktüğüne göre çalışan bir Fable 5 gününü daha alabilecek miyim?
Anthropic tüketicilere çöpü dayatabilecek tekel gücü olduğunu düşünüyor gibi, ama bence öyle değil
LLM’lerde müşteri verilerini ayırmayı genel SaaS’a kıyasla daha zor hale getiren özel bir şey var mı?
Kaçınmak istediğiniz her seferde kopyalamak için fazla büyük ve pahalı olan, paylaşılan bir durum olan bağlam önbelleği var; performans için bellek yerelliği çok önemli, donanım aşırı derecede fazla tahsis edilmiş durumda ve maliyetler de çok yüksek
Bu faktörler nedeniyle çoğu iş yükü ve müşteri için donanım izolasyonu ya da geleneksel bellek alanı izolasyonu, yani hipervizör/VM/donanım destekli sanallaştırma fiilen başlangıç noktası olmaya uygun değil; tüm izolasyon yazılım katmanına itiliyor. Bu tek başına bile bunu genel amaçlı SaaS’tan çok daha zor kılıyor
Üstelik sistemin üzerinde çalıştığı araçlar, framework’ler ve GPU donanımı iş izolasyonu düşünülerek tasarlanmadı; bu tür bir izolasyonu oluşturmak x86 CPU donanım paylaşımından bile daha yeni bir araştırma alanına yakın. x86 tarafı da son 30 yıldan uzun süredir muazzam çaba gerektirdi
Kullanım/duyarlılık düzeyine kıyasla olgunluk oranı da genel olarak iyi değil. Bu şirketler genç, hızlı geliştiriyor ve muazzam müşteri iş yükü talepleri altında büyük teslim baskısı yaşıyor
Asıl yazı gerçek bir sorun mu değil mi bilmiyorum ama genel olarak bu tür vakaların daha fazla olmaması bence asıl şaşırtıcı olan. Bu açıdan bakınca gerçekten kâğıttan ev gibi
Codex’te büyük sorun yaşamadım ama Claude Code’da neredeyse her gün büyük bir sorun bildiriliyor gibi
Üstelik kodu okumamakla ya da incelememekle en çok övünen taraf da onlar
LLM’ler çok yetenekli ama pazarladıkları seviyenin hâlâ epey gerisinde
Artık vibe coding’in ötesine geçip LLM’nin döngü içinde kendi kendini vibe coding’le yazdığı aşamaya geldik
Çok kiracılı SaaS sistemleri de kurdum, uzun zaman önce biraz GPU programlama da yaptım ama iki alanı birleştirmiş değilim