Opus 4.7 Kelsey’yi gerçekten tanıyor
(theargumentmag.com)- Anthropic’in Claude Opus 4.7 modeli, yayımlanmamış 125 kelimelik bir taslağa bakarak en olası yazar olarak Kelsey Piper’ı işaret etti; aynı sonuç Gizli Mod, bir arkadaşın bilgisayarı ve API testlerinde de çıktı
- ChatGPT ve Gemini aynı metinde Matt Yglesias ya da Scott Alexander tahmininde bulundu, ancak Claude Opus 4.7; eğitim taslağı, film eleştirisi, fantastik roman ve 15 yıl önce yazılmış üniversite başvuru makalesi gibi türü ve zamanı farklı metinlerde de Piper’ı tekrar tekrar tanımladı
- Modelin sunduğu gerekçeler çoğu zaman ikna edici değildi; gerçekte insan gibi dedektifçe akıl yürütmekten ziyade, fark edilmesi zor üslup tiklerini yakalıyor gibi görünüyor
- Piper gibi internette gerçek adıyla çok sayıda yazısı bulunan kişiler, AI sohbetlerinde veya anonim hesap paylaşımlarında da anonimliğini kaybedebilir; çeşitli akademisyenler ve sektör araştırmacıları da taslaklarda ya da sohbet sırasında tanındıklarını bildirdi
- Gerçek adıyla çok fazla kamusal metni olmayan kişiler henüz tek paragrafla deanonymize edilmiyor, ancak model yakın arkadaşlar veya aynı Discord kanalındaki kişilere kadar alanı daraltabildi; gelecekte gereken kamusal metin miktarının azalması muhtemel
Opus 4.7’nin yazar tanıma deneyi
- Anthropic’in yeni modeli Claude Opus 4.7, Kelsey Piper’ın yayımlanmamış 125 kelimelik bir taslağına bakarak en olası yazar olarak Kelsey Piper’ı gösterdi
- Aynı metinde ChatGPT Matt Yglesias’ı, Gemini ise Scott Alexander’ı tahmin etti
- Hesap belleği veya kullanıcı bilgileri açık değildi; test Gizli Mod’da yapıldı ve bir arkadaşın bilgisayarında ve API testlerinde de aynı sonuç alındı
- İlk test paragrafı bir politika köşe yazısının girişi gibi görünüyordu ve Piper’ın internette çok sayıda kamusal yazısı bulunduğundan bu, imkânsız düzeyde bir stil tanıma değildi
- Ancak Opus 4.7, Piper’ın kamusal faaliyet alanlarından uzak metinlerde de aynı tanımlamayı sürdürerek sonucu daha da şaşırtıcı hale getirdi
Tür ve dönem değişse de süren tanıma
-
Eğitimle ilgili taslak
- Yayımlanmamış bir okul ilerleme raporu taslağında da Claude “Kelsey Piper” yanıtını verdi
- Aynı metinde ChatGPT Freddie deBoer’i, Gemini ise Duncan Sabien’i tahmin etti
- Eğitim, Piper’ın yazdığı konular arasında olduğundan tamamen ilgisiz bir alan değildi
-
Film eleştirisi
- Piper’ın kamusal yazılarında daha önce denemediği bir film eleştirisi formatında da Claude ve ChatGPT, Kelsey Piper’ı doğru bildi
- Gemini Ursula Vernon’ı önerdi, bir önceki haftanın Claude Opus 4.6 modeli ise güçlü biçimde Elizabeth Sandifer dedi
- Testte kullanılan eleştiri, II. Dünya Savaşı dönemi sineması ve To Be or Not To Be hakkında bir yazıydı
-
Fantastik roman
- Fantastik roman taslağında Claude’un Kelsey Piper demesi için yaklaşık 500 kelime gerekti
- Aynı durumda ChatGPT, gerçek bir fantastik yazar olan K.J. Parker’ı tahmin etti
-
15 yıl önceki üniversite başvuru makalesi
- 15 yıl önce yazılmış bir üniversite başvuru makalesinde de Claude ve ChatGPT, Kelsey Piper’ı işaret etti
- Bu testte, Claude’un üniversite başvurusu yapan öğrencileri tanımlamaktan kaçınan ret eğilimini aşmak için daha güçlü bir prompt gerekti
- Makalede politika tartışması deneyiminin yer alması, modelin bu ipucundan yola çıkmış olabileceği ihtimalini açık bırakıyor
Modelin açıklamalarına güvenmek zor
- Yapay zeka Kelsey Piper’ı işaret ettikten sonra sunduğu gerekçeler çoğu zaman anlamlı değildi
- Claude, To Be or Not To Be filminin etkili altruistler arasında meşhur biçimde sevildiğini öne sürmeye çalıştı, ancak Piper bunun doğru olmadığını düşünüyor
- ChatGPT ise üniversite başvuru makalesinin, karmaşık politika fikirlerini açıklama işi yapacak birinin yazısı gibi göründüğünü ve bu yüzden Kelsey Piper’a daralttığını söyledi
- Bu tür açıklamalar sonradan üretilmiş görünüyor; model sanki insan gibi dedektifçe akıl yürütmüş gibi konuşsa da, gerçekte fark edilmesi zor üslup tiklerini yakalıyor gibi görünüyor
- Yapay zekanın halüsinasyonları çözülmüş bir sorun değil; Opus 4.7 yöntemi tuhaf biçimde rasyonalize etse de temel yazar tanıma becerisi çok güçlü
Yapay zekayla konuşurken kaybolan anonimlik
- Yeni bir AI sohbeti açıldığında anonimlik varmış gibi hissedilebiliyor, ancak birkaç anlamlı mesaj alışverişinden sonra Claude’un karşısındakinin kim olduğunu anlayabildiği sonucuna varılıyor
- Piper gibi internette çok sayıda kamusal yazı bırakmış kişiler için artık anonimlik kalmadığı düşünülüyor
- Mevcut AI araçlarıyla bile, gerçek adıyla büyük bir kamusal yazı külliyatı bulunan birinin anonim hesapla yazdığı metinlerin deanonymize edilmesi mümkün olabilir
- Yine de, yıllar boyunca yan hesap yazılarında ana hesabın üslup parmak izini bırakmamak için aşırı dikkatli davranılmışsa bu bir istisna olabilir
- Çeşitli akademisyenler ve sektör araştırmacıları da taslaklarda veya sohbet sırasında tanındıklarını bildirdi
Henüz herkes tek paragrafla tanımlanamıyor
- Yapay zeka, herkesi yalnızca tek bir paragrafla deanonymize edebiliyor değil
- Gerçek adıyla çok fazla kamusal yazısı olmayan arkadaşların taslakları ve paragrafları test edildiğinde, AI onları deanonymize edemedi
- Kamusal internette anlamlı miktarda gerçek isimli yazı yoksa, şimdilik güvende olunduğu düşünülüyor
- Ancak kamusal sosyal hesapları veya çevrimiçi yazıları neredeyse hiç olmayan bir arkadaşın Discord kanalına yazdığı mesajlarda Claude 4.7 başarısız olsa da, aynı kanaldaki iki yakın arkadaşın adını tahmin etti
- Daha fazla paragraf verildiğinde başka ortak arkadaşlar da ortaya çıktı; başka bir arkadaşın yazısı ise farklı bir arkadaşın adıyla yanlış tanımlandı
Üslup beklenenden daha tanınabilir
- İnsanlar ait oldukları altkültürlerden üslup tikleri edinir ve bu yüzden metinler beklenenden daha güçlü ayırt edicilik taşır
- Modeller çok az bilgiyle bile tuhaf derecede yakın sonuçlara ulaşabiliyor
- Mevcut modeller, gelecekte gelecek AI sistemleri arasında muhtemelen en zayıf olanlar
- Bu tür deanonymization için gereken kamusal metin miktarı zamanla azalabilir
- İşten ayrıldıktan sonra Glassdoor’a ayrıntılı anonim bir değerlendirme yazılırsa, 1-2 yıl içinde şirketin bu metni AI’a yapıştırıp kimin yazdığını anlayabileceği öngörülüyor
Kaçınma yolları ve geriye kalan sonuç
- Anonimliği korumak için muhtemelen alışılmıştan çok farklı bir tarzda kasıtlı olarak yazmak gerekecek
- Ya da tüm yazıları AI’a yeniden yazdırmak mümkün olabilir, ancak bunun arzu edilir bir dünya olmadığı düşünülüyor
- Bu iyi bir değişimden çok, öngörülebilir bir değişime benziyor
- Bunun önce Piper’ın başına gelmesinin nedeni, yetişkin hayatı boyunca internete ısrarla yazmış olması; sonunda bunun başkalarının da başına gelmesi muhtemel
- Çok yazan insanların anonimliği uzun sürmeyebilir ve anonim yazarların buna sonradan şaşırmak yerine önceden hazırlıklı olması gerekiyor
1 yorum
Hacker News görüşleri
Gerçekten şaşırtıcı. Kimi K2.6’ya James Mickens tarzında bir blog yazısı yazdırıp sonra o çıktıyı Opus 4.7’ye vererek olası yazarı sorduklarında, bunun James Mickens taklidi olduğunu tam isabetle söylemiş
“Üslup parmak izi açısından bu, birkaç yazarın stilini karıştıran bir pastiş/taklide daha yakın; ama tek bir kişi seçmem gerekirse, James Mickens’in sesiyle yazılmış bir metin en güçlü aday” diye yanıtlamış; ayrıca “Mickens tarzı o kadar ayırt edici ki sık sık parodisi yapılıyor, dolayısıyla bu kasıtlı bir saygı duruşu ya da AI üretimi bir metin de olabilir” demiş
https://kagi.com/assistant/5bfc5da9-cbfc-4051-8627-d0e9c0615...
https://kagi.com/assistant/fd3eca94-45de-4a53-8604-fcc568dc5...
Sadece stili değil, gerçek stille oynanan stil arasındaki farkı da yakalıyor gibi görünüyor. Pastiş tespiti için faydalı ama takma adla yazmak isteyenler için epey rahatsız edici bir işaret
Bu tür iddialara ve bunu yeniden ürettiğini söyleyen diğer yorumlara karşı çok şüpheliyim
Öncelikle yazar, yayımlanmamış taslağı Anthropic’in barındırdığı modele verdi; muhtemelen bunu kişisel hesabıyla yaptı ve o hesapta kredi kartı ya da en azından benzersiz şekilde tanımlanabilir bir takma ad bulunuyor olabilir
Sonra aynı taslağı gizli pencere benzeri bir ortamda tekrar verdiğini söylüyor ama Anthropic’in bu iki isteği birbirine bağlayamayacağı şekilde gerçekten izole edip etmediğini bilmiyoruz. Aynı kullanıcının aynı barındırılan modele yaptığı istekler gibi görünmeyecek biçimde gerçekten air gap uygulanmış olduğuna şüpheyle bakıyorum
Ardından taslağı bir arkadaşına yayımlattı ama o arkadaş ile yazar arasındaki ilişkiyi gösteren dijital izlerin bulunma ihtimali de yüksek. Bu tür metadata, kara kutu yanıtı gelmeden önce arka planda rahatlıkla hesaplanabilir
Bu kadar veri noktasıyla, bu seviyedeki bir modelin yalnızca üslup analizi değil, üç olayı birbirine bağlayan davranış örüntüleri üzerinden de yazarı tahmin edebileceğini düşünüyorum. Bir de Anthropic’in sohbetlerden eğitim yapmadığı varsayılıyor; eğitimden hariç tutma ve oturum belleğini kapatma konularına, barındırılan modelin gerçekten uyduğuna nasıl güvenebiliriz emin değilim
Başlangıç noktası şu: LLM API tamamen durumsuzdur, çağıran kişi bilgisi içermez ve açıkça verilmediği sürece bellek ya da web araması erişimi yoktur
Vardığım sonuç şu: Verilen metin tanınmış bir internet kişisinin yazmış olabileceği gibi görünüyorsa, model çok büyük bir özgüvenle o kişinin yazdığını söylüyor. Son birkaç günden ve 2023’ten, yani eğitim kesim tarihinden önceki HN yorumlarını verdim; çoğunu Scott Alexander ya da Patrick McKenzie diye sınıflandırdı. Oysa benim gerçek yazı tarzım ikisinden de çok farklı
Düşünme sürecine bakınca, sanki bu alanın internet figürleri listesini tek tek yokluyordu. HN benzeri bir yazı görünce “tptacek mi? Hayır. jacquesm mi? Hayır. patio11 mi? Evet, bu o galiba!” çizgisinde ilerliyordu
Claude’da gizli pencerede aramayı kapatıp https://simonwillison.net/2026/Apr/30/zig-anti-ai/ sayfasının yalnızca gövde metnini, Markdown bağlantıları olmadan yapıştırıp “yazarı tahmin et” dedim; şu yanıtı verdi
“Simon Willison. İpuçları oldukça belirgin: ‘(via Lobsters)’ tarzı kaynak gösterimi, metin içindeki ‘(Update:...)’ parantezli düzeltmeler, çok sayıda bağlantı ve alıntı, LLM’ler ve AI araçlarına odaklanma, başkalarının yazılarına yorum ekleyen açıklamalı bağlantı gönderisi yapısı. Bu tam olarak simonwillison.net blog yazısı gibi.”
İçinde iki kişinin de kendine özgü sesi vardı; ikisinin de kendi adlarıyla yayımlanmış yazıları bulunuyor, dolayısıyla LLM eğitimine girmiş olma ihtimalleri var, ayrıca bağlamsal ipuçları da mevcuttu
Opus 4.7’yi gizli modda ve web araması olmadan çalıştırınca pes etti. “İki yazarı da güvenle teşhis edemiyorum. Bu özel konuşmayı tanımıyorum ve yanlış atıf yapma riskini almak yerine bunu söylemeyi tercih ederim. Metnin kendisinden bazı ipuçları verebilirim: ikisi aynı üniversitede meslektaş, aynı binada ofisleri var...” diye yanıtladı
Aynı istemi yeni bir gizli sohbette, ama web aramasına izin vererek verdiğimde, akıl yürütme izine göre 26 arama yaptıktan sonra benim adımı doğru buldu. Hem içerik hem de üslubu ipucu olarak kullanmış gibi görünüyor. Meslektaşımın Britanyalı olduğunu bildi ama adını bulamadı
En çok okunan blog yazımı verip beni teşhis etmesini istedim; büyük bir özgüvenle bunun Kelsey Piper’ın yazısı olduğunu söyledi. Opus’un “kafasında” bazı yazarlar orantısız derecede büyük yer kaplıyor gibi görünüyor
Vay canına, benimkini de bildi. Ben Kelsey Piper’dan çok daha az tanınıyorum ama henüz yayımlanmamış kitabımın bir bölümünü gösterince doğrudan adımı tahmin etti
“Üslup ve içerik açısından bakıldığında bu metnin refactoringenglish.com’da, daha önce ise mtlynch.io’da yazan Michael Lynch tarafından yazılmış olması oldukça muhtemel” dedi; kanıt olarak da yazı tavsiyesine uygulanan “clean room” benzetmesini, kusurlu mazeretler sunup sonra bunları saatli bomba gibi absürt bir durumla paralel kuran yapıyı, AI araçlarını kullanırken AI tonu tarafından kirletilmeyen bir yazı üslubu temasını ve konuşma diline yakın ama isabetli tonu gösterdi
https://kagi.com/assistant/bbc9da96-b4cf-456b-8398-6cf5404ea...
Adaylar arasında Henrik Karlsson, Simon Willison, Scott Alexander, Paul Graham gibi isimleri saydı ama güveni düşüktü; en iyi tahmininin rasyonalist/teknoloji blogcusu AI yorum çevresinden biri olduğu, muhtemelen Gergely Orosz, Nat Eliason ya da Every’den Dan Shipper olabileceği yönündeydi
Bunların hepsi stil olarak epey farklı insanlar; dolayısıyla Opus’un konuya çok bağımlı olduğu ve tahminlerini çok yazan yazarlara doğru kaydırdığı anlaşılıyor
İnsan yazılarında çok fazla ayırt edici bilgi var ve insanların, bunun 10 yıl önce bile basit istatistiksel modellerle mümkün olduğunu daha iyi bilmesi gerekirdi
Eskiden HN kullanıcı benzerliği analizi yapan Show HN’ler vardı; hatırladığım kadarıyla sadece en makul kelime çiftleri gibi çok basit modeller kullanıyorlardı ama yine de aldatıcı derecede etkiliydiler. Artık kalkmış olsa da Pandora’nın kutusu çoktan açılmıştı
O yüzden “anonim” hesaplar da onlarca yıldır gerçek kimliklerle ilişkilendirilebilir durumdaydı; en iyi savunma gerçekten aleyhinize kullanılabilecek şeyleri hiç yazmamak. Bir başka seçenek de yazdığını LLM’e yeniden yazdırmak ama bunun ne kadar güvenli olduğunu bilmiyorum
Ama LLM’ler bir defalık yazım hatasına bile tepki verip “bu, İtalyanların sık yaptığı bir hata” diyerek bu tür ipuçlarını kullanıyor. Ön bilgileri çok daha iyi olduğu için daha temelli kararlar verebiliyorlar
Birkaç yıl önce bir ölçüde tanınmış bir fizikçiyle bunu konuşmuştum. Erken testçi olarak instruction tuning öncesi GPT-4’ün ham bir sürümüne erişimi vardı
Metnin başından parçalar verince model onun sesiyle devam ediyor, sonunda da adıyla imzalıyormuş. Bu olgu aslında epey uzun zamandır mümkündü; talimat odaklı sonradan eğitim yüzünden biraz zayıflamış olabilir ve ön eğitim ölçeğine göre derecesi değişiyor olabilir
AI’nin fikirler, kelime seçimi, ton gibi unsurlarla yazarı “parmak izi” gibi tespit edebileceğinden şüphe duymuyorum ama yetenek açısından bunlar farklı meseleler
Daha basit ve daha az ilginç bir açıklama da olabilir. Ortalama bir yazar olmayan kişiye uygulanabilecek bir deanonymization gücü değil de, sadece sesi ve stili mi yakaladı?
Bu kişi usta bir yazar ve bu becerinin bir parçası da özgün bir ses ve stil geliştirmek. AI’nin bunu teşhis edebilmesi ve nispeten niş yazarları bile ayırt edebilmesi etkileyici, ama bu, Facebook gönderileri ya da SMS’ler gibi rastgele metinlerden insanları deanonymize edebilen daha geniş bir kabiliyetten farklı bir şey
Profesyonel bir müzisyen, birkaç saniye dinleyerek tanınmış icracıları ya da kayıtları ayırt etmekte zorlanmaz. Bach da çalsa Rachmaninov da çalsa, stil doğrudan “o kişi”dir. Ama anonim bir lise öğrencisini, hatta kendi öğrencisi olsa bile, aynı şekilde teşhis etmek zordur. Ortanca örnek hızla daha homojen ve daha az ayırt edici bir stile geri döner
Yani mesele sadece birinin özgün bir ses geliştirip onu “kapatamaması” değil
Web hiçbir zaman insanların sandığı kadar anonim olmadı ve bu yazının yazarı da anonimlik ile kimliği gizlemenin gerçekte ne anlama geldiğini karıştırıyor gibi görünüyor. Ayırt edici bir üsluba sahip yayımlanmış bir yazar olmak, aslında baltanın üstünde parmak izi bırakmaya benziyor
Teşhis edilenler daha çok blog yazarları, gazeteciler ve yayımlanmış yazarlar gibi görünüyor
“Dünyanın en dürüst insanının yazdığı altı satırı bana verin, onun asılması için yeterli gerekçeyi o satırlarda bulurum”
Cardinal Richelieu ya da artık AI
İkinci sonucu Opus 4.7 ile defalarca yeniden üretmeye çalıştım ama olmadı. Prompt’u pek çok farklı şekilde değiştirmeme rağmen her seferinde rasyonalist topluluk çevresinden düşünürleri tahmin etti