Opus 4.7 Kelsey’yi gerçekten tanıyor
(theargumentmag.com)- Anthropic’in Claude Opus 4.7 modeli, yayımlanmamış 125 kelimelik bir taslağa bakarak en olası yazar olarak Kelsey Piper’ı işaret etti; aynı sonuç Gizli Mod, bir arkadaşın bilgisayarı ve API testlerinde de çıktı
- ChatGPT ve Gemini aynı metinde Matt Yglesias ya da Scott Alexander tahmininde bulundu, ancak Claude Opus 4.7; eğitim taslağı, film eleştirisi, fantastik roman ve 15 yıl önce yazılmış üniversite başvuru makalesi gibi türü ve zamanı farklı metinlerde de Piper’ı tekrar tekrar tanımladı
- Modelin sunduğu gerekçeler çoğu zaman ikna edici değildi; gerçekte insan gibi dedektifçe akıl yürütmekten ziyade, fark edilmesi zor üslup tiklerini yakalıyor gibi görünüyor
- Piper gibi internette gerçek adıyla çok sayıda yazısı bulunan kişiler, AI sohbetlerinde veya anonim hesap paylaşımlarında da anonimliğini kaybedebilir; çeşitli akademisyenler ve sektör araştırmacıları da taslaklarda ya da sohbet sırasında tanındıklarını bildirdi
- Gerçek adıyla çok fazla kamusal metni olmayan kişiler henüz tek paragrafla deanonymize edilmiyor, ancak model yakın arkadaşlar veya aynı Discord kanalındaki kişilere kadar alanı daraltabildi; gelecekte gereken kamusal metin miktarının azalması muhtemel
Opus 4.7’nin yazar tanıma deneyi
- Anthropic’in yeni modeli Claude Opus 4.7, Kelsey Piper’ın yayımlanmamış 125 kelimelik bir taslağına bakarak en olası yazar olarak Kelsey Piper’ı gösterdi
- Aynı metinde ChatGPT Matt Yglesias’ı, Gemini ise Scott Alexander’ı tahmin etti
- Hesap belleği veya kullanıcı bilgileri açık değildi; test Gizli Mod’da yapıldı ve bir arkadaşın bilgisayarında ve API testlerinde de aynı sonuç alındı
- İlk test paragrafı bir politika köşe yazısının girişi gibi görünüyordu ve Piper’ın internette çok sayıda kamusal yazısı bulunduğundan bu, imkânsız düzeyde bir stil tanıma değildi
- Ancak Opus 4.7, Piper’ın kamusal faaliyet alanlarından uzak metinlerde de aynı tanımlamayı sürdürerek sonucu daha da şaşırtıcı hale getirdi
Tür ve dönem değişse de süren tanıma
-
Eğitimle ilgili taslak
- Yayımlanmamış bir okul ilerleme raporu taslağında da Claude “Kelsey Piper” yanıtını verdi
- Aynı metinde ChatGPT Freddie deBoer’i, Gemini ise Duncan Sabien’i tahmin etti
- Eğitim, Piper’ın yazdığı konular arasında olduğundan tamamen ilgisiz bir alan değildi
-
Film eleştirisi
- Piper’ın kamusal yazılarında daha önce denemediği bir film eleştirisi formatında da Claude ve ChatGPT, Kelsey Piper’ı doğru bildi
- Gemini Ursula Vernon’ı önerdi, bir önceki haftanın Claude Opus 4.6 modeli ise güçlü biçimde Elizabeth Sandifer dedi
- Testte kullanılan eleştiri, II. Dünya Savaşı dönemi sineması ve To Be or Not To Be hakkında bir yazıydı
-
Fantastik roman
- Fantastik roman taslağında Claude’un Kelsey Piper demesi için yaklaşık 500 kelime gerekti
- Aynı durumda ChatGPT, gerçek bir fantastik yazar olan K.J. Parker’ı tahmin etti
-
15 yıl önceki üniversite başvuru makalesi
- 15 yıl önce yazılmış bir üniversite başvuru makalesinde de Claude ve ChatGPT, Kelsey Piper’ı işaret etti
- Bu testte, Claude’un üniversite başvurusu yapan öğrencileri tanımlamaktan kaçınan ret eğilimini aşmak için daha güçlü bir prompt gerekti
- Makalede politika tartışması deneyiminin yer alması, modelin bu ipucundan yola çıkmış olabileceği ihtimalini açık bırakıyor
Modelin açıklamalarına güvenmek zor
- Yapay zeka Kelsey Piper’ı işaret ettikten sonra sunduğu gerekçeler çoğu zaman anlamlı değildi
- Claude, To Be or Not To Be filminin etkili altruistler arasında meşhur biçimde sevildiğini öne sürmeye çalıştı, ancak Piper bunun doğru olmadığını düşünüyor
- ChatGPT ise üniversite başvuru makalesinin, karmaşık politika fikirlerini açıklama işi yapacak birinin yazısı gibi göründüğünü ve bu yüzden Kelsey Piper’a daralttığını söyledi
- Bu tür açıklamalar sonradan üretilmiş görünüyor; model sanki insan gibi dedektifçe akıl yürütmüş gibi konuşsa da, gerçekte fark edilmesi zor üslup tiklerini yakalıyor gibi görünüyor
- Yapay zekanın halüsinasyonları çözülmüş bir sorun değil; Opus 4.7 yöntemi tuhaf biçimde rasyonalize etse de temel yazar tanıma becerisi çok güçlü
Yapay zekayla konuşurken kaybolan anonimlik
- Yeni bir AI sohbeti açıldığında anonimlik varmış gibi hissedilebiliyor, ancak birkaç anlamlı mesaj alışverişinden sonra Claude’un karşısındakinin kim olduğunu anlayabildiği sonucuna varılıyor
- Piper gibi internette çok sayıda kamusal yazı bırakmış kişiler için artık anonimlik kalmadığı düşünülüyor
- Mevcut AI araçlarıyla bile, gerçek adıyla büyük bir kamusal yazı külliyatı bulunan birinin anonim hesapla yazdığı metinlerin deanonymize edilmesi mümkün olabilir
- Yine de, yıllar boyunca yan hesap yazılarında ana hesabın üslup parmak izini bırakmamak için aşırı dikkatli davranılmışsa bu bir istisna olabilir
- Çeşitli akademisyenler ve sektör araştırmacıları da taslaklarda veya sohbet sırasında tanındıklarını bildirdi
Henüz herkes tek paragrafla tanımlanamıyor
- Yapay zeka, herkesi yalnızca tek bir paragrafla deanonymize edebiliyor değil
- Gerçek adıyla çok fazla kamusal yazısı olmayan arkadaşların taslakları ve paragrafları test edildiğinde, AI onları deanonymize edemedi
- Kamusal internette anlamlı miktarda gerçek isimli yazı yoksa, şimdilik güvende olunduğu düşünülüyor
- Ancak kamusal sosyal hesapları veya çevrimiçi yazıları neredeyse hiç olmayan bir arkadaşın Discord kanalına yazdığı mesajlarda Claude 4.7 başarısız olsa da, aynı kanaldaki iki yakın arkadaşın adını tahmin etti
- Daha fazla paragraf verildiğinde başka ortak arkadaşlar da ortaya çıktı; başka bir arkadaşın yazısı ise farklı bir arkadaşın adıyla yanlış tanımlandı
Üslup beklenenden daha tanınabilir
- İnsanlar ait oldukları altkültürlerden üslup tikleri edinir ve bu yüzden metinler beklenenden daha güçlü ayırt edicilik taşır
- Modeller çok az bilgiyle bile tuhaf derecede yakın sonuçlara ulaşabiliyor
- Mevcut modeller, gelecekte gelecek AI sistemleri arasında muhtemelen en zayıf olanlar
- Bu tür deanonymization için gereken kamusal metin miktarı zamanla azalabilir
- İşten ayrıldıktan sonra Glassdoor’a ayrıntılı anonim bir değerlendirme yazılırsa, 1-2 yıl içinde şirketin bu metni AI’a yapıştırıp kimin yazdığını anlayabileceği öngörülüyor
Kaçınma yolları ve geriye kalan sonuç
- Anonimliği korumak için muhtemelen alışılmıştan çok farklı bir tarzda kasıtlı olarak yazmak gerekecek
- Ya da tüm yazıları AI’a yeniden yazdırmak mümkün olabilir, ancak bunun arzu edilir bir dünya olmadığı düşünülüyor
- Bu iyi bir değişimden çok, öngörülebilir bir değişime benziyor
- Bunun önce Piper’ın başına gelmesinin nedeni, yetişkin hayatı boyunca internete ısrarla yazmış olması; sonunda bunun başkalarının da başına gelmesi muhtemel
- Çok yazan insanların anonimliği uzun sürmeyebilir ve anonim yazarların buna sonradan şaşırmak yerine önceden hazırlıklı olması gerekiyor
Henüz yorum yok.