1 puan yazan GN⁺ 2 시간 전 | Henüz yorum yok. | WhatsApp'ta paylaş
  • Anthropic’in Claude Opus 4.7 modeli, yayımlanmamış 125 kelimelik bir taslağa bakarak en olası yazar olarak Kelsey Piper’ı işaret etti; aynı sonuç Gizli Mod, bir arkadaşın bilgisayarı ve API testlerinde de çıktı
  • ChatGPT ve Gemini aynı metinde Matt Yglesias ya da Scott Alexander tahmininde bulundu, ancak Claude Opus 4.7; eğitim taslağı, film eleştirisi, fantastik roman ve 15 yıl önce yazılmış üniversite başvuru makalesi gibi türü ve zamanı farklı metinlerde de Piper’ı tekrar tekrar tanımladı
  • Modelin sunduğu gerekçeler çoğu zaman ikna edici değildi; gerçekte insan gibi dedektifçe akıl yürütmekten ziyade, fark edilmesi zor üslup tiklerini yakalıyor gibi görünüyor
  • Piper gibi internette gerçek adıyla çok sayıda yazısı bulunan kişiler, AI sohbetlerinde veya anonim hesap paylaşımlarında da anonimliğini kaybedebilir; çeşitli akademisyenler ve sektör araştırmacıları da taslaklarda ya da sohbet sırasında tanındıklarını bildirdi
  • Gerçek adıyla çok fazla kamusal metni olmayan kişiler henüz tek paragrafla deanonymize edilmiyor, ancak model yakın arkadaşlar veya aynı Discord kanalındaki kişilere kadar alanı daraltabildi; gelecekte gereken kamusal metin miktarının azalması muhtemel

Opus 4.7’nin yazar tanıma deneyi

  • Anthropic’in yeni modeli Claude Opus 4.7, Kelsey Piper’ın yayımlanmamış 125 kelimelik bir taslağına bakarak en olası yazar olarak Kelsey Piper’ı gösterdi
  • Aynı metinde ChatGPT Matt Yglesias’ı, Gemini ise Scott Alexander’ı tahmin etti
  • Hesap belleği veya kullanıcı bilgileri açık değildi; test Gizli Mod’da yapıldı ve bir arkadaşın bilgisayarında ve API testlerinde de aynı sonuç alındı
  • İlk test paragrafı bir politika köşe yazısının girişi gibi görünüyordu ve Piper’ın internette çok sayıda kamusal yazısı bulunduğundan bu, imkânsız düzeyde bir stil tanıma değildi
  • Ancak Opus 4.7, Piper’ın kamusal faaliyet alanlarından uzak metinlerde de aynı tanımlamayı sürdürerek sonucu daha da şaşırtıcı hale getirdi

Tür ve dönem değişse de süren tanıma

  • Eğitimle ilgili taslak

    • Yayımlanmamış bir okul ilerleme raporu taslağında da Claude “Kelsey Piper” yanıtını verdi
    • Aynı metinde ChatGPT Freddie deBoer’i, Gemini ise Duncan Sabien’i tahmin etti
    • Eğitim, Piper’ın yazdığı konular arasında olduğundan tamamen ilgisiz bir alan değildi
  • Film eleştirisi

    • Piper’ın kamusal yazılarında daha önce denemediği bir film eleştirisi formatında da Claude ve ChatGPT, Kelsey Piper’ı doğru bildi
    • Gemini Ursula Vernon’ı önerdi, bir önceki haftanın Claude Opus 4.6 modeli ise güçlü biçimde Elizabeth Sandifer dedi
    • Testte kullanılan eleştiri, II. Dünya Savaşı dönemi sineması ve To Be or Not To Be hakkında bir yazıydı
  • Fantastik roman

    • Fantastik roman taslağında Claude’un Kelsey Piper demesi için yaklaşık 500 kelime gerekti
    • Aynı durumda ChatGPT, gerçek bir fantastik yazar olan K.J. Parker’ı tahmin etti
  • 15 yıl önceki üniversite başvuru makalesi

    • 15 yıl önce yazılmış bir üniversite başvuru makalesinde de Claude ve ChatGPT, Kelsey Piper’ı işaret etti
    • Bu testte, Claude’un üniversite başvurusu yapan öğrencileri tanımlamaktan kaçınan ret eğilimini aşmak için daha güçlü bir prompt gerekti
    • Makalede politika tartışması deneyiminin yer alması, modelin bu ipucundan yola çıkmış olabileceği ihtimalini açık bırakıyor

Modelin açıklamalarına güvenmek zor

  • Yapay zeka Kelsey Piper’ı işaret ettikten sonra sunduğu gerekçeler çoğu zaman anlamlı değildi
  • Claude, To Be or Not To Be filminin etkili altruistler arasında meşhur biçimde sevildiğini öne sürmeye çalıştı, ancak Piper bunun doğru olmadığını düşünüyor
  • ChatGPT ise üniversite başvuru makalesinin, karmaşık politika fikirlerini açıklama işi yapacak birinin yazısı gibi göründüğünü ve bu yüzden Kelsey Piper’a daralttığını söyledi
  • Bu tür açıklamalar sonradan üretilmiş görünüyor; model sanki insan gibi dedektifçe akıl yürütmüş gibi konuşsa da, gerçekte fark edilmesi zor üslup tiklerini yakalıyor gibi görünüyor
  • Yapay zekanın halüsinasyonları çözülmüş bir sorun değil; Opus 4.7 yöntemi tuhaf biçimde rasyonalize etse de temel yazar tanıma becerisi çok güçlü

Yapay zekayla konuşurken kaybolan anonimlik

  • Yeni bir AI sohbeti açıldığında anonimlik varmış gibi hissedilebiliyor, ancak birkaç anlamlı mesaj alışverişinden sonra Claude’un karşısındakinin kim olduğunu anlayabildiği sonucuna varılıyor
  • Piper gibi internette çok sayıda kamusal yazı bırakmış kişiler için artık anonimlik kalmadığı düşünülüyor
  • Mevcut AI araçlarıyla bile, gerçek adıyla büyük bir kamusal yazı külliyatı bulunan birinin anonim hesapla yazdığı metinlerin deanonymize edilmesi mümkün olabilir
  • Yine de, yıllar boyunca yan hesap yazılarında ana hesabın üslup parmak izini bırakmamak için aşırı dikkatli davranılmışsa bu bir istisna olabilir
  • Çeşitli akademisyenler ve sektör araştırmacıları da taslaklarda veya sohbet sırasında tanındıklarını bildirdi

Henüz herkes tek paragrafla tanımlanamıyor

  • Yapay zeka, herkesi yalnızca tek bir paragrafla deanonymize edebiliyor değil
  • Gerçek adıyla çok fazla kamusal yazısı olmayan arkadaşların taslakları ve paragrafları test edildiğinde, AI onları deanonymize edemedi
  • Kamusal internette anlamlı miktarda gerçek isimli yazı yoksa, şimdilik güvende olunduğu düşünülüyor
  • Ancak kamusal sosyal hesapları veya çevrimiçi yazıları neredeyse hiç olmayan bir arkadaşın Discord kanalına yazdığı mesajlarda Claude 4.7 başarısız olsa da, aynı kanaldaki iki yakın arkadaşın adını tahmin etti
  • Daha fazla paragraf verildiğinde başka ortak arkadaşlar da ortaya çıktı; başka bir arkadaşın yazısı ise farklı bir arkadaşın adıyla yanlış tanımlandı

Üslup beklenenden daha tanınabilir

  • İnsanlar ait oldukları altkültürlerden üslup tikleri edinir ve bu yüzden metinler beklenenden daha güçlü ayırt edicilik taşır
  • Modeller çok az bilgiyle bile tuhaf derecede yakın sonuçlara ulaşabiliyor
  • Mevcut modeller, gelecekte gelecek AI sistemleri arasında muhtemelen en zayıf olanlar
  • Bu tür deanonymization için gereken kamusal metin miktarı zamanla azalabilir
  • İşten ayrıldıktan sonra Glassdoor’a ayrıntılı anonim bir değerlendirme yazılırsa, 1-2 yıl içinde şirketin bu metni AI’a yapıştırıp kimin yazdığını anlayabileceği öngörülüyor

Kaçınma yolları ve geriye kalan sonuç

  • Anonimliği korumak için muhtemelen alışılmıştan çok farklı bir tarzda kasıtlı olarak yazmak gerekecek
  • Ya da tüm yazıları AI’a yeniden yazdırmak mümkün olabilir, ancak bunun arzu edilir bir dünya olmadığı düşünülüyor
  • Bu iyi bir değişimden çok, öngörülebilir bir değişime benziyor
  • Bunun önce Piper’ın başına gelmesinin nedeni, yetişkin hayatı boyunca internete ısrarla yazmış olması; sonunda bunun başkalarının da başına gelmesi muhtemel
  • Çok yazan insanların anonimliği uzun sürmeyebilir ve anonim yazarların buna sonradan şaşırmak yerine önceden hazırlıklı olması gerekiyor

Henüz yorum yok.

Henüz yorum yok.