- A16Z'nin öneri kitap listesinde yer alan bazı eser açıklamalarında, “çoğu kitabın cümlenin ortasında bittiği” ifadesinin gerçeklerle çelişen bir metin olduğu bulundu
- Neal Stephenson, romanlarının bazı yönlerden tartışmalı olsa da asla cümlenin ortasında sonlanmadığını açıkça belirtti
- Bu yanlışlığın, yapay zekâ tarafından üretilen bir ifadenin denetlenmeden yayımlanması sonucunda oluşmuş olma olasılığını en yüksek olarak değerlendirdi
- GitHub depolarındaki kayıtlar üzerinden Cursor IDE tarafından oluşturulan taslağın ve sonrasında insanın dikkatsiz düzeltme sürecinin tespit edildiği görüldü
- Bu örnek, yapay zeka tarafından üretilen içeriğin güvenilirliği ve doğrulama eksikliği sorununun altını çizen önemli bir vaka olarak öne çıkıyor
A16Z'nin kitap listesi ve yanlış ifade
- A16Z'nin yayımladığı önerilen okuma listesinde Neal Stephenson'un birkaç eseri yer alıyordu
- Liste açıklamaları arasında, “çoğu kitap cümlenin ortasında biter (kelime anlamıyla mid-sentence olarak biter)” ifadesi bulunuyordu
- Stephenson, bunun gerçek olmadığını vurgulayarak, içinde “literally” kelimesinin olması nedeniyle bunun basit bir mecaz değil, açık bir hata olduğunu belirtti
- Bazı okuyucuların sonlardan hoşnutsuz kalabileceğini kabul etse de, 《Snow Crash》, 《The Diamond Age》, 《Seveneves》 gibi eserlerin hepsinin net bir sonu olduğunu açıkladı
Hatanın doğası ve problemleri
- Bu cümle, yalnızca basit bir edebi eleştiri (opinion) değil, gerçek iddiası (factual assertion) olarak yanlış bilgi niteliği taşıyor
- Stephenson, bu hatanın yazarın ve editörün bütünlüğünü zedelediğini söyledi
- O ayrıca “böyle bir iddianın A16Z web sitesinde nasıl yayımlandığını” da bir sorun olarak gündeme getirdi
Hipotez 1: Yapay zekâ tarafından üretilen ifade
- En olası açıklama olarak, yapay zekâ tarafından yazılan bir ifadenin insan tarafından denetlenmeden yayımlandığı ihtimalini öne sürdü
- İsim yazım hataları ve üslup aykırılıkları bunu destekliyor
- Bu tür bir durumun hukuk, akademi ve basın gibi birçok alanda zaten yaygın olarak yaşandığını belirtti
- Stephenson, bu süreci **“Inhuman Centipede”**ye benzeterek, yanlış bilgilerin bir sonraki nesil LLM'lerde yeniden öğrenilme riskine dikkat çekti
Hipotez 2: İnsan kaynaklı yanlış veri kullanımı
- İkinci olasılık olarak, yanlış materyale dayanan insan hatası gösterildi
- Alt hipotez A: Korsan kopya (bootleg PDF) kullanılarak, ortadan kopuk bir sürümün referans alınmış olma ihtimali
- Alt hipotez B: Çeviri kalitesi sorunları nedeniyle, metnin gerçekten cümlenin ortasında kesilmiş gibi göründüğünün düşünülmesi
Gerçek sebep takip çalışması
- Stephenson, siteyi inceledikten sonra GitHub deposunun commit geçmişinde bir ipucu buldu
- 21 Temmuz 2023 tarihli committe Cursor IDE tarafından oluşturulmuş ham metnin bulunduğu görüldü
- O ham metinde “segfault” benzetmesi vardı; ardından birinin bunu “cümlesinin ortasında durur” şeklinde yanlışca düzelttiği tespit edildi
- Daha sonra başka biri de özetleme sürecinde bir yazım hatası ekledi ve hata tamamlandı
- Stephenson, bu durumu, yapay zekâ kullanımındaki tembellikle insanın ihmalkârlığının birleşik sonucu olarak değerlendirdi
İnternet güvenilirliği ve yapay zeka içeriği
- Stephenson, internet kullanıcılarının hâlâ çevrimiçi bilgilere körü körüne inanma eğilimi gösterdiğini belirtti
- Geçmişte, spam e-postalarda kendi romanı Cryptonomicon'dan rastgele cümle parçalarının eklenmiş örneklerini hatırlattı
- Bu parçaların gerçekten cümlenin ortasında kesildiğini ve LLM'lerin böyle verilerle eğitilmiş olma ihtimalini öne sürdü
- O, bu olay üzerinden yapay zekânın gerçekle kurgu arasındaki ayrımı yapmadan içerik üretmesinin tehlikesini vurguladı
Sonuç
- Stephenson, A16Z'nin önerisine teşekkür ederken bile, yanlış ifadeler konusunda açık bir doğrulama ihtiyacını dile getirdi
- Bu vaka, yapay zeka tarafından üretilen içeriğin doğrulanmaması ve insan denetimi sorumluluğu sorunlarını ortaya koyan örnek olarak değerlendirildi
1 yorum
Hacker News görüşü
Commit geçmişi açık olduğu için, bu okuma listesinin AI elinden çıktığını anlamak kolay
İlgili commit bağlantısı incelenebilir
Commit mesajı sadece “stephenson”, bu yüzden neden değiştirildiği belli değil
Düzeltilmiş commit bağlantısı
LLM'lerle deneyimim, diğer bazı insanlarınki kadar olumlu değil
Örneğin Google'ın Gemini promosyonunda Şükran Günü yemeği hazırlık zaman çizelgesi verilmişti, ama soru sorunca birbiriyle çelişen üç farklı sürüm üretti
Sadece “ekmeğin üstünü havluyla örtüp sıcak tut” demesi yeterliydi, ama tamamen alakasız cevapları tekrar edip durdu
Kod üretimi 6 denemeden 1'inde başarılı oldu, StackOverflow tarzı sorularda 6'da 5 başarılıydı, genel sorularda ise sonuçlar tutarsızdı
Başarısız olduğunda o kadar kötü oluyor ki, dünyanın bu şekilde büyük ölçekli LLM kullanımına koşuyor olması korkutucu geliyor
Hatta “AI Overview çıkmadan önceki gün hisse fiyatı neydi” diye sordum, onu bile yanlış verdi
Koddan daha uzundu ve sadece değişken tanımlarını tekrarlayan anlamsız bir spagetti yığınıydı. Bir daha kullanmam
Bence A16Z ciddiye alınmamalı. Tam bir dolandırıcılar topluluğu gibi duruyor
Blog yazısını cümlenin ortasında bitirmiş olsalardı gerçekten harika olurdu
Diğer eserleri de insanın kaotik iç dünyasını gösteriyor ama bir sonuca ya da mesaja varmıyor
2000'den fazla sayfa okuduktan sonra bile vardığım sonuç hâlâ “önermiyorum”
Neal Stephenson'a ise “tam bir cümleyle bitirdiğin için teşekkürler” demek isterim
Kitapları hep ya çok erken ya da çok geç bitiyormuş gibi hissettiriyor; ilginç fikirlerine rağmen bu yüzden elim pek gitmiyor
Werner Herzog'un otobiyografisini hatırlatıyor
Önsözde “bir keskin nişancı kurşunuyla hayatım aniden bitebilir” diyor ve bunu kitabı ansızın bitirme numarası olarak kullanacağını önceden söylüyor
Sonra gerçekten öyle bitiriyor ama hemen ardından “işte sözünü ettiğim son buydu” diye ekliyor; tam bir Herzog usulü ters köşe
Büyük şirketlerin yıl sonu okuma listesi yayımlaması, “biz duyguları ve zevkleri olan insanlarız” türü bir PR mesajı
Ama bu olay, bunun sadece tanıtım amaçlı bir mizansen olduğunu gösteriyor
“Hayatın anlamı bir integer'dı” cümlesiyle bitirdiğini görünce, bunun kesinlikle AI tarafından yazılmış bir cümle olduğunu düşündüm
Tüm liste baştan sona LLM'lere özgü tonla dolu
Kaynağı düşününce şaşırtıcı da değil. Aslında ilk hipotezle (LLM yazdı hipotezi) konu kapanmalıydı
Stephenson'ı “cümleyi ortasında kesen bir Dadaist yazar” diye hicvediyorlar
Bir başka hipotez de bunun sadece yanlış hatırlama olabileceği
Yıllar önce okunan bir Stephenson kitabının tatsız bir sonla bittiği hatırlanıp, başka bir kitaptaki “cümlenin ortasında bitme” ile karıştırılmış olabilir