- Çevrim içi ansiklopedi Wikipedia, son dönemde yapay zeka arama özetleri ve sosyal medya videoları nedeniyle doğrudan ziyaretlerin azaldığını açıkladı
- Wikimedia Vakfı, insan ziyaretçi sayısının geçen yıla göre %8 azaldığını duyurdu; bu, bot algılama sistemi güncellemesinden sonra yalnızca gerçek insan trafiğinin hesaba katıldığı bir sonuçtur
- Üretken yapay zeka arama sonuçlarının doğrudan yanıt sunması sitelere yapılan tıklamaları azaltırken, genç kuşağın bilgi aramak için TikTok gibi sosyal video platformlarını kullanma eğiliminde olduğu da ortaya çıkmıştır
- Wikipedia, kendi yapay zeka özetleme denemesini durdurdu ve yapay zeka ile arama motoru şirketlerinin kaynak belirtme ve siteye trafik yönlendirme sorumluluğu üstlenmesi gerektiğini savundu
- “Yapay zekânın kullandığı bilginin kaynağı hâlâ insan yapımı içeriktir” diyerek güvenilir kaynak doğrulaması ile insan kürasyonlu bilginin değerinin anlaşılmasını vurguladı
Wikipedia'da trafik düşüşü fenomeni
- Wikipedia, güvenilir örneklerden biri olarak sıkça anılan bir çevrim içi ansiklopedidir
- Ancak Wikimedia Vakfı’nın yakın zamanda yayımladığı bir rapora göre, insan kullanıcı sayfa görüntülemeleri geçen yılın aynı dönemine göre yaklaşık %8 azalmıştır
- Vakıf, insan ve bot trafiğini ayırmak için izleme sistemini geliştirdi; böylece Mayıs-Haziran aylarındaki alışılmadık ölçüde yüksek trafiğin büyük bölümünün tespitten kaçan bot trafiği olduğu doğrulandı
- Vakfın Marshall Millerı, bu durumu yapay zeka arama özetleri ve sosyal medya video tüketimindeki artışla doğan yapısal bir değişim olarak açıkladı
- Arama motorları, sitelere bağlantı vermek yerine yapay zeka tarafından üretilen doğrudan yanıtları göstermeye geçmektedir
- Genç kuşak, açık web yerine TikTok ve YouTube Shorts gibi video platformlarını bilgi arayışı için kullanmaktadır
- Google buna karşılık yapay zeka aramasının trafiği azaltmadığını savundu
Wikipedia'nın tutumu ve tepkisi
- Miller, “insanların bilgiyi yeni biçimlerde elde etmesinin olumlu” olduğunu belirtirken, Wikipedia bilgisinin hâlâ yapay zeka modellerinin eğitiminde ve özetlerinde kullanılmaya devam ettiğini vurguladı
- Ancak, ziyaretçi azalması içeriğe katkı yapan ve yöneten gönüllü sayısındaki düşüşe ve sonuçta bağış azalmasına yol açabilecek ciddi bir riski de içinde barındırıyor
- Gerçekten de bazı editörler yapay zeka tarafından üretilen özetlerin kalite sorunlarını dile getirdi ve vakıf, yapay zeka özetleme pilot programını geçici olarak durdurdu
AI şirketleriyle ilişkilerin yeniden tanımlanması
- Miller, AI, arama ve sosyal platformların Wikipedia'nın içeriğini kullanmaları durumunda, ekosisteme katkı için mutlaka kaynak belirtmelerini ve site ziyaretini tetiklemelerini sağlamaları gerektiğini savundu
- Wikipedia, içerik kaynak gösterim çerçevesini geliştirmeye devam ediyor ve yeni okuyucu kazanmak için iki uzman ekibi yönetiyor
- Ayrıca gönüllü katılımını genişletmeye yönelik bir kampanya da yürütüyor
Güven temelli bilginin önemi
- Miller, “Yapay zeka tarafından özetlenen bilgilerin kaynağında insanın bilgi emeği vardır” diye vurguladı
- Kullanıcılar arama yaparken alıntıları kontrol etmelidir ve özgün metne doğrudan gitmelidir
- Güvenilir insan kürasyonlu bir bilgi ekosisteminin sürdürülmesine ihtiyaç var
- O, “Bilginin şeffaf kaynağı ve insan katılımının sürekliliği, AI çağının temel değeridir” dedi
3 yorum
AI modelleri ve bunları üreten şirketler güveni inşa etmek için çaba göstermezlerse,
uzun vadede Vikipedi'nin daha fazla büyüme fırsatı sunabileceğini düşünüyorum.
Sadece verileri çalınmış bir siteye dönmüş oldu.
Hacker News Görüşleri
Wikipedia’nın gerekli olduğuna inanıyorum; trafiğin azalması tek başına sorun değil.
Basılı ansiklopediler Wikipedia ile yer değiştirdi ama yapay zekâ asla o yeri tamamen ikame edemez.
Yapay zekâ sadece erişimi kolaylaştıran bir araçtır; Wikipedia’nın kendine has varlık amacı ve değeri farklıdır.
Wikimedia Vakfı’nın sermaye biriktirmesi ve artan yıllık harcamalarına her zaman şüpheyle bakmışımdır.
Şimdi, para biriktirip yatırımla kendini finanse ederek 1000 yıl sürmesini umut etmenin tam zamanıdır.
Wikipedia’nın kamunun yararı için var olması ve böyle yönetilmesi gerektiğini düşünüyorum.
Wikimedia Vakfı’nın 1000 yıl boyunca yaşayacağını sanmıyorum.
Çünkü sosyal/ekonomik sistemin kendisinin bu kadar uzun süre dayanacağını düşünmüyorum.
ABD hükümetinin Wikimedia’a karşı rahatsız edici sinyaller verdiği zaten görülüyor.
Tek bir ülkeden diğerine taşınsa bile bu kadar uzun süre ayakta kalması zor olurdu.
Teknolojik uygarlığın ve verinin saklanmasının kırılganlığı nedeniyle Wikipedia’nın da bu kadar uzun süre yaşayacağından emin değilim.
İlgili haber
Wikipedia açık veri dökümleri sunduğu için çevrimdışı kopyaların bolca olması gerektiğini düşünüyorum.
Wikimedia’ın trafiğin düşüşünden söz etmesi muhtemelen reklam gelirine dayalı ticari bir neden olmaktan çok,
web kullanıcılarının bilgi arama şeklinin değişmiş olmasıyla ilgili.
Kullanıcılarını reklamlara satarak kazanç elde etmeyen bir site için trafik düşüşü hiç sorun değildir.
Bu, o sitenin sunduğu bilginin daha az değerli olduğu anlamına gelmez.
Uzun vadede ayakta kalmak için büyürken para ve yatırım biriktirme stratejisine her zaman kuşkuyla baktım.
Böyle bir birikimle dış gelir kesilse bile operasyon sürdürülebilirse,
çeyreklik sonuç baskısı olmadan asıl vizyona ve doğru işlere odaklanılabilir.
Sürekli para kazanılabilir ama, özünü koruyarak uzun vadeli sürdürülebilirlik planlamak daha ideal olur.
Wikipedia gerçekten inanılmaz bir şey.
Dünya genelinde herkes, konu ne olursa olsun istediği bir maddeyi yazabilir.
En iyi bilginin burada bulunduğuna dair güven duyulabilir.
Wikimedia Vakfı’nın parayı nerede harcadığını merak ediyorum.
Harcamaların sürekli arttığını söylüyorsunuz ama bu çoğunlukla nereye gidiyor,
hâlâ başka projelere yayılma girişimleri sürüyor mu?
Dünya ölçeğinde büyük bir site olduğu için barındırma maliyetlerinin yüksek olması anlaşılır,
ama gerçekten bu kadar keskin bir artış var mı emin değilim.
501(c)(3) kar amacı gütmeyen bir kuruluş olarak web trafiği geliri doğrudan etkilemiyorsa,
trafik düşüşünü mutlaka kötü bir şey olarak görmek gerekir mi merak ediyorum.
Hızlı büyüme baskısının sadece VC veya reklam bağımlı şirketlere özgü olduğunu sanırdım.
Aslında Wikipedia da web trafiğine büyük ölçüde bağımlı.
İnsan ziyaretçileri azalırken, yapay zekâ tarayıcıları (crawler) devasa miktarda veriyi çekiyor ve maliyeti artırıyor.
Trafik düşüşü gönüllü veya bağışçı sayısının azalmasına da yol açabilir.
Doğrudan ziyaretçi azalırsa, içeriği düzeltip geliştirecek ya da bağış yapacak kişi sayısı da azalır.
Bu sadece reklam gelirinin düşmesi değil, sonunda bağışların da düşeceğinin bir işareti olabilir.
Şu an birçok kişi yapay zekâ aboneliklerine para verirken Wikipedia’yı hiç bakmadan geçiyor.
Bilginin birinci kaynakları ara katmanda tüketiliyor.
Geçmişteki telif ihlali tartışmalarıyla benzer ama bu sefer aktörler sıradan bireyler değil, büyük kâr amaçlı şirketler.
LLM’lerin (büyük dil modellerinin) Wikipedia’da aradığım bilginin %90’ını ikame ettiğini hissediyorum.
Çok daha çeşitli kaynakları entegre edebiliyorlar.
Yine de Wikipedia’ya katkıda (düzenleyerek) bulunmaya devam ediyorum.
Benim düzenlediğim bilgi Wikipedia’da da olsun, LLM’ler üzerinden de tüketsin;
sonunda birine yardımcı olması önemli.
İnsanlar bilgiyi doğrudan sitede tüketmese bile Wikipedia ortadan kalkmaz.
Oysa LLM şirketleri bunu yapmaz.
Google bile zararına çalışarak bunu yapıyor.
Gerçekten “insanlara yardım ediyor” demek zor; tersini düşündürüyor.
Soğukkanlı olursak, sonuçta LLM’lerin Wikipedia’yı tamamen ikame edeceğini düşünüyorum.
Wikipedia’nın katı bürokrasi, takıntılı düzenleme ve önyargı gibi sorunları bir yana bırakırsak,
Wikipedia zaten ikincil kaynakları özetleyip uzlaşıya varan bir insan odaklı özetleme motoru.
Tam da bu alan LLM’nin en iyi yaptığı şeydir.
Yüksek kaliteli kitaplarla eğitilirse Wikipedia kalitesini geçmek de mümkün.
Yapay zekâ özeti ilk cümlesinden bile ana konu net şekilde başlanabiliyor.
Wikipedia’da ise editörler arası siyasi tartışmalar yüzünden ilk cümle bile gereksiz yere karmaşıklaşma eğiliminde.
Tüm bu iddialar doğru olsa bile LLM’lerin bu tür ikincil kaynak özetlerini bir araya getiren bir depoya ihtiyacı var.
LLM’ler anlık olarak binlerce ikincil kaynağı bulup okuyamaz.
Zaten kaybolmuş ya da dijitalleştirilmemiş çok materyal var.
Gelecekte LLM araştırma laboratuvarlarının Wikipedia’ya bağış yaptığı ve yapay zekâ ajanlarıyla düzenleme önerisi ile doğrulama yaptığı bir senaryo mümkün olabilir.
Bu “LLM’ler yerini alacak” fikrine rağmen, Wikipedia’nın var olmaya devam etmesini istiyorum;
insanların kolayca kandırılmayacak biçimde eleştirel düşünmeyi geliştirmesi önemli.
“Yalnızca kaliteli kitaplarla eğitsek yeter” iddiasına katılmıyorum.
Wikipedia’daki pek çok konuda baştan itibaren kaliteli bir kitap yok bile.
Ayrıca o kitapların hangi ölçüte göre “kaliteli” sayılacağı ayrı bir sorun.
Trafik düşüşü sadece Wikipedia’ya özgü değil, diğer web siteleri için de geçerli.
Yapay zekâ, dayandığı bilginin kaynağını bile yok ediyor.
Şu an yapay zekânın altın çağıdır.
Sonraki dönem, daha az iyi birincil kaynak, daha çok yapay zekâ üretilmiş içerik,
ve LLM’lere zarar vermek için kurulan sitelerin dönemi olacaktır.
İlgili tartışma
Bilgi, başlı başına var olan bir şey değil; insanların bunu nasıl örgütlediği meselesi.
Yapay zekâ mevcut bilgiyi çıkarıp giderek daha kullanışlı gösterse de,
bilgi ve bilgi organizasyonunun temeli büyük ölçüde değişmeyecek.
Ancak yapay zekâ aşağıdaki alanlarda organizasyon biçimini değiştirme olasılığına sahip:
Wikipedia’da zaten arka planda çalışan çok sayıda bot var.
Bu tüm işleri yapay zekâ yapsa bile geriye kalan mesele yine insanın (veya başka bir yapay zekâ’nın) yargı alanı olacaktır.
Birden fazla bakış açısı varsa gerçekleri nasıl dengeli ifade ederiz (sayısız editör tartışması deneyimi akla geliyor)
Akıllı telefon/sosyal medya çağında çok sayıda sıradan insan tarihi kaydediyor, bunu nasıl özetleyip düzenleyebiliriz
İnsan/AI’nin her ikisini de uygun biçimde katkı yapmaya teşvik edecek teşvik sistemi nasıl tasarlanır
Wikipedia’nın bağımsızlığı nasıl korunur (jeopolitik mesele)
Eski bir Çin wiki hizmetini yönettiğimde bunu gördüm;
sadece bilgi aramak değil, wiki biçiminin neden gerekli olup korunması gerektiğini
gerçekten düşünen insanların neredeyse hiç olmaması en zorlandığım nokta oldu.
Yapay zekâ kullanarak Wikipedia’yı daha iyi hale getirmeyi seviyorum.
Küçük işler basit yapay zekâ ajanlarıyla yapılabilir.
Örneğin, İngilizce Wikipedia’daki tüm İspanya şehirleri maddelerine gidip
nüfus, belediye adı gibi verileri İspanyolca Wikipedia ile karşılaştırarak daha doğru bilgiyle düzeltmek gibi.
Böyle bir ajan yalnızca taslak hazırlayıp insan editörlerin incelemesi durumunda,
verimli bir şekilde mikro düzeyde bilgi güncellemesi yapılabilir.
Google yapay zekâ özetlerini sunduktan beri benzer durum hemen her web sitesinde görülüyor.
Yapay zekâ etkisi olağan olsa da “sosyal video”nun ne anlama geldiği merak ediyorum.
İnsanlar artık Wikipedia yerine TikTok mu izliyor,
yoksa zaten arama yapmayı tamamen bırakıyorlar mı?
Gerçekte şu sıralar en popüler arama araçları YouTube ve TikTok.
Gen Alpha için TikTok, haber ve bilgi edinmenin en önemli medyası.
Tüm SEO’lu web sitelerinde de aynı şeyin yaşanmasını umuyorum.
İlgili tartışma
Hatta reklamsız iyi sitelere bile yapay zekâ crawler’ları gereksiz trafik ekliyor.
Bu da işletme maliyetini daha da artırıyor.
Ayrıca LLM’lere zarar vermek amacıyla kurulan, sadece bu amaca odaklı sitelerin sayısı hızla artacak.
Sonunda LLM’lerin kendisi de daha pahalı hale gelecek ya da reklam ekleme gibi değişimlere gidecek.
Şu ana kadar Wikipedia, katkı sağlayan sayısının giderek azaldığı bir eğilim gösterdi.
Wikipedia’yı doğrudan okuyanlar azalırsa, katkıda bulunanların azalması da artacaktır.
Yazık ama LLM ile Wikipedia’yı destekleyen, geliştiren ve doğrulayan deneylerin yapılıp yapılmadığını merak ediyorum.
İleride bugünkü tartışma veya düzenleme savaşları,
LLM ajanlarının bir kısmının işbirliği bir kısmının rekabetine dayanan bir mücadeleye dönüşebilir.
Katkıda bulunanların yaptığı çeşitli işlerin tamamını da AI ajanlarıyla verimli şekilde yapmak mümkün olacak.
Kritik olan, a) insan katılımı ve denetimi, b) kötü niyetli davranışı filtreleyen sistemler.
Mevcut işletim yapısında bir sorun var.
Katkıda bulunan biri yeni içerik eklediğinde spamcı, geçerli belgenin bağlantılarını söküp spam bağlantılarıyla değiştiriyor.
Wikipedia botu bu içeriği siliyor.
Katkıda bulunan kişi sonrasında ilgisini kaybediyor.
Wikipedia, çağının bir adım önündeydi ve
bugün de en iyi bilgi derleyicisi olma değeri hala geçerli.
İleride de linklerden oluşan bir bütün olarak uzun süre kalacak gibi duruyor.
Gerçek zamanlı (okuma anında) küratörlük çok daha iyi ama,
geçmişte bu zor ve pahalıydı; şimdi daha uygun fiyatla mümkün.
Bu yüzden Wikipedia, çeşitli gerçek zamanlı küratörlük araçları için veri kaynağı olmaya devam edecek.
Böyle bir kaynak veritabanının varlığı bile birçok yapay zekâ aracının faydasını artırıyor.
Editör tekil bakış açısı veya niyetleri eleştiren seslerin çokluğu anlaşılır.
Ama LLM’in sohbet arayüzü sayesinde etkileşimle bağlamı anlayabilir veya daha derinlere inebilirsin.
Kişisel olarak, bu açık bilgi altyapısının inşasına katılmak bana keyif veriyor.
Sadece bir wiki maddesindeki küçük bir hatayı düzeltmek bile tatmin edici.
Böyle kolayca düzeltilebilen noktalar çok.
Başkası eklediği saçma bir içeriği bile bulmak ve düzeltmek kolay.
Madde örneği
Wikipedia’yı telefona koyup anında aramak gerçekten ucuz.
LLM’ler çok ağır ve çoğu insanın bunları yerelde çalıştırması mümkün değil;
ayrıca özetleme gibi süreçlerde veri kaybı oluyor.
İkisi de telefonda çalışsa gerçekten iyi olurdu ama
veri sahipliği meselesi konusunda da çok kaygı duyuyorum