1 puan yazan GN⁺ 3 시간 전 | 1 yorum | WhatsApp'ta paylaş
  • AI Overviews ve ChatGPT gibi yapay zeka destekli arama yanıtları, tek bir web sayfası ya da gönderiyle bile sağlık ve finans gibi hassas konularda önyargılı hale getirilebiliyor
  • BBC’nin deneyinde, kişisel bir sitedeki tek bir yazı ChatGPT ve Google’ın yazarı dünya şampiyonu sosisli sandviç yeme yarışmacısı olarak yanıtlamasına yol açtı
  • Yapay zeka web arama sonuçlarını toplayıp tek bir yanıt sunduğunda, kullanıcılar bunu birden çok bağlantıyı karşılaştırdıkları klasik aramaya kıyasla doğru cevapmış gibi kabul etmeye daha yatkın oluyor
  • Google, yapay zeka yanıtlarını manipüle etmeyi açıkça spam politikası ihlali olarak tanımladı; kuralları çiğneyen siteler arama sonuçlarından kaldırılabilir veya sıralamada düşürülebilir
  • Manipülasyon yapanlar blog denetiminden kaçıp YouTube fenomenleri gibi kanallara yönelebileceğinden, yapay zeka yanıtlarına olduğu gibi güvenmemek gerekiyor

Yapay zeka arama yanıtlarının manipülasyonu sorunu

  • ChatGPT, Gemini ve Google Search’ün üst kısmındaki AI Overviews, sağlık ve kişisel finans gibi önemli konularda bile önyargılı yanıtlar verecek şekilde manipüle edilebiliyor
  • BBC’nin araştırmasında, kişisel bir web sitesine yüklenen tek bir yazıyla ChatGPT ve Google’ın yazarı “dünya şampiyonu sosisli sandviç yeme yarışmacısı” olarak yanıtlaması sağlandı
  • Aynı yöntemin, tıbbi takviyelerle ilgili sağlık kaygılarını olduğundan daha küçük göstermek ya da emeklilikle ilgili finansal bilgileri etkilemek için de kullanıldığına dair işaretler var
  • SEO ve yapay zeka arama danışmanı Lily Ray, yapay zekanın “tek bir doğru cevap” sunduğu bir ortamda kullanıcıların, geleneksel aramadaki gibi birden çok bağlantıyı karşılaştırmak yerine yanıtı olduğu gibi kabul etmeye daha yatkın olduğunu düşünüyor
  • Google, üretken yapay zeka arama özelliklerinde de mevcut spam önleme politikaları ve korumaları uyguladığını, ayrıca yapay zekadan önce de yeni yöntemlere karşı spamla mücadeleyi güçlendirdiğini söylüyor

Manipülasyon nasıl çalışıyor?

  • Tipik chatbot yanıtları modele gömülü verilere dayanıyor, ancak ChatGPT, Claude ve Google’ın yapay zeka ürünlerinde olduğu gibi internet taranarak yanıt üretildiğinde manipülasyon riski büyüyor
  • Yapay zeka araçları bilgiyi tek bir web sayfası ya da sosyal medya gönderisinden aldığında, iyi hazırlanmış tek bir sahte gönderi bile yanıtı kirletebiliyor
  • Çevrimiçine yalnızca ustaca hazırlanmış bir blog yazısı koymak bile yapay zekanın kamuya aktardığı içeriği değiştirebiliyor
  • Bu tür manipülasyon hızla bir para kazanma fırsatı olarak görülmeye başlandı ve hatalı ya da önyargılı bilgiler oy verme, hizmet sağlayıcı seçimi, tıbbi tavsiye ve hukuki değerlendirmeler üzerinde etkili olabiliyor
  • Harpreet Chatha, ekonomik etkilerin yanı sıra yanlış tıbbi tavsiyeler nedeniyle durumun kötüleşmesi veya kişi ve bölgenin yasalarına uymayan davranışlara yönelinmesi riskine dikkat çekiyor

Google’ın politika değişikliği ve karşı hamlesi

  • Dünya genelinde 1 milyardan fazla kişi düzenli olarak yapay zeka chatbotları kullanıyor ve her ay 2,5 milyar kişi Google’ın AI Overviews özelliğini görüyor; bu yüzden bu araçlar bozulabiliyorsa etkisi son derece büyük
  • Google geçen hafta spam politikasını güncelleyerek yapay zeka yanıtlarını manipüle etme girişimlerinin şirket kurallarını ihlal ettiğini resmen doğruladı
  • Kuralları ihlal eden şirketler veya web siteleri Google arama sonuçlarından kaldırılabilir ya da sıralamada geriye düşürülebilir
  • Google, bunun yaklaşım değişikliği değil bir “netleştirme” olduğunu belirtti ve 2025’te AI Overview ve AI Mode ile ilgili spam önleme çalışmalarını zaten açıklamıştı
  • Ancak sosisli sandviç deneyi neredeyse bir yıl sonra bile başarılı oldu ve Lily Ray de bu hafta Google’ın bir SEO uzmanını kumdan kale yapımında usta biri olarak yanıtlamasını sağlayan benzer bir deney gerçekleştirdi

Gözlenen değişimler ve sınırlamalar

  • Ray ve Chatha’ya göre son aylarda Google ve diğer şirketlerin çözüm denediğine işaret eden bazı değişiklikler görülüyor
  • Google ve ChatGPT, belirli bir şirketin kendini övmesini şüpheli bulduğunda, o şirketi yapay zeka yanıtlarından sessizce çıkarmış gibi görünen örnekler var
  • Örneğin bir yazı kendisinin en iyi sosisli sandviç yeme yarışmacısı olduğunu iddia ediyorsa, yapay zeka bu yazıyı kaynak gösterse bile o adı adaylar arasından çıkarabiliyor
  • Google ve diğer yapay zeka araçlarının, chatbot’un emin olmadığını göstermek için yanıtlara daha fazla belirsizlik etiketi eklediği durumlar da gözlemleniyor
  • ChatGPT ve Anthropic’in Claude’u, bazı sorgularda spamı filtrelemeye çalıştıklarını açıkça belirtmeye başladı; Anthropic ise Claude’u geliştiren şirket
  • Ray, Google’ın belirli satın alma kararlarıyla ilgili sorularda daha fazla ipucu eklediğini ve üçüncü taraf incelemeleri kontrol etmeyi önerdiğini de gördüğünü söylüyor
  • OpenAI ve Anthropic yorum yapmayı reddetti, Google sözcüsü ise bu değişimlerle ilgili soruları yanıtlamadı

Manipülatörlerle platformlar arasındaki bitmeyen kovalamaca

  • Chatha, bu değişikliklerin tek başına yeterli olmayacağını söyleyerek Google’ın yanıtını köstebek vurma oyununa benzetiyor
  • Google manipülatif blog yazılarını hedef aldığında, şirketler kendini övmenin daha gizli yollarını buluyor
  • Web sitelerine ceza verilebilir, ancak bir ürünün en iyisi olduğunu söylemeleri için 20 YouTube fenomenine ödeme yapılmasını engellemek çok daha zor
  • Google’ın yapay zekası artık YouTube videolarını da kaynak gösterdiği için, manipülasyon yöntemleri başka mecralara taşınıp bu döngü sürebilir
  • Şimdilik manipülatörlerin bir adım önde olma ihtimali yüksek ve en iyi savunma, yapay zekanın doğru da olsa yanlış da olsa tek bir yanıtı kendinden emin biçimde sunan bir araç olduğunu hatırlamak
  • Yanıt büyük teknoloji şirketlerinin arayüzü üzerinden geliyor diye, rastgele bir web sitesinden mutlaka daha güvenilir olduğunu varsaymamak gerekiyor

1 yorum

 
GN⁺ 3 시간 전
Hacker News görüşleri
  • Google, en azından 2006’da Blekko varken bile arama dizinindeki spam çöplüğünü düzgün filtreleyemiyordu; bu yüzden bu sorunu da iyi durduracağını sanmıyorum
    Yine de bu, “AI”ın sonuçta yalnızca gösterişli şekilde paketlenmiş arama olduğuna ve arka planda çıkarım ya da düşünme yaşanmadığına dair bir başka iyi örnek gibi görünüyor

    • Bence o sonuca pek varılamaz. Daha iyi bir ifade yoksa, bu daha çok LLM’lerin “kolay kandırılması”na benziyor
      İnternette okuduğuna hemen inanan insanlardan ne farkı var ki? İnsanlar da sürekli spam ve dolandırıcılığa kanıyor, ama bu onların sadece gösterişli paketlenmiş arama olduğu anlamına gelmiyor ;-)
      Yine de tüm arama motorlarının karşı karşıya olduğu sorun çok net görünüyor. Yapay zeka üretimi spam’i geleneksel istatistiksel yöntemlerle engellemek çok daha zor olacak; prompt injection gibi varoluşsal soruna gelmeden önce bile bu böyle
      Belki de bu noktada medya kuruluşları Big Tech karşısındaki ilişkilerinde hak ettikleri yeri yeniden kazanabilir. LLM’lerin körü körüne güvenebileceği doğrulanmış ve editoryal denetimden geçmiş bilgi kaynakları haline gelmeleri mümkün; OpenAI / Atlantic gibi anlaşmalar da bu anlama geliyor olabilir
    • Yeni kod üretimini gösterişli paketlenmiş aramayla açıklamanın zor olduğunu düşünüyorum
      Bir ajan sisteme birkaç veri sayfası okutabilir, sonra proje gereksinimlerini anlatıp sürücü spesifikasyonlarını, protokolü, arayüzleri ve durum makinesini tasarlatabilirsiniz. Buradan bir uygulama planı çıkarabilir, sonra uygulama iskeletini yazdırıp doldurarak yeni donanım kombinasyonlarında çalışan bir sistem elde edebilirsiniz
      Doğru yapıldığında, eskiden küçük bir ekibin üreteceğinden daha bakımı kolay ve daha küçük bir kodu 1/100 maliyetle ve 1/4 sürede elde ediyorsunuz
      Bu her neyse, aramadan çok akıl yürütmeye benziyor. Tabii yeni donanımda bare-metal C geliştirmeye de arama derseniz, o zaman tüm geliştirme aramadır
    • Vintage lensler hakkında bir video ve Reddit gönderisi paylaşmıştım ve lensin ne kadar eski olduğunu anlamaya çalışıyordum
      LLM, “1940’larda üretildi” gibi bir tarih verdi ve kaynak olarak benim yazımı gösterdi; o yazıda ise üretim yılına dair hiçbir bilgi yoktu
    • Google’ın bu sorunu çözme kapasitesi fazlasıyla vardı ve aslında o kadar da zor değil
      Sorunun zor kalmasının nedeni, çözümlerin çoğunun reklam gelirini ciddi biçimde azaltacak olması
    • Google’ın AI Overview özelliği, arama parçalarını RAG ile alıp çok hızlı bir LLM’in özetlemesi gibi görünüyor. Buna gösterişli paketlenmiş arama demezdim
  • Bu başlıktaki en tuhaf varsayım, Google’ın AI yanıtlarının doğru olmasını istediği fikri
    Kullanıcının sayfadan ayrılmamasına yetecek kadar doğru olması yeterli. “Gerçek” hiçbir zaman ürün değildi; ürün, kullanıcıları SEO’ya para harcamaya yöneltmekti

    • Bu bana pek doğru gelmiyor. SEO’nun büyük kısmını üçüncü taraflar yapıyor
      Ürün reklam gösterimi ve Google uzun zamandır reklam dışındaki arama sonuçlarına ilgi duymuyor. Yine de modelin itibarıyla ilgileneceklerini sanıyorum ve bu olay gerçekten etki edebilir
  • Manipüle edilen sonucun şu sorgu olduğunu görünce biraz rahatladım
    2026 South Dakota International Hot Dog Eating Champion
    Eğer Nathan’s yarışmasının kazananına dair özeti değiştirmiş olsalardı çok daha ciddi olurdu. İnsanların gerçekten aradığı sorguların manipüle edildiği daha fazla örnek göstermiş olsalardı da öyle olurdu
    Şu an bu, hayali bir South Dakota sosisli yeme yarışması için sahte bir Wikipedia sayfası oluşturup sonra da Wikipedia’ya güvenilemeyeceğine dair yazı yazmaya benziyor. Düşününce, 2005 civarında da biri böyle bir yazı yazmış olabilir

    • Evet. Bu, tek bir kişinin yapabileceklerinin bu düzeyde olduğu anlamına geliyor
      Reddit, sosyal medyanın büyük kısmı ve siyasi çıkar için Wikipedia’yı manipüle etme girişimlerine ne kadar çok kamuoyu yönlendirme gönderisi yüklendiğini düşününce, bu oldukça gerçek bir sorun
    • Haberde şu da vardı: “Ama araştırma, aynı yöntemin tıbbi takviyelerle ilgili sağlık endişelerini göz ardı ettirmek ya da emeklilikle ilgili olarak Google AI’ın sunduğu finansal bilgileri etkilemek için de kullanıldığını ortaya koydu”
      Bu, sosisli sandviçten çok daha kaygı verici
    • Benimse tam tersine kaygım hemen arttı. Gemini son zamanlarda her turda bir arama spinner’ı göstermeye başladı
      Bu da aramaya bağlı tüm yanıtların prompt injection’a açık olabileceği ve fiilen neredeyse tüm yanıtların bu riski taşıdığı anlamına geliyor
      Bu, link spam’i gibi viral biçimde yayılacak. Kullanıcı üretimi içerik barındıran her site bir prompt injection barındırıcısı olabilir. Sorun, bunların linklerden çok daha zor tespit edilmesi
    • Birinin AI Overview içine sahte müşteri destek telefon numarası sokmayı başardığı bir olaya tanık oldum
      Google’ın bunu düzeltmesi bir hafta sürdü ve yöntem, arama sonuçlarını kirletip kendi verisini daha yüksek güven katmanında görünen bir kaynağa, muhtemelen bir devlet sözleşmesi web sitesine, yerleştirmekti. Böylece bizim numara yerine dolandırıcı numarası gösterildi ve sorgu da basit bir aramaydı
    • “20 dakikada ChatGPT ve Google’ı kandırıp halka benim dünya şampiyonu sosisli yeme yarışmacısı olduğumu söylettim. Şaka aptalcaydı ama sorun ciddi”
      Bu, Wikipedia sayfasına kamuoyu manipülasyonu yerleştirmekten daha kötü. Wikipedia’da kaynaklar ve inceleme sistemi açık ve kamuya görünür. Dolandırıcılık amaçlı bir düzenlemeyi uzun süre orada tutmak pratikte oldukça zor; on yıllardır bununla savaşan çok sayıda insan editörü kandırmanız gerekir. Doğru ve yararlı olmaya çalışsanız bile o kapalı topluluğun içine girmek zordur
      Buna karşılık Google’ın arama parçacıkları her tür veriyi umutsuzca emip otomatik olarak işliyor ve hangi bilginin iyi, hangisinin spam olduğuna karar veren algoritmik sistem tamamen kapalı
      Bunun nasıl kötüye kullanılacağını hayal etmek için büyük bir hayal gücü gerekmiyor. Kendi adınızı aradığınızda utanç verici bir içerik çıkarsa ne olacak? Potansiyel işverenlerin, müşterilerin veya arkadaşların kaynak doğrulamada Wikipedia editörleri kadar titiz olmasını beklemek zor
  • “Tıbbi takviyelerle ilgili sağlık endişelerini göz ardı ettirmek ya da emeklilikle ilgili olarak Google AI’ın verdiği finansal bilgileri etkilemek için aynı yöntemin kullanıldığı”na dair somut örnekleri okumak istedim, ama makaledeki ilgili bağlantı şu anda aşağıdaki yerel dosyaya gidiyor
    file:///Users/GermaTW1/BBC%20Dropbox/Thomas%20Germain/A%20Downloads%20and%20Documents/2026/And%20there's%20evidence%20that%20AI%20tools%20are%20being%20manipulated%20on%20a%20wide%20scale.

    • BBC’de son zamanlarda bu tür hatalar birkaç kez oldu; daha da kötüsü, düzeltildikten sonra artık yayınlanmış makalede düzeltme kaydı bırakan bir not da eklemiyorlar
    • Kullanıcı adı ya da e-posta adresi için hep first.last@company kullandığım için, last[:5]initials# biçimi bana çok tuhaf geldi. Oldukça garip görünen kullanıcı adları çıkacaktır
  • Bugünlerde pek çok aktör bir şeyleri “sessizce” yapıyor gibi görünüyor. İnternetteki her metnin LLM’leşmesi çıldırtıcı hale geliyor

    • Benim de sinirimi bozuyor ama başlık yazarları ve editörler LLM’lerden çok önce “sessizce” ifadesine bağımlıydı. Çevrimiçi gazetecilik uzun zamandır bu tür klişelerle dolu
    • Gerçekten nefret ediyorum. Dün bir tarih subreddit’inde AI tarafından yazılmış bir tarih yazısı okudum ve kaynakların hepsi uydurma Hollywood filmleri gibi görünüyordu
      O filmleri izlediğim için fark ettim ama bu, kaliteli bilgi açısından internetin bozulduğuna dair çok net bir işaret
    • “Sessizce” yeni bir LLM kalıbı değil
    • Bu klişenin özü aslında sessizce yapılması gereken bir şeyi açıkça söylemiş olman
  • Bu sadece SEO’nun bir sonraki aşaması. Belki buna AIO denir
    Aramada olduğu gibi Google ve AI sağlayıcıları karşı önlemler çıkaracak, optimizasyon şirketleri açık bulacak ve bu da yeniden yamalanacak; sonsuz bir savaş olacak. Sonuçta mesele pazarlama için dikkat çekmek

    • Pazarlama dünyasında buna genelde GEO deniyor. Generative Engine Optimization, bazen de Answer Engine Optimization; bunu hizmet olarak satıp ciddi para kazananlar da var
      https://www.wired.com/story/goodbye-seo-hello-geo-brandlight...
    • Engineered Inference Ersatz Intelligence Optimization, kısaca EIEIO
    • Bir sonraki aşama değil, zaten mevcut aşama bu
  • Google AI Overview’a hiç güvenilmez. Örneklem büyüklüğü 1 olan şeyi bile AI özetine koyabiliyor
    Bunu nasıl biliyorum? Google sonuçları da AI Overview da olmayan son derece niş bir konuda Reddit’e yorum yazdım. Ertesi gün kendi Reddit yazımı bulmak için arama yaptığımda, Google benim Reddit yanıtımı neredeyse kelimesi kelimesine AI “overview” kutusuna kopyalamıştı. Bağlanan yazı da sadece benim yazımdı ve Google sonuçlarında da yalnızca o vardı

    • Dahası, orijinal gönderide hiç olmayan bir bağlamı da kullanıcının soruş biçimine göre sarıp sunuyor. Bu yüzden de doğrudan yanlış oluyor
      Örneğin “nadir eşya X’in en yaygın ölçüsü nedir?” diye aradığınızı düşünün
      Ama o eşyanın kendi versiyonuna ait ölçüyü veren yalnızca bir kişi var ve bunun tipik olduğunu söylememiş, tipik bir ölçü varmış imasında da bulunmamış. Üstelik aynı şeyi söyleyen 20 kişi de yok; gerçekten sadece bir kişi
      Buna rağmen Google büyük bir rahatlıkla “genellikle eşya X [söylediğiniz ölçüde] olur ve bunun nedeni de [tamamen uydurma bir neden]” diyebilir
  • Google’a what's the name of the whale in half moon bay harbor? diye sorarsanız, bir buçuk yıl önce benim oldukça amatörce yaptığım dizin kirletme denemesi sayesinde AI özetinde hâlâ Teresa T kendinden emin şekilde yer alıyor
    https://simonwillison.net/2024/Sep/8/teresa-t-whale-pillar-p...

    • Az önce Brave Search ile denedim
      Genç kambur balinanın adının Teresa T olduğunu söyledi ve bunun resmi bir devlet kurumu adı olmasa da halk, yerel medya ve bölge sakinleri tarafından yaygın biçimde benimsendiğini ekledi. Ayrıca Marine Mammal Center ve California Academy of Sciences uzmanlarının strese girmemesi için balinayı izlediğini ve halka en az 100 yarda mesafe korumalarını tavsiye ettiğini de yazdı
      Az çok iyi bildiğim konulardaki deneyimime göre ilk yanıt bazen ciddi biçimde yanlış oluyor. Brave aracında genelde 3-4 kez itiraz ederseniz sonunda “tamamen haklısınız” demesini sağlayabiliyorsunuz. Teresa T vakasında da aynı oldu
      İkinci soruda adın kaç kaynağa dayandığını sorduğumda bile “ABC7 News” ve “NBC Bay Area”nın bu adı “tekrarladığında” ısrar etti. Üçüncü kez somut bağlantılar isteyince bunun “resmi olmayan medya bağlamında” kullanıldığını kabul etti ve dördüncüde S.W.’nin bir deney yaptığını söyleyince 21 gün önceki yorumunuzu buldu
      Gelecek, çocuklarını gerçek özel öğretmenlerle eğitebilecek elit sınıfa ait. Proletarya içinse bu geçmişe dönüş demek
    • Google’ın AI yanıtlarını manipüle etmeye çalıştığınız için size ihtar mektubu göndermesinden korkmuyor musunuz?
  • Daha birkaç yıl önce bile Google, “Marilyn Monroe JFK’yi hangi yıl vurdu?” sorusuna kendinden emin biçimde 1963 diye yanıt veren bir şirketti. Marilyn’in 1962’de öldüğünü düşününce etkileyici
    Dolayısıyla bu yeni değil ve Google’ın “sessiz karşı hamlesi” yarım yamalak, etkisiz bir tepki olmaya mahkûm. Yine de çoğu insanın bunu umursamayacağı muhtemel

  • Sonuçta Google’ın web arama sonuçlarına biraz kalite kontrol uygulaması gerektiği söyleniyor; oysa bunu zaten başından beri yapıyor olması gerekirdi
    Ancak modelin itibarı zarar gördükten sonra çaba göstermeye başlamaları komik