1 puan yazan GN⁺ 2023-12-24 | 7 yorum | WhatsApp'ta paylaş

Google Arama, büyük çaplı spam saldırısı karşısında bunalmış durumda

  • Google'ın arama sonuçları son birkaç gündür spam saldırısına uğruyor ve durum tamamen kontrol edilemez hale gelmiş durumda.
  • Çok sayıda alan adı yüz binlerce anahtar kelimenin her birinde sıralama alıyor; bu da saldırının ölçeğinin milyonlarca anahtar kelime ifadesine ulaşabileceğini gösteriyor.

Google'ın algoritması nasıl istismar edilebiliyor

  • Spam siteleri, Google'ın web sitelerini sıralama biçimindeki en az üç fırsattan yararlanıyor gibi görünüyor.
  • Spam sitelerinin sıralama aldığı arama sorgularında rekabet düşük olduğu için sıralama almak daha kolay.
  • Yerel arama algoritması, long-tail anahtar kelimeler ve yeni kaydedilmiş alan adlarının kullandığı fırsatlar bulunuyor.
  • Yeni siteler, Google'ın siteyi tanıdığı süre boyunca kısa bir dönem için arama sorgularında sıralama alabilme avantajına sahip.

Bağlantılar, Google'ın spam sitelerini bulmasına yardımcı oluyor

  • Bill Hartzer'ın Majestic backlink aracıyla birden fazla spam sitesinin bağlantı ağını ortaya koyduğu gönderisi sayesinde bu durum fark edildi.
  • Backlink ağı oluşturmak için çok çaba harcanmış olsa da, yüksek sıralamaları belirleyen asıl unsur bağlantılar değil.
  • Bağlantılar, Google'ın yeni spam sitelerini keşfetmesine ve taramasına yardımcı oluyor; böylece bu siteler sonunda sıralama alabiliyor.

Google SERP'lerinde kontrolden çıkan spam

  • Birden fazla site, sıralama alması kolay long-tail ifadeler ve yerel arama bileşeni içeren ifadelerde üst sıralara çıkıyor.
  • Long-tail kavramı neredeyse 20 yıldır var ve 2006'da yayımlanan "The Long Tail" adlı kitapla popülerleşti.
  • Spam siteleri, rekabetin düşük olduğu ifadelerde sıralama alabiliyor ve bunu kullanarak kısa sürede yüz binlerce anahtar kelimede sıralama elde ediyor.

Spam sayfaları nasıl görünüyor

  • Spam sayfalarını tarayıcıyla doğrudan ziyaret etmek mümkün değil.
  • Spam siteleri otomatik olarak başka alan adlarına yönlendiriliyor.
  • Spam sitesini ziyaret etmek ve sayfanın HTML'ini kaydetmek için Google'ın Rich Results test aracı kullanıldı.

Bir alan adı 300.000'den fazla anahtar kelimede sıralama alıyor

  • Bill'in gönderdiği e-tabloda, bir spam sitesinin sıralama aldığı anahtar kelime ifadelerinin listesi yer alıyor.
  • Tek bir spam sitesi 300.000'den fazla anahtar kelime ifadesinde sıralama alıyor.

Bu spam tekniği neden etkili

  • Yerel arama, yerel olmayan algoritmadan farklı bir algoritma kullanıyor.
  • Yerel arama algoritması, yerel türde sitelerin sıralama almasına daha fazla tolerans gösteriyor.
  • Google'ın bu spam sorununu en az 19 Aralık'tan beri bildiği, Danny Sullivan'ın tweet'iyle doğrulanıyor.

GN⁺ görüşü

  • Bu yazıdaki en önemli nokta, Google arama sonuçlarının büyük ölçekli spam saldırılarına karşı savunmasız olması; bunun da arama motorunun güvenilirliğini etkileyebilmesi.
  • Spam saldırılarının etkili olmasının nedeni, Google algoritmasının belirli zayıflıklarından yararlanması; bu da Google'ın algoritmasını geliştirmesi gerektiğini vurguluyor.
  • Yazıyı ilginç kılan şey, yalnızca teknik yönü değil; aynı zamanda Google gibi büyük teknoloji şirketlerinin bile hâlâ beklenmedik sorunlarla karşılaşabildiğini göstermesi.

7 yorum

 
devstudyman7 2024-03-09

Google spam bildirim web belgesi: Spam bildirimi yaparken alan adı abc.abc.uk/trashasda gibi bir şeyse bunu abc.uk olarak bildirip, abc.abc.uk/sitemap.xml adresini sorunu tam olarak tespit edebileceğiniz arama terimine ekleyerek bildirebilirsiniz. Görünüşe göre bu, zaten bir çözümle güçlendirilmiş bir web yapısı; normal kullanıcı eriştiğinde türetilmiş sayfaları hemen yeniden üreten bir yapıya sahip. Müdahale yöntemi olarak aktif şekilde bildirim yapmanız doğru olur; Google tarafında tıklandıkça yeniden spam sayfaları oluşturuluyor ve google.com/url, image.google.com/url, naver redirect gibi yollarla botların erişmesi sağlanıp tekrar oluşturulan spam sayfasına yönlendirilme süreci de var. Bu yüzden bağlantılara tıklamayın; yalnızca linki kopyalayıp bildirmeniz yeterli. google.com/url olarak belirtilen yönlendirme algoritması kaldırılmadığı sürece mevcut sorunun ortaya çıkmaya devam edeceği görülüyor.

 
devstudyman7 2024-03-09

Yukarıdaki spam çözümüne giren web sayfalarını bildiriyorsanız, toplam 5 alanın ilkine ana domaini, ek 4 URL alanına ise bundan türetilerek oluşturulmuş belge listesini yazmanız doğru olur; ayrıca o domainin site haritasını da arama sorgusuna eklemeniz iyi olur. Site haritasını açtığınızda /new/asdasd gibi, erişildiği anda oluşturulacak şekilde bir strateji kurmuşlar; bu yüzden bildirim belgesini hazırladığınızda Google görüntülediğinde kaçan sayfaları ek olarak üretmesini sağlayan, oldukça ince düşünülmüş bir yapı söz konusu. Bu nedenle bildirimi domainin kendisi üzerinden yapmanız gerekir.

 
devstudyman7 2024-03-09

Benim durumumda
(h harfini x ile, / işaretini | ile değiştirdim)

xttp:||baddomain.com
xttp:||baddomain.com/blogs
xttp:||baddomain.com/blogs/asdasd1
xttp:||baddomain.com/asdasd1
xttp:||baddomain.com/asdasd2

Böyle bir rapor hazırlayıp

Eğer alt alan adından başlayarak çürümüş bir şeyse, site:*baddomain.com
anahtar kelimesiyle bu şekilde bir rapor hazırlayıp gönderiyorum.

Sonrasında sitenin kendisi tamamen spam amaçlıysa, oltalama sitesi ihbarını da birlikte yolluyorum.

 
devstudyman7 2024-03-09

Söz konusu spam web sitelerinin yazılımları ironik biçimde tag manager’larla entegre çalışıyor ve https://picsum.photos gibi siteler kullanılmasına rağmen indeksleme normal şekilde yapılıyor. Bu da Google’ın inceleme yapmadığı anlamına geliyor. Spam faaliyetleri normal sınırların ötesine geçmiş olsa bile, spam web sayfalarına + AdWords reklamları bağlı durumdaysa, ne kadar bildirim yapılsa da reklamdan gelen trafik kadar türev sayfalar hızla üretiliyor. Spam web sitelerinin tag manager’ları sorunsuz biçimde kullanıyor olması gerçekten ürpertici olan nokta.

 
devstudyman7 2024-03-09

Bir aydır spam bildirimi gönderiyorum; bunları spam belge, dolandırıcılık belgesi olarak işaretlerken phishing site bildirim sayfasından da birlikte bildirirseniz daha hızlı temizleniyor. O sayfayı da ekliyorum ama en üst düzey alan adı abc.abc.uk ise abc.uk diye girmeniz, alan adının kendisini temizlemeye yardımcı oluyor. Web yöneticileri için günlük bir ödeve dönüşmüş durumda.

 
aobamisaki 2023-12-24

Zaten Google'da eskiden beri arama sonuçlarının genel kalitesinin gözle görülür biçimde düştüğü ortadaydı; böyle kısa sürede bu kadar yoğun saldırıya uğrarsa, pek çok kişi Google arama sonuçlarına daha da az güvenecektir.

 
GN⁺ 2023-12-24
Hacker News görüşleri
  • Spam siteleri Googlebot’un IP adreslerini kontrol ediyor

    • Googlebot olduğu doğrulanırsa o sayfada içerik gösteriliyor
    • Diğer ziyaretçiler şüpheli içerik barındıran başka bir domaine yönlendiriliyor
    • Geçmişte Google, Googlebot’a ve normal kullanıcılara farklı içerik gösteren sitelere izin vermiyordu ve bunu ihlal edenlere ağır cezalar uyguluyordu
    • Bu politika ortadan kalktı, ancak otomatik araçlar iyi çalışıyorsa hâlâ faydalı olabilir
  • Kagi arama motoruna geçen bir kullanıcının deneyimi

    • Bazen iyi arama sonuçları almak zor olabiliyor, ancak Google’da da sonuçlar daha iyi değil
    • Kullanıcı, arama sonuçlarını kişisel tercihine göre ayarlamak için domain’leri "boost" ediyor ve "pin"liyor
    • Hâlâ Gmail ve Google Maps gibi diğer Google servislerini kullanıyor, ancak aramayı artık kullanmıyor
  • Basit soruları yanıtlamak için aşırı miktarda metin sunan sitelerin artışı

    • Asıl yanıt sayfanın alt kısmında yer alıyor
    • Yüzeyde ilgiliymiş gibi görünüyor ama gerçekte genel geçer içerikten ibaret
  • Google arama sonuçlarının kalitesindeki düşüşe dair gözlem

    • Bu eğilimin ne zaman başladığı net değil, ancak uzun süre boyunca yeterince dikkat çekmemiş olabilir
    • Spam saldırıları son aşama olabilir
  • Arama motorlarıyla ilgili soru işaretleri

    • Web taramasına dayalı tek amaçlı arama motoru kavramı ortadan kalkabilir
    • Google’ı belirli amaçlara uygun birden fazla sistemle değiştirmek daha iyi olabilir
    • Örneğin teknik sorular için doğrudan StackOverflow ve GitHub’da arama yapmak, yerel mekânlar için güvenilir veritabanlarında arama yapmak gibi
    • Arama motorları, LLM’leri (büyük dil modelleri) kullanarak arama türünü tahmin edip kullanıcıyı özenle seçilmiş uzmanlaşmış aramalara yönlendirecek şekilde evrilebilir
  • Google’ın arama motoru algoritmasındaki değişikliklere yönelik eleştiri

    • Google bazen algoritmasını değiştirerek site sıralamalarını etkiliyor
    • Bu değişiklikler, belirli sorgularda düşük kaliteli sonuçların üst sıralara çıkmasına yol açabiliyor
    • Geçmişte SEO ile ilgili sitelerde bu algoritma güncellemelerini izlemek ve tartışmak önemliydi
  • Google’ın organik aramadan vazgeçtiği iddiası

    • SEO konusunda yetkin kullanıcılar için bile Google arama sonuçlarındaki sıralamanın nedenlerini anlamak zor
    • Google, ücretli sonuçları daha değerli hâle getirerek kullanıcıları ücretli reklamlara tıklamaya yönlendiriyor
  • Google arama motorunun sınırlarına yönelik eleştiri

    • Belirli bir şeyi ararken faydalı, ama onun dışında Bing, ChatGPT, Phind gibi araçlar kullanılıyor
    • Kullanıcının oyunu Bing ve diğer arama motorlarında üst sıralarda görünürken Google’da spam reklam siteleri öne çıkıyor
  • Bing’e geçiş deneyimi paylaşımı

    • ChatGPT ile güçlenen Bing’in gelişmesiyle Google yerine Bing kullanmaya başlamış
    • Kusursuz değil ama Google’la kıyaslandığında daha tatmin edici sonuçlar veriyor
  • Google’ın bir reklam şirketi olarak davranışına yönelik eleştiri

    • Yeni bir Gmail hesabı oluşturup bunu kimseye bildirmemesine rağmen spam e-postalar almış
    • Google’ın kendi e-posta adresi listelerini sattığını varsaymak makul görünüyor