29 puan yazan xguru 2024-05-29 | 3 yorum | WhatsApp'ta paylaş
  • Kısa süre önce anonim bir kaynaktan, Google'ın arama API belgelerinin büyük ölçekte sızdırıldığına dair bir e-posta alındı
  • Belgelerin gerçekliği eski Google çalışanları tarafından doğrulandı ve bazı eski Google çalışanlarıyla yapılan görüşmelerden ek bilgiler de eklendi

Başlıca iddialar

  • Google, tıklama tabanlı kullanıcı sinyallerini kullanmadığını defalarca reddetmişti, ancak sızdırılan belgeler bunu çürütüyor
  • Alt alan adlarını ayrı değerlendirmediği, yeni web siteleri için bir sandbox olmadığı ve alan adı yaşını dikkate almadığı yönündeki Google iddiaları da yanlışlanıyor
  • Google arama ekibi, en başından beri arama sonuçlarının kalitesini artırmak için çok sayıda web kullanıcısının clickstream verisine (tarayıcıda ziyaret edilen tüm URL'ler) ihtiyaç duyuyordu
  • DoJ tarafından alıntılanan NavBoost sistemi, Google Toolbar PageRank üzerinden veri topluyordu ve daha fazla clickstream verisi elde etmek için Chrome tarayıcısının geliştirilmesindeki başlıca motivasyondu
  • NavBoost, belirli anahtar kelimeler için arama sayısını, arama sonucu tıklamalarını, kısa ve uzun tıklamaları analiz ederek kullanıcı niyetini değerlendiriyor; video veya görsellere çok tıklanıyorsa, ilgili NavBoost sorguları için video ya da görsel özelliklerini tetikliyor
  • Tıklama verisinin kullanımı: Google, çerez geçmişi, oturum açılmış Chrome verisi ve örüntü tespiti kullanarak manuel ve otomatik tıklama spam'ini engelliyor; kullanıcıların tıklama ve etkileşimlerini analiz ederek bunları arama sonuçlarına yansıtıyor
  • Site kalitesi değerlendirmesi: NavBoost verisi, sitenin genel kalitesini değerlendirmekte kullanılıyor (Panda olarak adlandırılıyor) ve bu değerlendirmeye göre sıralama yükseltiliyor/düşürülüyor
  • NavBoost, tıklama verisini coğrafi veriyi de dikkate alarak ülke ve eyalet/il düzeyinde ayırıp değerlendiriyor
  • COVID-19 ve seçimlerle ilgili arama sonuçlarında whitelist uygulanarak belirli siteler öncelikli gösteriliyor

Belgelerin güvenilirliğinin doğrulanması

  • Bunların bir kısmı Google/DOJ davasında ortaya çıkan bilgilerle örtüşüyor, ancak çoğu yeni içerik
  • Anonim kaynak 28/5 tarihinde kimliğini açıkladı; bu kişi Erfan Azimi (SEO uzmanı)
  • Eski Google çalışanlarının doğrulaması: Üç eski Google çalışanından ikisi belgelerin güvenilirliğini doğruladı
  • Teknik inceleme: Teknik SEO uzmanı Mike King belgeleri inceleyip güvenilir olduklarını doğruladı

Google API Contents Warehouse ?

  • Bu API belgelerinin amacı: Google ekip üyelerinin, projelerde kullanılabilecek veri unsurlarını anlamasına yardımcı olmak
  • Sızıntı yolu: GitHub'da kısa süreliğine herkese açık hale geldi ve bu sırada belgeler sızdırıldı

Başlıca bulgular

#1: NavBoost ve tıklama verisinin kullanımı

  • Tıklama verisi filtreleme: Google, sıralama sisteminde dikkate alacağı tıklama verisini filtreliyor, tıklama süresini ve gösterimleri ölçüyor.
  • Sıralama sistemine dahil etmek istemediği tıklamaları ayıklayıp, dahil etmek istediklerini dahil etme yöntemlerine sahip
  • Tıklama süresini (örneğin arayan kişi bir sonuca tıklayıp bulduğu yanıttan memnun kalmayarak hızlıca geri tuşuna basıyorsa) ve gösterim sayısını ölçtüğü anlaşılıyor

#2: Chrome tarayıcısı clickstream kullanım

  • Chrome clickstream verisi: Google, Chrome tarayıcısındaki tıklama verisini Sitelinks'i (ilgili web sitesindeki popüler URL'ler) belirlemek için kullanıyor

#3: Seyahat, COVID ve siyasetle ilgili whitelist

  • Whitelist varlığı: Seyahat, COVID ve seçimlerle ilgili arama sonuçlarında belirli alan adları öncelikli gösteriliyor

#4: Kalite değerlendirici geri bildirimlerinin kullanımı

  • Kalite değerlendirici verisi: Kalite değerlendiricilerin puanlamalarının arama sisteminde doğrudan kullanılıyor olma ihtimali var

#5: Bağlantı sıralama ağırlığını belirlemede tıklama verisinin kullanımı

  • Bağlantı dizini sınıflandırması: Tıklama verisi kullanılarak bağlantı dizini yüksek kaliteli, orta kaliteli ve düşük kaliteli olarak sınıflandırılıyor

Pazarlamacılar için başlıca çıkarımlar

  • Marka önemi: Google büyük markaları sıralamada öncelikli olarak yansıtıyor
  • E-E-A-T unsurlarının öneminde azalma: Bazı SEO uzmanlarının vurguladığı deneyim, uzmanlık, otorite ve güvenilirlik unsurları doğrudan sıralamaya yansımıyor olabilir
    • Experience, Expertise, Authoritativeness, Trustworthiness
  • Kullanıcı niyeti ve tıklama örüntüleri, içerik ve bağlantılardan daha önemli sıralama faktörleri
  • PageRank, anchor text gibi geleneksel sıralama faktörlerinin önemi azalıyor
  • SEO'nun zorluğu: KOBİ'ler ile yeni içerik üreticileri/yayıncılar için SEO'da büyük markalarla rekabet etmek daha da zorlaşıyor

3 yorum

 
yangeok 2024-06-09

O zaman geri düğmesinin çalışmasını tamamen engellesek nasıl olurdu, haha

 
wkang586 2024-06-03

Belirsiz bir şekilde tahmin ediyorduk ama her şeyin önümüze serilmiş halini görünce insanın beyni yanıyor...
Navboost'a kadar bir ölçüde kabul edebilirim gibi geliyor ama...
Whitelist gerçekten şok edici. Adı whitelist diye hoş geliyor olabilir ama aslında apaçık bir ayrımcılık politikası.

 
xguru 2024-05-29

Sızdırılan Google Content API Warehouse belgeleri
https://hexdocs.pm/google_api_content_warehouse/0.4.0/…