2 puan yazan GN⁺ 1 시간 전 | 2 yorum | WhatsApp'ta paylaş
  • Pokémon Central Wiki, 15 yılı aşkın süredir İtalyanca Pokémon bilgileri için başlıca kaynaklardan biriydi, ancak şu anda Google arama sonuçlarından neredeyse kaybolmuş durumda
  • wiki.pokemoncentral.it, MediaWiki tabanlı büyük bir wiki olmasına rağmen site: araması kelimenin tam anlamıyla yalnızca 4 sonuç döndürüyor
  • İndekslemedeki sert düşüş, Mart 2026 core update civarında başladı ve Search Console'da toplu halde "crawled - currently not indexed" görünüyor
  • Bing, DuckDuckGo ve diğerleri normal şekilde indekslediği için bunun Google'a özgü bir sorun olduğu düşünülüyor; Google belgelerine göre Google-Extended engeli indekslemeyi etkilememeli
  • Sunucu ve Cloudflare ayarları, Open Graph ve schema.org etiketleri, SWR gibi optimizasyonlar uygulandı ancak henüz sonuç alınamadı ve neden hâlâ belirsiz

Google arama indekslemesinde sert düşüş

  • Pokémon Central Wiki, 15 yılı aşkın süredir İtalyanca Pokémon bilgileri için en bilinen kaynaklardan biriydi, ancak artık Google arama sonuçlarında neredeyse hiç görünmüyor
  • wiki.pokemoncentral.it, Wikipedia'da kullanılan açık kaynak yazılım MediaWiki ile çalışıyor ve Wikistats verilerine göre dünya çapındaki en büyük 500 MediaWiki kurulumundan biri
  • PCW, içinde Bulbapedia'nın da bulunduğu uluslararası wiki ağı Encyclopaediae Pokémonis'in bir parçası
  • İçeriklerin önemli bir kısmı izin alınarak Bulbapedia'dan çevrildi ve bu çalışmaya binlerce gönüllü insan katkı verdi
  • Diğer EP wikileri, topluluk kontrolleri ve site: aramaları temelinde normal biçimde indeksleniyor
  • PCW için site:http://wiki.pokemoncentral.it araması yapıldığında şu anda yalnızca 4 sonuç dönüyor
  • Birkaç hafta önce, Mart 2026 core update civarında, Google Search Console'da çok sayıda sayfa "crawled - currently not indexed" durumunda görünmeye başladı
  • Google yalnızca bu sayfaların ileride indekslenebileceğini ya da edilmeyebileceğini gösteriyor; somut bir neden sunmuyor

İncelenen olası nedenler ve alınan önlemler

  • Bunun içerik kalitesindeki düşüşten ya da operasyonel bir sorundan kaynaklandığını düşünmek zor
    • Editoryal politika değişikliği, kötüye kullanım ya da kalite düşüşü yaşanmadı
    • Eğer 5xx hataları gibi tamamen teknik bir sorun olsaydı, bunun Google Search Console'da farklı bir şekilde görünmesi beklenirdi
  • Sorun yalnızca Google'a özgü görünüyor
    • Bing, DuckDuckGo ve diğer arama motorları PCW'yi normal şekilde indeksliyor
  • Cloudflare üzerinden yapay zeka eğitimi için kullanılan scraper'lar engelleniyor
    • Kullanıcı sorgularında PCW'yi kaynak ya da referans olarak kullanmak isteyen AI botları engellenmiyor
    • robots.txt içinde Google-Extended engelleniyor, ancak Google belgelerine göre bunun arama indekslemesini etkilememesi gerekiyor
  • Cloudflare'ın managed challenge özelliği yalnızca sayfa geçmişi, teknik sayfalar gibi indeksleme açısından kritik olmayan bölümlere uygulanıyor
    • Bu bölümler robots.txt içinde açıkça izinli değil
    • Bu sayfaları önbelleğe almak zor ve sunucu kaynaklarını yoğun kullanıyorlar
    • Botlar dakikada binlerce istek göndererek sunucuda aşırı yük oluşturuyor
  • Site hızını artırmak için sunucu ve Cloudflare ayarları düzenlendi
    • Son birkaç haftada uygulanabilecek dürüst SEO ve optimizasyon en iyi uygulamaları hayata geçirildi
    • Claude Code ile Open Graph ve schema.org etiketleri tekrar tekrar iyileştirildi
    • Cloudflare SWR çalışır hâle getirilerek isteklerin büyük kısmının sunucuya uğramadan edge üzerinde milisaniyeler içinde sunulması ve arka planda yeniden doğrulanması sağlandı
  • Ancak bu değişiklikler henüz sonuç vermedi
    • Değişikliklerin etkisinin görülmesi haftalar sürebilir ve Google'ın şeffaf olmaması yüzünden gerçek etkinin olup olmadığını hemen doğrulamak zor
  • Olası tahminlerden biri, Google'ın algoritmasını ayarlarken yapay zeka çağında PCW'nin “içerik kalitesini” yeterli görmemiş olması
    • LLM'ler, engellemeden önce PCW metinleriyle zaten eğitilmiş olabilir
    • PCW içeriğini büyük ölçüde aynen kopyalayan diğer siteler hâlâ arama sonuçlarında kalmaya devam ediyor
    • PCW içeriği CC BY-NC-SA lisanslı olduğu için, genel olarak kopyalanması başlı başına bir sorun sayılmıyor
  • Sadık ziyaretçiler durumu anlayamadıkları için soru soruyor ve Reddit üzerinde de bununla ilgili bir gönderi açılmış durumda
  • Şimdilik kullanıcıların doğrudan erişebilmesi için wiki.pokemoncentral.it adresini yer imlerine eklemeleri öneriliyor
  • Amaç, Google içinde kontrol edebilecek birilerine ulaşıp ne olduğunu anlayabilmek

2 yorum

 
xguru 1 시간 전

Sanırım bu gerçekten Google tarafındaki bir sorun. Benim de işlettiğim çeşitli sitelerde aynı şey oluyor.
Google hiçbir neden olmadan indeksleme yapmıyor. Bir gün yapabilir deniyor ama o gün gerçekten ne zamansa o zaman gibi görünüyor.

 
GN⁺ 1 시간 전
Hacker News görüşleri
  • Google bizden nefret etmiyor; daha kötüsü, bize karşı ilgisiz gibi duruyor
    Nefret etmesi için en azından farkında olması gerekirdi. Bu tek olay kendi başına çok anlamlı olmayabilir ama genel olarak Google tuhaf bir yöne gidiyor. Bir zamanlar son teknolojiydi, ama 20 yıl içinde kaliteyi hissedar kârına feda eden bir başka dev şirkete dönüşmüş gibi görünüyor
    Arama motoru olarak artık işe yaramıyor. Gerçekte aradığım şeyden önce üstte tanıtım linkleri çıkıyor. Kagi'ye geçtikten sonra bir daha dönüp bakmadım
    Yapay zeka tarafında da iyi değil. 5 saat sonra sıfırlanan rastgele kullanım sınırları ve yüzdeyle gösterilen haftalık kota var; tam bir şeffaflık yoksunluğu. Kagi'de kullanım ayrıntılarında ne kadarım kaldığı açıkça görünüyor. Bu arada Kagi çalışanı değilim, sadece memnun bir müşteriyim
    Bulut depolama için de pek iyi değil. Birlikte çalıştığım paylaşılan klasörlerin bir yerinde bir spam kullanıcısı ya da ele geçirilmiş hesap mı var bilmiyorum ama düzenli olarak yetişkin içerik bildirimleri gönderiyor. Bunu yaşayan tek kişi de ben değilim(https://www.reddit.com/r/techsupport/comments/1azf25v/myster...). Apple iCloud'a geçip kapattım konuyu
    Mail fena değil. 22 yıldır kullandıktan sonra artık hayatımda çok kritik olmayan bir yere attım. Önemli şeyleri zaten Avrupa merkezli sağlayıcılara taşımıştım

    • Deli gibi gelebilir ama son çare olarak Yandex kullanıyorum ve Google'ın artık göstermemeye karar verdiği şeyleri bulmakta iyi sonuç veriyor
      DDG'yi de denedim ama benim kullanımımda Google'dan bile kötüydü
    • Google Maps'te belirli bir restoranı aradığımda, sanki genel olarak aç biri olduğumu varsayıyor
      Az önce A&W aradım, Tim Hortons, Popeyes ve McDonald's da çıktı. Apple Maps bunu asla yapmıyor. Yine de açık olup olmadığını ve çalışma saatlerinin doğru olup olmadığını öğrenmek için genelde Google'ı kullanıyorum
    • Kagi harika
      Buna rağmen Google gibi dev bir şirketin AlphaFold ya da ondan biraz daha az ölçüde Gemma gibi ücretsiz ama mükemmel araştırmaları yayımlaması hâlâ etkileyici. Zamanımızın ATT PAC Bell'i ya da IBM'i gibi görünüyor
    • Tanıtım linkleri çığırından çıkmış durumda; ilk 5-6 link çoğu zaman reklam gibi görünüyor
    • Kagi AI'ın nasıl kullanıldığını merak ediyorum
      Arama hizmeti için bir yıldır ödeme yapıyorum ama sunduğu AI özelliklerine daha bakmadım
  • Wiki olduğu için olabilir. Bugünlerde wiki spamcıları çok inatçı
    Yardımcı olarak yönettiğim, 10 bin oyuncunun altında kalan pek bilinmeyen küçük bir oyun wikisi bile yakın zamanda yeni kayıtları kapatmak zorunda kaldı. Spam çok ağırdı ve CAPTCHA desteklemeyen eski bir MediaWiki sürümüne bağlıydık
    Popüler bir wiki ise, ki burası da epey popülermiş gibi görünüyor, yalnızca CAPTCHA ile wiki spamcılarını durdurmak zor olabilir. Eğer spamcılar sadece basit “cinsel güç hapı alın” çöpleri değil de kötü amaçlı yazılım sitelerine linkler de eklediyse, Google'ın o wikiyi böyle zararlı içeriklerin kaynağı olarak görmesi bir ölçüde anlaşılabilir olabilir
    Asıl gönderiyi yazan kişinin yapabileceği çözüm, wikideki zararlı içeriği kapsamlı biçimde denetleyip temizledikten sonra Google'a itiraz etmek gibi görünüyor. Tabii Google olduğu için cevap verse bile muhtemelen aylar sürer
    Sonuçta bu işle ilgilenen Google ekibinde bir İtalyan Pokémon hayranı yoksa durum epey umutsuz görünüyor

    • Yeni hesap yetki kısıtlamaları, iyi ayarlanmış Cloudflare kuralları ve son değişiklikleri sürekli devriye gezen adanmış gönüllülerden oluşan bir ekiple anti-bot sistemi işletiyoruz
      37 binden fazla sayfa içinde neredeyse hiç ziyaret edilmeyen bir yerde tek bir spam linki olma ihtimalini dışlayamam ama bunun dizinden çıkarılma nedeni olduğunu düşünmek zor. Öyle olsaydı Google Search Console'da da görünürdü diye sanırım
    • Proje, özel otomasyon yazılacak kadar tanınmış hale gelirse spamle savaşmanın fiilen bir yolu kalmıyor
      Yeterince küçükse kayıt akışına standart dışı tek bir adım koymak bile genelde tüm spam botlarını savuşturur. Örneğin yalnızca kitlenin bilebileceği statik bir görsel ya da ses koyup “bot değilim” açılır menüsünden doğru seçeneği istetmek ya da ilk gönderi/düzenleme için ek bir e-posta doğrulaması istemek ya da YouTube'daki uzun bir videonun belli bir anındaki cevabı sordurmak gibi. Standart dışı olduğu sürece her şey işe yarıyor
      Otomasyonun %99,9'u bozuluyor ve arama sonucu manipülasyonu yapan spamcılar belirli bir wiki ya da forum için özel otomasyon yazmıyor
      Site çok ünlüyse tabii ki bu sonsuz bir silahlanma yarışı oluyor. Bu noktada Hashcash gibi bir şey kullanıp her seferinde ciddi CPU/GPU/RAM harcatırsanız spamcılar sizi doğrudan kara listeye alabilir
    • Birkaç gün önce burada biri rutin olarak Captcha AI botları kullandığını söylemişti; bir çözümün maliyetinin 0,003 dolar olduğunu yazmıştı
      Bu yüzden CAPTCHA'lı yeni sürüm olsa bile yardımcı olmayabilirdi
    • CAPTCHA spamcılara karşı hiçbir şey yapamıyor
      Kayıt sırasında e-posta alan adlarını engellemek bende oldukça iyi sonuç vermişti. Listem https://www.rejectionwiki.com/index.php?title=MediaWiki:Emai... adresinde. MediaWiki'nin yerleşik özelliği olduğu için çoğu sürümde gayet iyi çalışacaktır
    • Bu wikinin spamle kaplandığını söylemek için bir dayanak var mı, yoksa sadece üstünkörü bir tahmin mi yapılıyor bilmiyorum
      Twitter dizisinde AI çöplüğü içerikle dolu olmadığını açıkça söylediler ve “tarandı ama dizine eklenmedi” olarak işaretlenmiş sayfaların listesini kontrol ettiklerini ama istismar izi bulamadıklarını belirttiler
      Yönettiğiniz wikide spam saldırısı yaşayıp irkilmiş olmanızı anlıyorum ama kendi wikinizde olanı öbürüne genellemek pek mantıklı değil
  • Dürüst olmak gerekirse bunun Google tarafında bir özensiz bug olma ihtimali yüksek
    Aramada neden-sonuç ilişkileri gecikmeli ilerler ve bir web sitesinin %0,1'inin tarama ya da dizinleme dışında kalmasına yol açan küçük bir hata yapmak, bunun yaşandığını fark etmekten çok daha kolaydır. Özellikle etkilenen site size söyleyene kadar
    marginalia'da benzer bir bug yaşamıştım. Kök yol HEAD desteklemiyor ama Range başlığıyla GET destekliyor ve HTTP 206 ile doğru yanıt veriyorsa, o site dizine girmiyordu. Çünkü ilk keşifte kök belge sorunlarını kontrol eden kod bunu hata durumu olarak değerlendiriyordu
    Aralık isteklerini destekleyen sitelerin çoğu HEAD'i de destekler. Bu genelde belgelerin dinamik olarak üretilmediği anlamına gelir. Ama bazı Caddy tabanlı yapılandırmalar, yani sunucuların yaklaşık %0,3'ü istisnaydı

    • Ya da bir AI bunun gösterilmemesi gereken türden içerik olduğuna karar vermiş olabilir
      Böyle bir sınıflandırmanın kusursuz olması mümkün değil
    • Dizindeki sayfa sayısı 511 binden 11'e düştüyse bu bayağı ciddi bir özensizlik olur
  • Google veriyi zaten çekip modelleri eğitmeyi bitirdiyse neden web sitesine trafik göndersin ki
    İçerik üreticileri ve meşru web siteleri bir kez kullanılıp atılmış oldu

    • Google'ı bu şekilde kişileştirmek gerçekçi değil
      Yalnızca Google'ın arama ekibi bile binlerce kişiden oluşuyor ve hepsi web'i daha az erişilebilir değil daha erişilebilir kılmaya yönelik geniş bir misyon altında farklı işler yapıyor. İçlerinden herhangi birinin yaptığı bir dağıtım bu tür yan etkilere yol açmış olabilir
      Kasıtlı bir politika uygulaması olma ihtimali var ama olasılığı çok düşük görünüyor
    • Ben de aynısını düşündüm. Bu verilerin önemli bir kısmı zaten sabit ve durağan değil mi
      Derlem işlevsel olarak zaten tamamlandıysa düşük değerli şeyleri sürekli yeniden tarayıp dizinlemenin neden gerekli olduğunu bilmiyorum
    • Bu ifadeyi okurken David Bowie'nin Suffragette City parçasını dinliyordum
      Bowie, “wham bam, thank you ma’am” ifadesini popülerleştiren kişilerden biriydi sanırım
    • Bu, son 20 yıldır reklam engelleyici kullanıcılarının yaptığı şeyin aynısı değil mi
      Eksi oy vermek farkı açıklamayacak
      Reklam engelleyici kullanıcılarının üreticilerin gelirini engellediği söylendiğinde, 1996 internetinin de gayet iyi olduğu ya da internete içerik koyuyorsanız ödül beklememeniz gerektiği ya da bunun kendi bilgisayarları olduğu ve neyin yükleneceğine karar verebilecekleri söylenirdi. O mantıklar nereye gitti
  • Birkaç hafta önce aynı şey benim blogumun başına da geldi
    Yıllardır iyi referans verilen bir blogdu ama bir anda neredeyse tüm yazılar artık dizine eklenmemeye başladı. Search Console'da URL'nin tarandığı ama şu anda dizine eklenmediği yazıyor ve teknik bir sorunun aksine benim düzeltebileceğim bir şey yok. Artık yazılarımın çoğunun Google ile bulunamayacağını kabullenmem gerekiyor
    Aslında ilgili olduğunu sanmıyorum ama dönüp bakınca içeriğimi LLM eğitimi için kullanmalarını engellemek amacıyla TDMRep ayarlamaya başladığım zamanla denk geliyor

    • Ben de aynı durumdayım. Kişisel blogumu 20 yıldan uzun süredir yürütüyorum ama geçen yıl Google'da bloguma ait tek bir link bile bulamıyordum
      Google Search Console'a baktığımda tüm linklerin “tarandı ama dizine eklenmedi” durumunda olduğunu gördüm ve herhangi bir neden verilmemişti
    • Google sitenin eğitim verisini zaten emdiyse, dizine eklememek Google Arama'yı site keşfi için kullanan rakiplere karşı bir tür hendek olabilir
  • Gerçek bir topluluk sitesi kurmak klasik bir SEO hatasıymış
    Reddit başlıkları, kupon alt klasörleri ve AI özetleri yapmalıydınız. Şaka bir yana, umarım yakında toparlanır

  • Hatta Google hepimizden nefret ediyor bile denebilir

    • Google ne bizden nefret ediyor ne de bizi seviyor
      Bir kurum olarak tek umursadığı şey mümkün olduğunca çok reklamı mümkün olduğunca çok insanın önüne itip giderek daha absürt para yığınları oluşturmak
      Bu Google'ı savunmak için söylenmiş bir şey değil. Google, neredeyse tüm büyük şirketler gibi tamamen sosyopatik
  • Bu arada Google OpenCV'den de nefret ediyor
    Eskiden kolayca bulunabilen şeylerde bile, örneğin “opencv orb” aratınca artık sayfa sayfa spam site çıkıyor. Temelde “OpenCV'yi burada öğrenin!” türü blog spam'i
    “docs.opencv.org” için ilk sonuç kelimenin tam anlamıyla 4. sayfada çıkıyor, o da 9 yıllık 3.4 sürümünü gösteriyor
    Benim istediğim sayfa olan https://docs.opencv.org/4.13.0/dc/dc3/tutorial_py_matcher.ht... ise hiçbir yerde yok

    • Abonelik geliriyle finanse edilmeyen ürünlerde enshittification yüzünden duvardaki yazı bir süredir belliydi diye düşünüyorum
      Parayla oy verin ve reklamveren odaklı değil müşteri odaklı daha iyi ürünlere geçin
      Ergenlik ve genç yetişkinlik dönemimde Newgrounds'ta gezinirken sunucu masraflarını ödeyen insanlara minnet duyardım. Bir gün düzenimi kurup biraz fazladan param olunca benden sonrakiler için ben de ödeyeceğime söz vermiştim; beklediğimden uzun sürdü ama neredeyse 10 yıldır bunu yapıyorum
      Bu yüzden böyle bir kültürü normalleştirmeyi tavsiye ederim. Yani ücret ödeyebilen belli bir müşteri oranı sayesinde ödeyemeyenlere ücretsiz erişimin korunabildiği ya da büyümenin desteklenebildiği bir yapı. Newgrounds gibi harika sitelerde on binlerce kişinin programlama ve animasyon kariyerinin başladığını ya da en azından ilham aldığını düşünüyorum; toplumsal olarak da net etkisi çok olumlu oldu
    • Google'da OpenStack dokümantasyonu için de benzer sorunlar yaşamıştım
  • Dün yapılan açılış konuşması ve Search değişikliklerine bakınca yakın gelecekte Google'ın web sitelerine trafik göndermeyi bırakacağı çok açık görünüyor
    Arama sonuçları sadece Gemini yanıtlarının dipnotları olacak

  • Wikiler SEO açısından yüksek riskli
    Kişisel wikimi dizine sokmak bile o kadar zordu ki neredeyse vazgeçiyordum; bu konularda daha bilgili bir arkadaşım gereken tüm ayarları yerli yerine koymama yardım ettiği için ancak oldu
    Dikkatli olmazsanız insanlar sitenin her yerine kolayca spam yerleştirebilir ve bu da arama motorlarındaki görünürlüğü gerçekten mahveder
    Yine de Google gerçekten çok büyük. Gerçekten, gerçekten büyük. O kadar büyük ki Google içindeki insanlar bile bu tür konularda Google nezdinde tam güvenilen kişiler değil
    Ama bu, Google'ın genel olarak wikilerden nefret ettiği anlamına gelmiyor. Sadece yapılması gereken çok iş var; wikide spam olmadığından emin olmanız, meta tag bilgilerini doldurmanız, sitemap.xml bulundurmanız ve benzeri şeyler gerekiyor. Benim wiki örneğim burada: https://wiki.roshangeorge.dev/w/images/8/89/Screenshot_-_Goo...