-
Amazon’un yapay zeka tarayıcısı yüzünden Git sunucum kararsız hale geldi
-
Destek blogu: Blogu beğeniyorsanız Patreon üzerinden Xe’yi destekleyebilirsiniz
-
Patreon aboneliği: EthicalAds reklamı
-
Düzeltme (2025-01-18 23:50 UTC): Gitea sunucusuna istekleri kabul etmeden önce çalışma kanıtı kontrolü yapan bir proxy yazdım. Adı Anubis ve yakında bununla ilgili bir blog yazısı yayımlayacağım. Şimdilik https://git.xeserv.us/ adresinde görülebilir. Biraz kaba ama yeterince iyi çalışıyor
-
Düzeltme (2025-01-18 19:00 UTC): Vazgeçtim. Gitea sunucusunu VPN’in arkasına taşıdım. Sunucuyu botlardan korumak için çalışma kanıtlı bir ters proxy üzerinde çalışıyorum. Yakında tekrar erişime açacağım
-
Düzeltme (2025-01-17 17:50 UTC): Ingress yapılandırmasına şu parçayı ekledim:
nginx.ingress.kubernetes.io/configuration-snippet: | if ($http_user_agent ~* "(Amazon)" ){ return 418; }Bot hâlâ başka IP’lerden saldırıyor. İsteklerin yaklaşık %10’unda amazonbot user-agent yok. Sonra ne yapmam gerektiğini bilmiyorum. Gelecekten nefret ediyorum
-
Yardım çağrısı: AmazonBot’u işleten kişiden
git.xeserv.usalan adını engellenen alan adları listesine eklemesini istiyorum. Amazon’da tanıdığınız biri varsa lütfen bu mesajı iletin. Git sunucumu tarayacaksanız, donanım yükseltme maliyetine denk bir ödeme yapabilmeniz için benimle iletişime geçin. Gitea sunucusunu kamuya kapatmak istemiyorum ama gerekirse yapacağım. Yapay zeka tarayıcı botlarını engellemek anlamsız. Botlar yalan söylüyor, user-agent değiştiriyor ve konut IP adreslerini proxy olarak kullanıyor. İsteklerin durmasını istiyorum -
robots.txtdosyasını zaten tüm botları engelleyecek şekilde yapılandırdım:User-agent: * Disallow: /Daha ne yapmam gerektiğini bilmiyorum
1 yorum
Hacker News görüşü
Bir avukattan "açık bir ihtarname" hazırlamasını isteyip bunu Amazon'a ileterek sorunu çözmeyi deneyebilirsiniz
Web sitesine insanların ziyaret etmeyeceği bağlantılar ekleyip bunları robots.txt içinde yasaklayarak yapay zeka tarayıcılarını engelleme yöntemi öneriliyor
Yapay zeka ve SEO botları robots.txt'ye neredeyse hiç uymuyor ve engellenmeleri zor
Amazon dışında başka bir aktörün yapay zeka tarayıcısı kılığına giriyor olma ihtimali var
Kişisel sunucularda yapay zeka tarayıcıları nedeniyle CPU kullanımının aniden yükselmesi sorunu yaşanıyor
Yapay zeka tarayıcılarını engellemek yerine zararlı içerik sunarak sorunun çözülebileceğini düşünenler var
Bunun Amazon kılığına girmiş bir DDoS saldırısı olabileceği de öne sürülüyor
Pinboard sitesi de yapay zeka tarayıcıları nedeniyle trafikte büyük artış yaşayıp çöktü
Amazon'un AWS kredisi vererek trafik aşımı maliyetlerini telafi etmesi gerektiğini düşünenler var
Nginx ile engelleme yapılandırılmadan önce Bytespider ve Amazonbot toplam trafiğin %80'ini oluşturuyordu