Son zamanlarda LLM bağlantılı servislerden gelen aşırı trafik nedeniyle yaşanan zarar örnekleri ara ara görülüyor; aslında bunun böyle bir tür için bir önlem olarak da görülebileceğini düşünüyorum. Örneğin ChatGPT'nin web arama özelliğine bakınca, kullanıcı havuzunun yapısı gereği 'kötü niyetli olmayan' aşırı trafik üretme ihtimali epey yüksek; bunların basit bir agent eşleştirmesiyle kolayca ayıklanabildiğini duydum. Eğer gerçekten amaç buysa, bu sadece boşu boşuna OpenAI'nin sunucu masrafını (ve itibarını?) tüketen bir yol olur tabii..
Belirttiğiniz User-Agent olsun ya da asıl yazıda geçen IP tabanlı tespit olsun, kimlik bilgileri taklit edilebildiği için bunun kötü niyetli olup olmadığını kesin olarak söylemenin zor olduğu konusunda size katılıyorum. Gerçekten kötü niyetli botlar muhtemelen çok daha sinsi yöntemlerle yaklaşacaktır.
Bana göre bu tür saldırılardansa, yük sınırı olan bir crawling API sunup meşru otomatik erişime izin verirken sunucu kaynaklarını da korumak, daha gerçekçi bir "dürtme" yaklaşımı olabilir. :D
Resmen... akıllara durgunluk veriyor... Ücretliye dönse bile para verip kullanılır kalitede.
İlgi duyduğum konuları podcast formatında dinleyince bilgiyi daha büyük bir ilgiyle ediniyorum.
Gerçekten çok iyi
Elbette kamusal bir alan olmadığı için, üzerinde çok düşünmeden paylaşılmış bir yazı da olabilir.
Toplulukta da çok düşünmeden yorum yapılabildiği gibi.
Ben crawler'ları tamamen engelleyemeyeceğime göre, en iyisi baştan deneme isteği bile almamak olurdu; beni meraklandıran şey, dikkat çekme niyetinin ne olduğuydu.
Bunun etik açıdan iyi bir yöntem olmamasının nedeni nedir? Merak ediyorum
Kargo hırsızlarına simli bomba veren bir yazı gibi geldi, keyifle okudum :)
Sadece böyle bir yöntem de var, değil mi..
Vay... inanılmaz gerçekten. Bu kadar doğal olması...
Son zamanlarda LLM bağlantılı servislerden gelen aşırı trafik nedeniyle yaşanan zarar örnekleri ara ara görülüyor; aslında bunun böyle bir tür için bir önlem olarak da görülebileceğini düşünüyorum. Örneğin ChatGPT'nin web arama özelliğine bakınca, kullanıcı havuzunun yapısı gereği 'kötü niyetli olmayan' aşırı trafik üretme ihtimali epey yüksek; bunların basit bir agent eşleştirmesiyle kolayca ayıklanabildiğini duydum. Eğer gerçekten amaç buysa, bu sadece boşu boşuna OpenAI'nin sunucu masrafını (ve itibarını?) tüketen bir yol olur tabii..
Vay, bilgi gerçekten çok net anlaşılıyor...
Etik açıdan pek iyi bir yöntem değil. Ayrıca temel bir çözüm de değil.
İlginç bir yazıymış! Hiç düşünmediğim bir yöntemdi, paylaştığınız için teşekkürler!
Ooo~ umut verici görünüyor.
Bu aralar Google’ın sadece foundation model performansı iyileşmedi; bu tür hizmetlerle entegrasyon tarafı da bence çok iyi görünüyor.
Vay be;; bu inanılmazmış
https://freederia.com/researcharchive/
Bu, AI Scientist sitesidir.
Bu tür bir yönelim, daha çeşitli yönlerin daha da teşvik edilmesini sağlayacaktır.
Ödül, kişinin özerkliğini ihlal ettiğinde içsel motivasyonu zedelersözü gerçekten etkileyici geliyor banaBelirttiğiniz User-Agent olsun ya da asıl yazıda geçen IP tabanlı tespit olsun, kimlik bilgileri taklit edilebildiği için bunun kötü niyetli olup olmadığını kesin olarak söylemenin zor olduğu konusunda size katılıyorum. Gerçekten kötü niyetli botlar muhtemelen çok daha sinsi yöntemlerle yaklaşacaktır.
Bana göre bu tür saldırılardansa, yük sınırı olan bir crawling API sunup meşru otomatik erişime izin verirken sunucu kaynaklarını da korumak, daha gerçekçi bir "dürtme" yaklaşımı olabilir. :D
Resmen... akıllara durgunluk veriyor... Ücretliye dönse bile para verip kullanılır kalitede.
İlgi duyduğum konuları podcast formatında dinleyince bilgiyi daha büyük bir ilgiyle ediniyorum.
Gerçekten çok iyi
Denedim, gerçekten inanılmaz....
Paralı kullanacak olsam sanırım sadece Liger kullanırım. Benzer hizmetler için etkisi büyük olacaktır.
Elbette kamusal bir alan olmadığı için, üzerinde çok düşünmeden paylaşılmış bir yazı da olabilir.
Toplulukta da çok düşünmeden yorum yapılabildiği gibi.
Ben crawler'ları tamamen engelleyemeyeceğime göre, en iyisi baştan deneme isteği bile almamak olurdu; beni meraklandıran şey, dikkat çekme niyetinin ne olduğuydu.
Vay canına, harika.
Kişisel bir blog bu; insan istediği şeyi yazamaz mı? 🤔
Sürüm değişiklikleriyle nasıl başa çıkıyorsunuz?