- uBlock Origin üzerinde AI tarafından üretilen içerik çiftliği sitelerini engellemek için açık bir kara liste projesi
- Üretken yapay zeka tarafından yazılan web siteleri çoğu zaman reklamlar ve yönlendirme bağlantılarıyla doludur ve güvenilir olmayan bilgiler içerir
- Kullanıcılar list.txt dosyasına abone olarak veya URL’yi manuel ekleyerek engelleme listesini uygulayabilir
- AI tarafından üretilen sitelerin özellikleri ve tespit ölçütleri somut biçimde sunuluyor ve liste katkıcıların Pull Request’leriyle genişletilebiliyor
- Arama sonuçlarının üst sıralarında görünen AI içerik kirliliğini azaltmak için pratik bir araç olarak kullanılabilir
Projeye genel bakış
- AI uBlock Blacklist, uBlock Origin eklentisinde kullanılabilecek bir AI üretimi içerik engelleme listesi sunuyor
- Üretken yapay zeka tarafından yazıldığı fark edilen web siteleri gezinme sırasında manuel olarak listeye ekleniyor
- Otomasyon aracı kullanılmıyor; çünkü içeriğin AI üretimi olup olmadığını algoritmik olarak belirlemek zor olduğu özellikle belirtiliyor
Projenin amacı
- Üretken yapay zeka tarafından yazılan web siteleri çoğu zaman yararlı bilgi açısından zayıf ve reklamlar ile yönlendirme bağlantıları üzerinden gelir elde etmeye odaklı
- AI tarafından yazılmış içerikler inceleme olmadan toplu biçimde yayımlandığından tehlikeli bilgiler içerebilir
- Örnek olarak devre kısa devresi,
rm -rf / komutunun çalıştırılması, çamaşır suyu ile amonyağın karıştırılması gibi tehlikeli tavsiyeler verebileceği belirtiliyor
- Bu nedenlerle AI üretimi içerik güvenilir kabul edilmiyor ve engellenmesi gerektiği savunuluyor
- Proje sahibi İtalyan olduğu için listede çok sayıda İtalyanca site bulunuyor; diğer dillerdeki sitelerin eklenmesine yönelik katkılar da memnuniyetle karşılanıyor
Web sitesi ekleme yöntemi
- Teknik bilgisi olmayan kullanıcılar şüpheli siteleri GitHub Issue üzerinden bildirebilir
- Doğrudan Pull Request ile ekleme yapılacaksa, alan adı düzeyinde ya da belirli bir blog yolu düzeyinde engelleme uygulanabilir
- Örnek:
||example.com/@slopUser^$doc veya ||example.com^$doc biçimi
- SEO ve dijital pazarlama hizmeti satan kuruluşlar birden fazla içerik çiftliği işletiyorsa, ilgili sitelerin birlikte eklenmesi öneriliyor
AI içerik çiftliklerini tanımlama ölçütleri
- Gereksiz giriş ve sonuç bölümleri, ‘Comprehensive Guide’ gibi abartılı başlıklar, harici bağlantı ve kaynak eksikliği, çok sayıda yönlendirme bağlantısı
- Kısa sürede binlerce gönderi, yanlış bilgi (halüsinasyon), Kasım 2022 sonrası yayımlanmış içerikler, AI üretimi görseller ve logolar
- Dağınık biçimlendirilmiş metin, render edilmemiş Markdown söz dizimi, konuyla ilgisiz uzun paragraflar, arama sonuçlarında tekrar tekrar üst sıralarda görünme
- İletişim bilgilerinin olmaması, muğlak bir tanıtım sayfası, AI övgüsü yapan içerikler de başlıca işaretler arasında sayılıyor
Google Dorks kullanımı
- AI tarafından üretilen cümleler aynen kopyalanıp yayımlandığında, belirli ifadeler aranarak AI sayfaları bulunabiliyor
- Örnek:
"Sure! Here's an article about" (İngilizce), "Certo! Ecco un articolo" (İtalyanca)
- Bu tür ifadeleri içeren sayfalar için alan adının tamamı kara listeye ekleniyor
Benzer projeler
1 yorum
Hacker News görüşleri
Bu fikir ilginçti ve ben de listeye katkıda bulunmaya çalışmıştım ama FAQ’daki “Cry about it” ifadesini görünce vazgeçtim
Böyle bir tavrın herkese açık bir blacklist yönetme biçimi olarak uygun olmadığını düşünüyorum. Bakıcının kendisinin hatasız olduğuna inandığı izlenimini veriyor
Kaldırılması için talepte bulundum ama hiç yanıt alamadım ve hâlâ engelli
Daha gerçekçi bir yaklaşım olarak yalnızca içerik çiftliklerini veya düşük kaliteli siteleri engelleyen yeni bir liste ortaya çıkmış
Mevcut geniş kapsamlı AI engelleme listelerine göre daha iyi bir alternatif gibi duruyor
Bkz. uBlockOrigin-HUGE-AI-Blocklist
Reddit’te de ilgili tartışma oldukça canlı
Arama sürecini ve listeyi gist’imde paylaştım
Zaman geçtikçe yanlış pozitif sorunu daha ciddi hale geliyor. Domain satılabiliyor, siteler yön değiştirebiliyor ya da içerikler silinebiliyor
“Cry about it” gibi bir tavır ancak bir iftira kara deliği üretir. En azından bir sona erme veya yeniden inceleme mekanizması gerekli
Ublock Origin’de zaten “AI widget” engelleme listesi var. Bu özellik sayesinde hâlâ Firefox kullanıyorum. Chromium’da bir işe yaramıyor
İlkeye katılıyorum ama “AI ile yazmak beceri eksikliği” gibi bir tavır Grammarly kullanıcılarına veya ana dili İngilizce olmayan kullanıcılara haksızlık
Yine de bu projenin hedefi bireysel yazarlar değil, içerik çiftlikleri olduğu için konu biraz farklı
Listeyi hazırlayan kişi daha çok AI bot çiftliklerini hedefliyor gibi görünüyor
Yine de internette henüz bir whitelist ortaya çıkmadı
Yazının AI ile yazılıp yazılmadığını tropes tabanlı olarak tespit edip özgün prompt’u geri oluşturan bir araç kullandığını söyleyenler vardı
tropes.fyi/aidr
Bu yönelim iyi görünüyor. Site kategorilerine göre daha çeşitli engelleme seçenekleri olabilse keşke
Kurumsal ortamlarda URL itibar servisleri üzerinden siteler sınıflandırılıyor ve erişim kontrol ediliyor
Bireysel kullanıcıların da böyle crowdfunding tabanlı bir altyapıya ihtiyacı olduğunu düşünüyorum
Örneğin tarayıcı, VPN, DNS, e-posta ve sertifika otoriteleri gibi güvenilir bir ekosistem için yıllık 1 milyar dolarlık kâr amacı gütmeyen bir fon harika olurdu
botblock.ai gibi Twitter’da AI yanıtlarını tespit eden eklentiler de var
Kanıt görseli
Ben reklam çok fazlaysa siteyi doğrudan kapatıyorum. Reklam yerleşimi makulse kullanmaya devam ediyorum
Adblock savaşlarından bıktım. Her seferinde yeni bir eklenti adı çıkıyor ve bu sonsuz bir yarış gibi hissettiriyor