- Bir kullanıcı, eşinin kendi eser görsellerinin LLM eğitiminde kullanılmasını istemediği için bunları internette yayımlama konusunda tereddüt ettiğini belirtiyor
- Sorunun özü, görselleri önceden işleyerek LLM eğitimini bozacak kütüphane veya yöntemlerin bugün pratik olup olmadığı
- Kullanıcı, eşi için özel bir web sitesini kendisinin yapabileceği düzeyde araçlar olup olmadığını merak ediyor
- Kendisi front-end konusunda çok deneyimli değil, ancak statik site üreticileriyle basit siteler kurabiliyor
- Geçmişte bir grup web sitesi hazırlamak için Eleventy kullanmış, bu yüzden benzer bir şekilde statik site kurmayı düşünüyor
Sorunun bağlamı
- Eşi, kendi eser görsellerini internete koymak istemiyor
- Bunun nedeni, bu görsellerin LLM eğitiminde kullanılmasını istememesi
- Kullanıcı, eser görsellerini önceden işleyip LLM eğitimini zorlaştıracak bir yöntem olup olmadığını araştırıyor
İstenen çözüm şekli
- Eşi için özel bir web sitesini kendisi yapma seçeneğini düşünüyor
- Gerekli koşul, eser görsellerini işleyerek LLM eğitimini engelleyebilecek kütüphane veya yöntemlerin gerçekten var olup olmadığı
- Kendi teknik durumu ise şöyle
- Front-end deneyimi çok fazla değil
- Statik site üreticileriyle basit siteler yapabiliyor
- Daha önce Eleventy ile bir grup web sitesi yapmış deneyimi var
1 yorum
Lobste.rs görüşleri
Güncelleme: cara'ya bakmak faydalı olabilir
Bir sanatçı arkadaşım çalışmalarını oraya yüklüyor ve memnun gibi görünüyor
Sanatçı öncelikli bir yaklaşım benimsiyor, açıkça anti-AI bir duruş sergiliyor ve görsellerin AI eğitimi için kullanılmasını engelleyen bir Glaze entegrasyonu da var gibi görünüyor
Ayrıca kastedilen şeyin LLM değil, büyük olasılıkla difüzyon modeli olduğunu söyleyecektim. LLM'ler metinle çalıştığı için araştırma yaparken yardımcı olabilir
Nightshade'i hatırlıyorum, ama hızlıca kontrol edince 2023/24 civarında çıkmış gibi görünüyor ve bir depo ya da bakım izine rastlamadım
Sanat eserlerini zehirlemenin ya da LLM'lerin erişebileceği eserleri gizlemenin sorunu, bunun ne kadar etkili olduğunu bilmememiz ve muhtemelen asla bilemeyecek olmamız. Çünkü sonuçta her şey bir kara kutuya giriyor
Eserlerinizin LLM'ler tarafından toplanmasını istemiyorsanız birkaç seçeneğiniz var ve her birinin artıları ile eksileri bulunuyor
Bir diğer önemli nokta da, eğitim verisinde yer almak istemiyorsanız muhtemelen arama motorlarında görünmemeyi de istemeniz gerektiği. Ticari arama motorları dizinledikleri içerikle eğitim yapıyor; bu yüzden Google aramasında bulunabiliyorsa aynı içeriğin Gemini'ye de girmiş olma ihtimali yüksek
Sonuçta LLM eğitimi olmadan bir portföy sitesi kurmak istiyorsanız bu zor. Sadece eserlerinizi çevrimiçi koymak istiyorsanız, giriş engeli ya da güçlü crawler savunmaları eğitimde kullanılma ihtimalini epey azaltır. Ne yazık ki bu oran sıfır olmaz ve eserleri gizleyecek ya da toksik hale getirecek, kesin sonuç veren sihirli bir araç yok
Eşinizin sezgisi doğru gibi görünüyor. En azından kamuya açık biçimde, cevaba en yakın şey internete yüklememek
Düşük kaliteli üretim makineleri için yakıt olmak istemiyorsanız, kamusal olarak paylaşamıyorsunuz
Bunu söyleyeceğimi düşünmezdim ama daha güçlü DRM gerekiyor gibi görünüyor. Hatta modelin içine kadar kaynak takibi yapılabilmeli, gerçi böyle bir şeyin var olup olamayacağı da belirsiz
Bunun dışında eşinizin söylediği doğru gibi geliyor ve LLM obfuscation uzun ömürlü bir önlem olmayacak gibi duruyor
Diyelim ki yarasa bile, bunun zaten güçlü olmayan insanların haklarını korumak için dağıtılacağını sanmamak gerekir
Bunu başarmanın tek yolu, sonunda yine kırılacak olsa da, doğrulanabilir donanımın kriptografik enclave'lerini kullanmak olurdu ve bu da kullanıcıların kendi cihazları üzerindeki denetimini giderek daha fazla ellerinden alan bir yöne gider
Ayrıca bu şirketlerin her gün yaktığı para miktarına bakınca, DRM büyük bir engel de olmayacaktır
Sonuç olarak bu, sadece daha fazla sermayesi olan modellerin içeriğe erişebilmesine yol açabilir
DRM'yi nasıl tanımladığınıza bağlı olarak, bu tür obfuscation yöntemlerinin kendisine de DRM denebilir
1,5 yıl kadar önce Glaze'e baktım ve birkaç doğrulayıcı soru sormak için laboratuvarla da iletişime geçtim ama hatırladığım kadarıyla yanıt alamadım
Bu inceleme sırasında çok fazla sınırlama ve çekince gördüm. Şu anki son durum nedir bilmiyorum ama genel amaçlı görsel zehirleme yöntemlerinin çoğu modelde işe yarayacağı konusunda iyimser değilim
Bazı modellerde ve bazı koşullarda Glaze işe yarıyordu