Günümüzde eser görsellerinin LLM eğitimini engelleme yöntemleri neler?

(lobste.rs)

1 puan yazan GN⁺ 4 시간 전 | 1 yorum | WhatsApp'ta paylaş

Bir kullanıcı, eşinin kendi eser görsellerinin LLM eğitiminde kullanılmasını istemediği için bunları internette yayımlama konusunda tereddüt ettiğini belirtiyor
Sorunun özü, görselleri önceden işleyerek LLM eğitimini bozacak kütüphane veya yöntemlerin bugün pratik olup olmadığı
Kullanıcı, eşi için özel bir web sitesini kendisinin yapabileceği düzeyde araçlar olup olmadığını merak ediyor
Kendisi front-end konusunda çok deneyimli değil, ancak statik site üreticileriyle basit siteler kurabiliyor
Geçmişte bir grup web sitesi hazırlamak için Eleventy kullanmış, bu yüzden benzer bir şekilde statik site kurmayı düşünüyor

Sorunun bağlamı

Eşi, kendi eser görsellerini internete koymak istemiyor
- Bunun nedeni, bu görsellerin LLM eğitiminde kullanılmasını istememesi
Kullanıcı, eser görsellerini önceden işleyip LLM eğitimini zorlaştıracak bir yöntem olup olmadığını araştırıyor

İstenen çözüm şekli

Eşi için özel bir web sitesini kendisi yapma seçeneğini düşünüyor
Gerekli koşul, eser görsellerini işleyerek LLM eğitimini engelleyebilecek kütüphane veya yöntemlerin gerçekten var olup olmadığı
Kendi teknik durumu ise şöyle
- Front-end deneyimi çok fazla değil
- Statik site üreticileriyle basit siteler yapabiliyor
- Daha önce Eleventy ile bir grup web sitesi yapmış deneyimi var

1 yorum

GN⁺ 4 시간 전

Lobste.rs görüşleri

Güncelleme: cara'ya bakmak faydalı olabilir
Bir sanatçı arkadaşım çalışmalarını oraya yüklüyor ve memnun gibi görünüyor
Sanatçı öncelikli bir yaklaşım benimsiyor, açıkça anti-AI bir duruş sergiliyor ve görsellerin AI eğitimi için kullanılmasını engelleyen bir Glaze entegrasyonu da var gibi görünüyor
Ayrıca kastedilen şeyin LLM değil, büyük olasılıkla difüzyon modeli olduğunu söyleyecektim. LLM'ler metinle çalıştığı için araştırma yaparken yardımcı olabilir
Nightshade'i hatırlıyorum, ama hızlıca kontrol edince 2023/24 civarında çıkmış gibi görünüyor ve bir depo ya da bakım izine rastlamadım
Sanat eserlerini zehirlemenin ya da LLM'lerin erişebileceği eserleri gizlemenin sorunu, bunun ne kadar etkili olduğunu bilmememiz ve muhtemelen asla bilemeyecek olmamız. Çünkü sonuçta her şey bir kara kutuya giriyor
Eserlerinizin LLM'ler tarafından toplanmasını istemiyorsanız birkaç seçeneğiniz var ve her birinin artıları ile eksileri bulunuyor
1. İnternete hiç yüklememek. Çok basit, ama yalnızca başka hiç kimse de internete yüklemezse işe yarar. Bir kitapsa, tarama gibi başka yollarla AI şirketleri yine elde edebilir
2. Sadece üyelik ve giriş sonrasında çevrimiçi erişime açmak. İlgilenen insanlar erişebilir, genel amaçlı LLM'ler ise erişemez. Tabii bunun da, birilerinin giriş engelini kaldırıp yeniden paylaşmayacağı varsayımına dayandığını unutmamak gerekir
3. Güçlü crawler savunmalarının arkasında yayınlamak. Kendi aracım olduğu için söylemesi biraz garip ama iocaine gibi bir şeyi sitenin önüne koyarsanız birçok crawler'ı engelleyebilirsiniz. Hepsini değil, ama eğitim verisine girme olasılığını ciddi biçimde azaltacak kadarını engeller ve normal ziyaretçiler için de büyük bir engel oluşturmaz
  Bir diğer önemli nokta da, eğitim verisinde yer almak istemiyorsanız muhtemelen arama motorlarında görünmemeyi de istemeniz gerektiği. Ticari arama motorları dizinledikleri içerikle eğitim yapıyor; bu yüzden Google aramasında bulunabiliyorsa aynı içeriğin Gemini'ye de girmiş olma ihtimali yüksek
  Sonuçta LLM eğitimi olmadan bir portföy sitesi kurmak istiyorsanız bu zor. Sadece eserlerinizi çevrimiçi koymak istiyorsanız, giriş engeli ya da güçlü crawler savunmaları eğitimde kullanılma ihtimalini epey azaltır. Ne yazık ki bu oran sıfır olmaz ve eserleri gizleyecek ya da toksik hale getirecek, kesin sonuç veren sihirli bir araç yok
Eşinizin sezgisi doğru gibi görünüyor. En azından kamuya açık biçimde, cevaba en yakın şey internete yüklememek
- Hoş değil ama insan yaratımının genel olarak düştüğü durum da bu gibi görünüyor
  Düşük kaliteli üretim makineleri için yakıt olmak istemiyorsanız, kamusal olarak paylaşamıyorsunuz
Bunu söyleyeceğimi düşünmezdim ama daha güçlü DRM gerekiyor gibi görünüyor. Hatta modelin içine kadar kaynak takibi yapılabilmeli, gerçi böyle bir şeyin var olup olamayacağı da belirsiz
Bunun dışında eşinizin söylediği doğru gibi geliyor ve LLM obfuscation uzun ömürlü bir önlem olmayacak gibi duruyor
- Sevdiğiniz bir hacker forumuna gelip insanların DRM yanlısı konuştuğunu görüyorsanız, durum gerçekten vahim demektir
- Neyse ki DRM işe yaramaz ve yarayamaz
  Diyelim ki yarasa bile, bunun zaten güçlü olmayan insanların haklarını korumak için dağıtılacağını sanmamak gerekir
- Kesinlikle hayır. Daha güçlü DRM gerekmiyor
  Bunu başarmanın tek yolu, sonunda yine kırılacak olsa da, doğrulanabilir donanımın kriptografik enclave'lerini kullanmak olurdu ve bu da kullanıcıların kendi cihazları üzerindeki denetimini giderek daha fazla ellerinden alan bir yöne gider
- Telif hakkını, lisansları ve benzeri şeyleri tamamen umursamadıklarına bakılırsa, ne kadar DRM eklerseniz ekleyin bunun yardımcı olacağını sanmıyorum
  Ayrıca bu şirketlerin her gün yaktığı para miktarına bakınca, DRM büyük bir engel de olmayacaktır
  Sonuç olarak bu, sadece daha fazla sermayesi olan modellerin içeriğe erişebilmesine yol açabilir
  DRM'yi nasıl tanımladığınıza bağlı olarak, bu tür obfuscation yöntemlerinin kendisine de DRM denebilir
1,5 yıl kadar önce Glaze'e baktım ve birkaç doğrulayıcı soru sormak için laboratuvarla da iletişime geçtim ama hatırladığım kadarıyla yanıt alamadım
Bu inceleme sırasında çok fazla sınırlama ve çekince gördüm. Şu anki son durum nedir bilmiyorum ama genel amaçlı görsel zehirleme yöntemlerinin çoğu modelde işe yarayacağı konusunda iyimser değilim
Bazı modellerde ve bazı koşullarda Glaze işe yarıyordu

Günümüzde eser görsellerinin LLM eğitimini engelleme yöntemleri neler?

Sorunun bağlamı

İstenen çözüm şekli

İlgili okumalar

1 yorum

Lobste.rs görüşleri