1 puan yazan GN⁺ 4 시간 전 | 1 yorum | WhatsApp'ta paylaş
  • Bir kullanıcı, eşinin kendi eser görsellerinin LLM eğitiminde kullanılmasını istemediği için bunları internette yayımlama konusunda tereddüt ettiğini belirtiyor
  • Sorunun özü, görselleri önceden işleyerek LLM eğitimini bozacak kütüphane veya yöntemlerin bugün pratik olup olmadığı
  • Kullanıcı, eşi için özel bir web sitesini kendisinin yapabileceği düzeyde araçlar olup olmadığını merak ediyor
  • Kendisi front-end konusunda çok deneyimli değil, ancak statik site üreticileriyle basit siteler kurabiliyor
  • Geçmişte bir grup web sitesi hazırlamak için Eleventy kullanmış, bu yüzden benzer bir şekilde statik site kurmayı düşünüyor

Sorunun bağlamı

  • Eşi, kendi eser görsellerini internete koymak istemiyor
    • Bunun nedeni, bu görsellerin LLM eğitiminde kullanılmasını istememesi
  • Kullanıcı, eser görsellerini önceden işleyip LLM eğitimini zorlaştıracak bir yöntem olup olmadığını araştırıyor

İstenen çözüm şekli

  • Eşi için özel bir web sitesini kendisi yapma seçeneğini düşünüyor
  • Gerekli koşul, eser görsellerini işleyerek LLM eğitimini engelleyebilecek kütüphane veya yöntemlerin gerçekten var olup olmadığı
  • Kendi teknik durumu ise şöyle
    • Front-end deneyimi çok fazla değil
    • Statik site üreticileriyle basit siteler yapabiliyor
    • Daha önce Eleventy ile bir grup web sitesi yapmış deneyimi var

1 yorum

 
GN⁺ 4 시간 전
Lobste.rs görüşleri
  • Güncelleme: cara'ya bakmak faydalı olabilir
    Bir sanatçı arkadaşım çalışmalarını oraya yüklüyor ve memnun gibi görünüyor
    Sanatçı öncelikli bir yaklaşım benimsiyor, açıkça anti-AI bir duruş sergiliyor ve görsellerin AI eğitimi için kullanılmasını engelleyen bir Glaze entegrasyonu da var gibi görünüyor
    Ayrıca kastedilen şeyin LLM değil, büyük olasılıkla difüzyon modeli olduğunu söyleyecektim. LLM'ler metinle çalıştığı için araştırma yaparken yardımcı olabilir
    Nightshade'i hatırlıyorum, ama hızlıca kontrol edince 2023/24 civarında çıkmış gibi görünüyor ve bir depo ya da bakım izine rastlamadım

  • Sanat eserlerini zehirlemenin ya da LLM'lerin erişebileceği eserleri gizlemenin sorunu, bunun ne kadar etkili olduğunu bilmememiz ve muhtemelen asla bilemeyecek olmamız. Çünkü sonuçta her şey bir kara kutuya giriyor
    Eserlerinizin LLM'ler tarafından toplanmasını istemiyorsanız birkaç seçeneğiniz var ve her birinin artıları ile eksileri bulunuyor

    1. İnternete hiç yüklememek. Çok basit, ama yalnızca başka hiç kimse de internete yüklemezse işe yarar. Bir kitapsa, tarama gibi başka yollarla AI şirketleri yine elde edebilir
    2. Sadece üyelik ve giriş sonrasında çevrimiçi erişime açmak. İlgilenen insanlar erişebilir, genel amaçlı LLM'ler ise erişemez. Tabii bunun da, birilerinin giriş engelini kaldırıp yeniden paylaşmayacağı varsayımına dayandığını unutmamak gerekir
    3. Güçlü crawler savunmalarının arkasında yayınlamak. Kendi aracım olduğu için söylemesi biraz garip ama iocaine gibi bir şeyi sitenin önüne koyarsanız birçok crawler'ı engelleyebilirsiniz. Hepsini değil, ama eğitim verisine girme olasılığını ciddi biçimde azaltacak kadarını engeller ve normal ziyaretçiler için de büyük bir engel oluşturmaz
      Bir diğer önemli nokta da, eğitim verisinde yer almak istemiyorsanız muhtemelen arama motorlarında görünmemeyi de istemeniz gerektiği. Ticari arama motorları dizinledikleri içerikle eğitim yapıyor; bu yüzden Google aramasında bulunabiliyorsa aynı içeriğin Gemini'ye de girmiş olma ihtimali yüksek
      Sonuçta LLM eğitimi olmadan bir portföy sitesi kurmak istiyorsanız bu zor. Sadece eserlerinizi çevrimiçi koymak istiyorsanız, giriş engeli ya da güçlü crawler savunmaları eğitimde kullanılma ihtimalini epey azaltır. Ne yazık ki bu oran sıfır olmaz ve eserleri gizleyecek ya da toksik hale getirecek, kesin sonuç veren sihirli bir araç yok
  • Eşinizin sezgisi doğru gibi görünüyor. En azından kamuya açık biçimde, cevaba en yakın şey internete yüklememek

    • Hoş değil ama insan yaratımının genel olarak düştüğü durum da bu gibi görünüyor
      Düşük kaliteli üretim makineleri için yakıt olmak istemiyorsanız, kamusal olarak paylaşamıyorsunuz
  • Bunu söyleyeceğimi düşünmezdim ama daha güçlü DRM gerekiyor gibi görünüyor. Hatta modelin içine kadar kaynak takibi yapılabilmeli, gerçi böyle bir şeyin var olup olamayacağı da belirsiz
    Bunun dışında eşinizin söylediği doğru gibi geliyor ve LLM obfuscation uzun ömürlü bir önlem olmayacak gibi duruyor

    • Sevdiğiniz bir hacker forumuna gelip insanların DRM yanlısı konuştuğunu görüyorsanız, durum gerçekten vahim demektir
    • Neyse ki DRM işe yaramaz ve yarayamaz
      Diyelim ki yarasa bile, bunun zaten güçlü olmayan insanların haklarını korumak için dağıtılacağını sanmamak gerekir
    • Kesinlikle hayır. Daha güçlü DRM gerekmiyor
      Bunu başarmanın tek yolu, sonunda yine kırılacak olsa da, doğrulanabilir donanımın kriptografik enclave'lerini kullanmak olurdu ve bu da kullanıcıların kendi cihazları üzerindeki denetimini giderek daha fazla ellerinden alan bir yöne gider
    • Telif hakkını, lisansları ve benzeri şeyleri tamamen umursamadıklarına bakılırsa, ne kadar DRM eklerseniz ekleyin bunun yardımcı olacağını sanmıyorum
      Ayrıca bu şirketlerin her gün yaktığı para miktarına bakınca, DRM büyük bir engel de olmayacaktır
      Sonuç olarak bu, sadece daha fazla sermayesi olan modellerin içeriğe erişebilmesine yol açabilir
      DRM'yi nasıl tanımladığınıza bağlı olarak, bu tür obfuscation yöntemlerinin kendisine de DRM denebilir
  • 1,5 yıl kadar önce Glaze'e baktım ve birkaç doğrulayıcı soru sormak için laboratuvarla da iletişime geçtim ama hatırladığım kadarıyla yanıt alamadım
    Bu inceleme sırasında çok fazla sınırlama ve çekince gördüm. Şu anki son durum nedir bilmiyorum ama genel amaçlı görsel zehirleme yöntemlerinin çoğu modelde işe yarayacağı konusunda iyimser değilim
    Bazı modellerde ve bazı koşullarda Glaze işe yarıyordu