Üretken yapay zekaya daha büyük telif hakkı baskısı geliyor

(garymarcus.substack.com)

2 puan yazan GN⁺ 2023-12-31 | 1 yorum | WhatsApp'ta paylaş

New York Times’ın OpenAI’a açtığı davanın ardından, üretken yapay zekanın eğitim ve çıktı aşamalarında telif hakkı ihlali sorumluluğunu nereye kadar taşıması gerektiği daha büyük bir tartışma konusu haline geldi
Davanın odağında, sohbet botlarının metni neredeyse aynen yeniden üretebilmesi yer alıyor; Marcus ve Reid Southen’in deneyi ise DALL-E’nin de görsellerde benzer tekrarlar üretebildiğini gösteriyor
Özel adları engelleme gibi güvenlik önlemleri olsa bile, kullanıcıların karakter ya da film adlarını doğrudan yazmadığı istemlerde SpongeBob SquarePants, RoboCop ve video oyunu karakterlerine benzeyen sonuçlar ortaya çıkabiliyor
Mevcut sistemler, eğitim kaynakları ile üretilen çıktıların kaynak bilgisi ve olası ihlal riski hakkında kullanıcıya bilgi vermediği için, kullanıcı farkında olmadan ihlal niteliğinde çıktılar oluşturabilir
Marcus, kaynak takibinin mümkün olduğu yeni bir mimari ortaya çıkana kadar ihlal tartışmalarının süreceğini ve New York Times davasının daha fazla davanın başlangıcı olabileceğini düşünüyor

New York Times davası ve görsel tekrar deneyi

New York Times’ın OpenAI’a dava açtığı dönemde Gary Marcus, film sektöründe konsept sanatçısı olan Reid Southen ile birlikte bir deney yürüttü
- Southen, Marvel, DC, Matrix Resurrections, Hunger Games gibi yapımlarla bağlantılı deneyime sahip biri olarak tanıtılıyor
- Tam raporun gelecek hafta yayımlanacağı, 3 Ocak’ta da IEEE Spectrum’da ek olarak ele alınacağı belirtiliyor
Davanın odağında, OpenAI sohbet botunun metni neredeyse orijinaliyle aynı şekilde yeniden üretebilmesi bulunuyor
Marcus ve Southen’in deneyinde, OpenAI’ın görsel yazılımı Bing üzerinden kullanıldığında da görsellerin orijinaline birebir ya da çok yakın tekrarlarının mümkün olduğu belirtiliyor

Güvenlik önlemlerinin engelleyemediği benzer üretimler

DALL-E’de özel adları ve kasıtlı ihlal girişimlerinin bir kısmını engelleyen güvenlik önlemleri olduğu biliniyor, ancak bunların güvenilir biçimde çalışmadığı söyleniyor
İhlal olasılığı, kullanıcı doğrudan ihlal amacı taşımadığında ya da karakter ve film adlarından bahsetmediğinde bile ortaya çıkabiliyor
- SpongeBob SquarePants’ten bahsetmeyen kısa bir istemde ilgili sonuçlar çıkabildiği belirtiliyor
- RoboCop’tan bahsedilmeyen durumlar ile video oyunu karakterleri ve marka ihlali riski taşıyan sonuçlar da örnek olarak veriliyor
- X kullanıcısı Blanket_Man01 ve A16Z’den Justine Moore’un da benzer bir olguyu bağımsız olarak keşfettiği söyleniyor

Kaynağı bilinmeyen kara kutu sorunu

Marcus’a göre üretken yapay zekanın temel sorunu, eğitim kaynakları ile üretilen çıktıların kaynağının kullanıcıya görünmediği bir yapıya sahip olmasında yatıyor
- DALL-E ve ChatGPT gibi sistemler telif hakkıyla korunan materyallerle eğitiliyor
- OpenAI, neyle eğitim yaptığını şeffaf biçimde açıklamıyor
- Üretken yapay zeka sistemleri, telif hakkını ihlal edebilecek materyaller oluşturabiliyor
- Sistem, böyle bir sonuç ortaya çıktığında kullanıcıyı bilgilendirmiyor
- Üretilen görsellerin kaynak bilgisi de sağlanmıyor
- Kullanıcı, oluşturduğu görselin ihlal olup olmadığını bilemeyebilir
Mevcut DALL-E ve ChatGPT gibi sistemler kara kutuya yakın görülüyor; bu yapıyla kaynak materyale atıf yapmanın zor olduğu düşünülüyor
- Bazı şirketlerin bu alanda araştırma yaptığı, ancak ikna edici bir çözümün henüz bilinmediği belirtiliyor
- Üretilen metin ya da görsellerin kaynağını güvenilir biçimde takip edebilen yeni bir mimari ortaya çıkana kadar ihlallerin sürebileceği düşünülüyor
- İyi bir sistemin kullanıcıya kaynak listesi sunması gerektiği, ancak mevcut sistemlerin bunu yapmadığı söyleniyor

Davaların yayılması ve Microsoft’un riski

New York Times davasının, birçok davanın ilk örneği olma ihtimalinin yüksek olduğu düşünülüyor
- Marcus’un X’te yaptığı ankette çoğunluk uzlaşma bekledi
- Uzlaşma tutarı konusunda birçok yanıt 100 milyon doların üzerinde bir rakam öngördü; %20 ise 1 milyar dolar bekledi
- Film stüdyolarına, video oyunu şirketlerine ve diğer gazetelere yayılması halinde tutarların büyüyebileceği belirtiliyor
Örnekler Bing’de DALL-E üzerinden gerçekleştiği için Microsoft’un da sorumluluk riskiyle karşı karşıya olduğu düşünülüyor

1 yorum

GN⁺ 2023-12-31

Hacker News yorumları

Herkes, böyle bir şeyin birileri tarafından gerçekten sahiplenilebileceği yönündeki kurumsal anlatıyı fazlasıyla kolay kabulleniyor.
Pamuk Prenses ve Külkedisi hikâyelerinin gerçekten sahibi kim? Bu hikâyeler Disney’den çıkmadı; kuşaklar boyunca aktarılan halk masallarının bir parçası. Disney’in başarısı da kısmen, toplulukların yüzyıllar boyunca paylaşıp dönüştürdüğü mevcut anlatıları uyarlamasına dayanıyor.
Bu tartışma yalnızca yapay zekanın teknik ayrıntıları ya da telif hakkının hukuki mantığıyla ilgili değil; paylaştığımız kültürün derin köklerini anlamakla ilgili olmalı.
Kültür özünde ortak bir varlıktır; kolektif hikâyeler ve yeniden yorumlamalar yoluyla evrilir ve büyür.
Üretken yapay zeka ve telif hakkı ihlali tartışmaları, kültürel evrimin bu temelini ıskalıyor gibi görünüyor. Algoritmalar yeni olabilir, ama hikâyeleri yeniden hayal etme ve tekrar kullanma eylemi insanlık kadar eski.
Disney’in mevcut kültür ve mevcut hikâyeler üzerine “fare evi”ni kurup, şimdi de kültürel ifade araçlarını eski ve tuhaf telif haklarına uydurmak için sınırlamayı önermesi bence gerçekten akıl alır gibi değil.
- Bu argümanı kurmak için zaten kamu malı olmayan bir örnek seçmeniz gerekir. Disney yalnızca kendi yorumuna sahiptir; mahkemeyi ikna edebileceği muğlak türev alanlar için iddiada bulunabilse de Pamuk Prenses ve Külkedisi hikâyelerinin tamamına sahip değildir.
  Makaledeki görselde oldukça yeni şeyler kullanılmış ve bunların Mario ya da Coca Cola olup olmadığı bile tartışmalı değil. Nintendo ile Coca Cola ortak bir promosyon yapsaydı, ortaya çıkan görselin aynen böyle olduğuna inanılabilirdi.
  Mario’ya benzeyen kıyafetler giymiş kısa, tıknaz bir tesisatçı genel fikrini öne sürselerdi bu başka mesele olurdu; ama bu düpedüz Mario ve Luigi. Robocop ve C3PO. Hiç de incelikli bir durum değil. Böyle markalar AI ile aklanarak silinebiliyorsa, her şey AI ile aklanabilir.
- Gerçekte, hiçbirimizin tasarlamadığı ve kusurlu olduğu bilinen bir hukuk sistemi altında yaşıyoruz. Reform talep edebilirsiniz, ama LLM üreticileri bugün yürürlükte olan mevcut yasalara göre değerlendirilecek.
  Yenilik LLM’lerde ve onların teknolojisinde; soylu bir kültürel açıklık kavramı altında telif hakkını baştan sona yeniden düşünmekte değil.
  Dolayısıyla bu sadece kurumsal bir anlatı değil; doğru ya da yanlış, o anlatının dayandığı hukuk. Şirketler hukukun şekillenmesinde büyük rol oynamış olabilir, ama telif hakkı bireylere de fayda sağlar. Bu, paylaşılan gerçekliğin basit propaganda ya da kurumsal anlatılarla manipüle edilmesi değil; hâkimlerin arabuluculuk ettiği, silahları ve hapishaneleri olan insanların uyguladığı bir şeydir.
  Hukuki bir mesele olduğu için mutlaka hukukun teknik ayrıntıları ele alınmalı. “Sadece toplumsal anlatıyı tartışmalıyız” diyerek geçiştirirseniz, maddi sonuçların ve gerçekliğin yerine fantezi koymuş olursunuz. Telif hakkı ve fikrî mülkiyetin yaratıcılığı bastıran yönünü de tartışmalıyız; ama aynı zamanda fiilen olup biteni görmezden gelemeyiz.
- Bu yanıt gerçeklikten fazlasıyla kopuk. Telif hakkı hukuku çok net. Burada asıl kurumsal anlatı, “AI”ın bir şekilde yeni ve farklı olduğu, bu yüzden mevcut hukukun uygulanmadığı iddiası; bu ise hiç mantıklı değil.
- Kamu malı ve ortak varlıklar da telif hakkının parçasıdır; bu yüzden söyleme geri kazandırılması gereken unutulmuş kavramlarmış gibi konuşmaya gerek yok.
  Bununla birlikte Georgism yeterince incelenmiyor.
  Hukuki sonuçlar insani sonuçlardır ve en az diğer şeyler kadar kültürün parçasıdır. Neyin adil olduğu, emeğin karşılığının nasıl tanındığı ve dağıtıldığıyla ilgilidir.
  Bu tür biçimselleştirme, piyasa ekonomisi merkezli olmayan kültürlerde daha az önemli olabilir; “zengin halk masalları dokusu” gibi ifadeler de böyle bir dünyaya dönmeyi çağrıştırıyor. Ancak yapay zekaya nasıl yaklaşacağını düşünen toplum böyle bir toplum değil.
  Telif hakkının yeni kopyalama yetenekleri yüzünden geçersizleştiği ya da eskidiği düşüncesi, kelimenin tam anlamıyla tersine çevrilmiş bir fikir. Telif hakkı yeni kopyalama yetenekleri nedeniyle ikna edici hâle geldi.
  O dönemdeki somut yetenek sanayileşmiş baskıydı; sıradan yazılım uzmanlarından çok daha zeki görünen kişiler, bu yeteneğin yeni kopyalama gücüne sahip taraf ile değerin temelini oluşturan eserleri yaratan taraf arasında yanlış hizalanmış teşvikler doğurduğunu anlamıştı. Telif hakkı pazarlığının özü bu teşvikleri hizalamaktır.
  Yeni kopyalama teknolojileri; neyin yasaklanacağı, sınırlandırılacağı veya izin verileceği, hangi standartların ve uygulama yetkilerinin/sınırlarının konacağı gibi ayrıntıları değiştirebilir. Ama bu pazarlığın bilgeliğini değiştirmez. Bunu değiştirmek için toplumun üretim kapasitesini örgütlemenin ve ödüllendirmenin daha iyi bir yoluna ihtiyaç vardır.
- Telif hakkı hiçbir zaman ahlaki bir duruşa dayanmadı; her zaman çeşitli grupların lobi gücü tarafından belirlendi.
  Yine de üretken yapay zeka şirketleri daha fazla para kazansın diye telif hakkını ortadan kaldırma fikri tamamen tuhaf geliyor.
Bana göre soru yanlış
Herkes bunun telif hakkıyla korunan materyallerle eğitildiğini ve ürkütücü derecede benzer çıktılar üretebildiğini biliyordu
Ama bu zaten büyük ölçekte oldu ve büyük şirketler de tamamen işin içine girdi. Sıkılmış diş macununu tekrar tüpe koyma ihtimali yok
Bu, büyük teknoloji şirketlerinin işlerini agresif kullanıcı verisi toplama üzerine kurduğu zamana benziyor. Bunun doğru mu, etik mi, hatta yasal mı olduğu bu aşamada daha çok akademik bir tartışma. Onlar bunu basitçe yaptılar ve toplumun doğru düzgün informed consent’i olmadan fiilen ilerlediler
Burada doğru soru “şimdi ne yapacağız”dır. İzleme teknolojilerinde olduğu gibi yanıt muhtemelen “pek bir şey yok”a yakın olacak
- “Sıkılmış diş macununu tekrar tüpe koyamazsın” görüşüne katılmıyorum. Daha önce de benzer şeyler yaşandı
  Ucuz müzik kaydı ve üretimi gibi teknolojiler de aynıydı. Bir sanatçıyı bir kez kaydedip plakları kitlesel olarak üretebilirsiniz, ama bu Taylor Swift’i bir kez kaydedip sonra para ödemeden sınırsız kopyalayabileceğiniz anlamına gelmez
  1942 müzisyen grevini okumak iyi olur: https://jacobin.com/2022/03/1940s-musicians-strike-american-...
- Bu, tarihi bilmeyen bir söylem
  Bu zaten Napster’da, sonra Apple Music’te, şimdi de streaming hizmetlerinde yaşandı
  Halk arasında yaygın dosya paylaşımı sürüp gitmek yerine, sahip olmadığımız cihazlara ve streaming aboneliklerine sahip olduk
  Apple tüm müziği iPod’a kopyalayıp satmadı; içerik haklarını almak için 10 yıllık sözleşme müzakerelerine ve çok paraya girdi
  Neyin doğru neyin yanlış olduğunu söylemeye çalışmıyorum; sadece bu tür mücadelelerin neredeyse hiç anlaşılmadığı bir söz olduğunu söylüyorum
- “Zaten oluyor, o yüzden vazgeçelim” düşüncesini epey akıcı ifade etmiş gibisin. Sorun çözme ve eyleme geçme konusunda çok işe yarar herhalde
- Bunu bir emrivaki olarak söylüyorsun. Teknoloji alanındaki pek çok yenilik gibi: yasa aptalcaysa yasayı çiğneyip pazar hâkimiyeti kazanırsın
  Uber ve AirBnB’nin çoğu büyük şehirde yasa dışı olduğu ama sonunda pazar hâkimiyeti kazandığı zamanları hatırlatıyor
  Bence bu daha iyi bile. “Fikri mülkiyet” denen şeye hiçbir zaman inanmadım. Patentler, telif hakları ve hayali “haklar” paketinin tamamı kaldırılmalı
  Dünyanın yarısından fazlası, yani Küresel Güney, bu hakları zaten tanımıyor; üstelik sert yasal aşırı uygulama ve tekelci merkezileşme olmadan bunları uygulamak giderek zorlaşıyor
- Modelleri, lisansı olmayan ya da hâlâ alınamamış telifli materyaller olmadan imha etmeye veya yeniden eğitmeye zorlayabiliriz
  Bunlar milyarlarca, trilyonlarca dolarlık şirketler. Hissedarlar ve üst yönetim bundan ne kadar hoşlanmasa da burada sorumlu toplum üyeleri gibi davranabilecek güçleri var
AB’de bu sorun olmamalı. “Copyright in the Digital Single Market” direktifinin 3. ve 4. maddeleri bunu zaten düzenliyor
Wolters Kluwer özetine göre, ticari makine öğrenimi geliştiricileri dâhil diğer tüm aktörler, yasal olarak erişilebilir eserleri ancak hak sahipleri metin ve veri madenciliği amaçlı kullanımı açıkça saklı tutmamışsa kullanabilir
Bildiğim kadarıyla “eğitim yasak” işareti koyan robot.txt benzeri bir şey tartışılıyor. Muhtemelen belirli güvenlik önlemleri uygulanmalı ve son kullanıcılar üretilen çıktıları kullanırken dikkatli olmalı
Kluwer kaynağı: https://copyrightblog.kluweriplaw.com/2023/02/20/protecting-...
AB mevzuatının orijinal metni: https://eur-lex.europa.eu/eli/dir/2019/790/oj
- AB’nin web tarayıcılarındaki Do Not Track bayrağının yasal olarak bağlayıcı olduğu konusunda anlaşamamışken, büyük içerik şirketlerinin veri scraping’den kaçınmak için web sitelerinde yasal olarak bağlayıcı bir bayrak oluşturabilmesi gerektiğini söylemek tuhaf görünüyor
- Bu tuhaf, belki de biraz temenni içeren bir yorum gibi. 4. madde, metin ve veri madenciliği amacı için ticari makine öğrenimi geliştiricileri dâhil herkese bir istisna getirmiyor mu?
  https://eur-lex.europa.eu/eli/dir/2019/790/oj
Telif hakkı ihlali olmadığını garanti etme sorumluluğu, eseri yayımlayan kişiye aittir
Onu kendiniz çizmiş olmanız, hukuk eğitimi olmayan bir çırak ressama yaptırmış olmanız, fotoğraf çekmiş olmanız ya da yapay zekayla bir görsel üretmiş olmanız bunu değiştirmez
Neden ChatGPT’nin veya başka bir aracın mevcut telifli içeriği üretmeyeceğini varsayıyoruz?
“Üretildiği” için özgün olacağı yönündeki saf varsayımı anlayabiliyorum. Ama “ChatGPT”yi “junior artist” ile değiştirdiğiniz anda bu varsayım çöker
Bir bilimkurgu filmindeki droid’i çizmesini istediğinizi ve başka bir şey söylemediğinizi düşünün. Teliften bahsetmiyorsunuz, özgün olması gerektiğini de söylemiyorsunuz. O zaman ne çizmesini beklersiniz?
- OpenAI, GPT modellerine erişim satıyor ve bu modeller benim tüketeceğim telifli materyaller çıktılıyor. Bu da aynı şekilde ihlal değil mi?
- O zaman üretken yapay zeka fiilen kullanılamaz hâle gelir. Çıktının intihal olup olmadığını bilemeyeceğiniz için sürekli şüphelenir ve asla kullanmazsınız
- Bu argüman mantıklı değil
  O varsayımsal junior artist de en az o kadar, hatta belki daha fazla sorumluluk taşır
Bu makalenin ve NYT davasının özünü hiç anlamamış gibi görünen şaşırtıcı derecede çok yanıt var. ChatGPT, NYT makalelerinin önemli bölümlerini yüzlerce ila binlerce kelime uzunluğunda tamamen orijinal metinle birebir yeniden üretip kamuya açık şekilde sunabiliyordu
Bu türev eser değil. O aşamayı çoktan aşmış durumda. NYT’nin elinde çok güçlü bir dava var; telif hakkının artılarını ve eksilerini tartışanlar ise asıl noktadan uzaklaşıyor
Bu tek dava telif hakkını tek başına altüst etmeyecek. OpenAI’nin öne sürebileceği şey en fazla “bu yeni bir şeydi, böyle olacağını nereden bilebilirdik” düzeyinde. Öyleyse şu anda eğitilmiş modeller çok zor bir durumda
Ayrıca NYT’nin uzlaşacağını sanmıyorum. Sonuçları çok büyük; OpenAI ile uzlaşırsa diğer tüm modellerde de benzer davalar doğacaktır. Dijital içerik yayımlayan diğer tüm medya kuruluşlarının da benzer ölçüde geçerli davaları olur
Bu, üretken yapay zeka için bir dönüm noktası ve ilk düşündüğümüzden çok daha pahalı ya da çok daha kısıtlı hale gelme olasılığı yüksek görünüyor
Yan etki olarak korsan modellerin artacağını düşünüyorum. Yasallığı tamamen göz ardı eden, dağıtık biçimde eğitilen ve ağırlıkları şirketler tarafından değil topluluklar tarafından dağıtılan modeller; örneğin torrent modelleri ortaya çıkabilir
Bu modellerin resmi “uslu” modelleri performansta geçme olasılığı da epey yüksek. Önümüzdeki birkaç yıl ilginç gelişecek gibi
- OpenAI bu konuda Google/YouTube’u neredeyse kopyalayıp Content ID benzeri bir sistem sunabilir gibi görünüyor
  Mantık şu: ChatGPT varsayılan olarak telifli eserleri yeniden üretmez; YouTube’un insanların yüklediği videoları sunması gibi, üçüncü taraf kullanıcıların istekleri veya eylemleriyle yeniden üretir
  OpenAI’nin niyeti telif hakkı ihlali değildi ve gerçekten de araştırmacıların çoğu ya da büyük bölümü, modellerin herhangi bir eserin önemli kısımlarını yeniden üretecek kadar aşırı uyumlu olmadığına inanıyordu
- NYT’nin elinde ne olduğunu tam olarak anlıyorum. Çok güçlü bir dava. Ama bu davanın telif hakkı hukukunu sarsması gerektiğini düşünüyorum. Telif hakkı fena halde bozulmuş durumda ve uzun zamandır da öyle
  Esasen arkasında dev bir şirket olmayan telif hakkının hiçbir anlamı yok; arkasında şirket varsa da, telif hakkında olması gereken sınırlamalardan bağımsız olarak sonsuza dek kilitlenebiliyor
  OpenAI’nin eski haberleri birebir yeniden üretebilmesi NYT’ye hiçbir şey kaybettirmiyor
  NYT kazanırsa bizim kaybedeceğimiz çok şey var. Artık telif hakkına yeniden bakma zamanı. Bunu gerçekten yapabiliriz; ayrıca oldukça eskidiği için güncellenmesi gerekiyor
- DALLE, Midjourney ve Stable Diffusion’da da bu oldu
  Stable Diffusion, Control Net ve LoRA gibi şeylerden azami ölçüde yararlanıldığında diğer kapalı kaynak/proprietary modelleri geride bırakıyor
Biraz idealist olabilir ama sanatın ve yayıncılığın temel amacının yalnızca büyük para kazanmak değil, kültür ve toplum üzerinde etki yaratmak olması gerektiğine her zaman inandım
Bu yüzden özgün eserlerin korunması gerektiğini, ancak yaratıcılığı ve ilhamı teşvik etmek için çok daha hızlı şekilde kamu malı alanına girmeleri gerektiğini düşünüyorum. Geçiş süresi onlarca yıl değil, birkaç yıl ölçeğinde düşünülmeli
- Sanatın temel amacının toplumsal etki olduğu iddiası bugün medyada sık tekrarlanan bir klişe gibi görünüyor; buna hiç katılmıyorum
  Sanatın başlıca amacı bireyde duygu uyandırmaktır. Sanatın ders vermesi gerektiği fikri, bugün bu kadar çok bariz “aktivist” kurgu olmasının muhtemel nedeni
- O zaman sanatçılar akşam yemeğinde ne yesin?
- Neden yalnızca sanat bu kurala tabi olsun da başka şeyler olmasın?
Bunları düzeltmek o kadar da zor görünmüyor. Örneklerin çoğu genel bir açıklama değil, iyi bilinen bir nesneye işaret eden kısaltılmış ifadeler
“video oyunu tesisatçısı” fiilen “Mario” ile eş anlamlı ve karakteri azıcık bile bilen herkes bunu bilir
Benzer şekilde, bir açıklama aracıyla Mario gibi görselleri tarif ettirip [1], “video oyunu tesisatçısı” yazan kişiler için bu tür sonuçları kaldırmak ne kadar zor olabilir?
1. Midjourney’nin describe komutu görselleri açıklayabiliyor. Diğer yapay zeka araçlarında da benzer işlevler olduğunu tahmin ediyorum: https://docs.midjourney.com/docs/describe
- Düzeltme yöntemi oldukça distopik görünüyor. Photoshop’un yüklenen görselleri telifli materyal olup olmadığını kontrol ettiğini ve telifli materyal ya da karakter içerdiğine karar verirse işlem yapmayı reddettiğini hayal edin. Kendi çizdiğiniz fan art olsa bile durum aynı
  İnternetin ilk dönemlerinde insanların telif yasalarını ihlal ettiği gerekçesiyle ücretsiz fan fiction’ları ortadan kaldırmaya çalıştıkları zamanları hatırlatıyor. Yaratıcının satmaya çalışmadığı kişisel kullanım için telif yasasını uygulamaya çalışmak bana göre epey korkunç
  50 yıl sonrasını hayal edelim. “Robot, okul dioraması için çizdiğim şu resmi keser misin?” “Elbette.” “Bunu da yap.” “Hata: Bu görsel telifli materyal içeriyor olabilir, işlenemiyor.”
- Bu tür örnekler gerçekten önemsiz ya da uç vakalar. Burada bakılması gereken iki şey var
  Üretken yapay zeka sistemleri telif hakkını ihlal eden materyal üretme konusunda yeterli kapasiteye sahip
  Ve bunu yaptıklarında kullanıcıya haber vermiyorlar
  Dolayısıyla herhangi bir çıktı, web’de belirsiz ama hâlâ korunan kaynak materyali ihlal edebilir ve o çıktıyı kullanan herkes hiçbir uyarı olmadan dava riskiyle karşı karşıya kalabilir
  Bunu düzeltmek çok zor
- Telif hakkı ve marka hakkı içeren içerik üretmek için kullanılabilecek tüm “iyi bilinen nesnelere yönelik kısaltılmış ifadeleri” ya da istemleri kaldırmak zor olacaktır
  Kasıtlı olarak ihlal içeren içerik üretmeye çalışmıyorsanız bu tür sonuçları kaldırmak ya da atmak mümkün olabilir; ancak sorun, yapay zekayı kandırıp bu tür içerikleri ürettirmeye çalışan kişiler. Telifli ve markalı eğitim materyallerinin tamamı hariç tutulmadığı sürece onları durdurmak imkânsız olacaktır
  Üretken yapay zekanın bir başka sorunu da makalede geçen “DALL-E ve ChatGPT gibi sistemler özünde kara kutu” ifadesi
  Bir kullanıcının ya da mağdurun, yapay zekanın neden böyle bir karar verdiğini tam olarak bilme hakkı olduğu durumlarda yapay zeka karar verme sürecinde kullanılırsa ne olur? İş ve hukuk açısından mevcut yapay zeka çözümlerinin riskli olduğunu ve çok sınırlı kullanılmaları gerektiğini düşünüyorum. Çünkü onları yapan kişiler bile yapay zekanın hangi seçimi yapmasına yol açan kesin bilgi parçacığını gösteremiyor
- Bu yaklaşım ölçek büyüdüğünde neredeyse imkânsıza yakın
- Önceden bilmiyorsanız “iyi bilinen bir nesne” girdiğinizi nasıl anlayabilirsiniz?
  “columbian coffee logo” yazdığınızda zaten var olan marka logoları çıkarsa, bu logoların daha önce var olup olmadığını kontrol etmek için tüm interneti tersine mühendislikle mi incelemek gerekiyor?
  Yapay zeka ilham kaynaklarını göstermeli. Bir şeyden ilham alarak üreten insanlar, ne kullandıklarını ve intihal çizgisini aşıp aşmadıklarını tam olarak bilir. Ancak yapay zekanın çalışma biçimi bunun için fazla opak
  Yapılması gereken tek şeyin kaynakları ortaya koymak olduğunu düşünüyorum. Ancak bu, yapay zeka şirketlerinin veri kümelerini açıklaması gerektiği anlamına gelir ve sahip olmamaları gereken ya da açıklanmaması gereken bilgiler de ortaya çıkabilir
Anladığım kadarıyla üretken yapay zekâ için hukuki emsal, Google’ın kamu yararı için arama dizini oluşturmak üzere web sitelerini kazıyabilmesine benziyor.
Google ayrıca web sitelerinin önbelleğe alınmış sürümünü de gösterebiliyor ve bu, ilgili sitenin özgün içeriği. Google başka web sitelerinin içeriğini olduğu gibi gösteriyor diye kimsenin bunun telif hakkı ihlali olduğunu söyleyeceğini sanmam.
Bu yüzden bu argümanın zayıf olduğunu düşünüyorum. Tüm kültürel referanslar ve popüler IP’ler, hatta daha az bilinenler bile kaldırılmak zorunda kalırsa yapay zekâ işe yaramaz hale gelir.
Kişisel olarak üretken yapay zekânın, eğitim verilerindeki benzer özgün materyallere bağlantılar sunabilmesi gerektiğini düşünüyorum. Yapay zekâ eğitimine katkıda bulunanları ödüllendirmenin asgari yolu bu.
Üretken yapay zekâ, özgün materyali üreten web sitelerini ve sanatçıları tamamen öldürecek bir yöne giderse bunun uzun vadede sürdürülebilir olduğunu düşünmüyorum. Kaynaklar şeffaflık katar ve kullanıcının bunun halüsinasyon olup olmadığını anlamasına da yardımcı olur.
İnsanlar içeriklerinin eğitimde kullanılmasını opt-out edebilmeli ve gelecekteki sürümlerden kaldırılıp kaldırılmadığını da doğrulayabilmeli.
Açıkçası yapay zekâ şirketleri bunu sadece davalardan kaçınmak için gizli tutuyor. Kıyamet senaryolarından ziyade bu tür alanlarda düzenlemenin faydalı olabileceğini düşünüyorum.
- “Google başka web sitelerinin içeriğini olduğu gibi gösteriyor diye kimse bunun telif hakkı ihlali olduğunu söylemez” deniyor ama geçmişte gazeteciler ve Getty Images tam da bunu söyledi.
  [1]: https://yro.slashdot.org/story/03/07/14/025216/web-caching-g...
  [2]: https://www.theguardian.com/technology/2016/apr/27/getty-ima...
- “Üretken yapay zekâ, özgün materyali üreten web sitelerini ve sanatçıları tamamen öldürecek bir yöne giderse uzun vadede sürdürülebilir değildir” ifadesi odadaki fil.
  Her teknoloji dalgasının, yaratıcıları zaman ve para harcayıp özgün materyal üretmeye ikna eden bir yöntemi vardı; sonra kurallar değişti.
  Google içeriğe erişim alanı ve yeni pazarlar vaat etti ve bu gerçekten işe yaradı. Sonra snippet’leri, reklamları ve ziyaretçileri özgün siteye göndermek yerine kendi otoyolunda tutan her türlü mekanizmayı devreye soktu.
  Reddit, Stack Overflow vb. puan ve rozet gibi oyunlaştırma unsurları ve toplulukla kullanıcıları özgün içerik katkısında bulunmaya teşvik etti.
  Şimdi yapay zekâ bu yaklaşımları sarsıyor. Her aşamada özgün materyal üretme teşviki giderek azalıyor gibi görünüyor. Çünkü karşılığında gelen ödül giderek düşüyor.
  Yapay zekâ, hiçbir fayda sağlamadan — yani erişim alanı, oyunlaştırma, topluluk veya tanınma ihtimali olmadan — özgün içeriği papağan gibi tekrarlıyorsa, uzmanlar için artık hangi teşvik kalıyor?
- “Eğitim verilerindeki benzer özgün materyallere bağlantı sağlamalı” demek, bunlar veritabanı olmadığı için genellikle imkânsız.
  Bu, yorumunu yazmanı etkileyen özgün materyallerin bağlantılarını verememen gibi. O yanıtı üretmeni sağlayan nöron ağırlıklarına ne kadar eğitim girdi? İtalik kullanımını ve bunun kelime yorumuna etkisini nereden öğrendin? Bu foruma uygun tonu nereden öğrendin?
  “İnsanlar içeriklerinin eğitimde kullanılmasını opt-out edebilmeliyse”, ben bir kitap yazdığımda senin o kitabı okumanı engellemek için opt-out edebilmeli miyim? Eserimi kimin okuyabileceğine dair koşullar koyabilmeli miyim? Din? Ten rengi? Ezberleme becerisi zayıf insanlar?
  Kimin bilgi edinebileceğini sınırlama fikrinin kulağa saçma gelmesini umarım. Öyleyse aynı sınırlama “kim”e değil de “ne”ye uygulandığında neden kabul edilebilir oluyor?
  Yapay zekâ şirketlerinin davalardan kaçınmak için gizli tutması araştırma bariyerleri yarattı. Ben ve Joe aynı veri kümesiyle araştırma ve makale üzerinde işbirliği yapabilmek yerine eğitim verilerini saklamak zorunda kalıyoruz. Luddite’lar makineleri parçalamaya gelir diye. Sanki öğrenmek, ancak fazla iyi yapılmadığında kabul edilebilir.
- Hukuki emsal henüz belirlenmiş değil. Anlatılan “emsal”, yapay zekâ şirketlerinin kullandığı argüman; yani internette erişilebilir bilgilerle model eğitmenin adil kullanım sayılması gerektiği iddiası.
  Ancak yapay zekâ eğitiminin adil kullanımın 4 faktörlü testini gerçekten karşılayıp karşılamadığı henüz görülecek.
- Kaynakları referans olarak sunabilme yeteneği burada temel fark.
  Üretken yapay zekâda da bunun uygulanabilmesi gerektiğine katılıyorum, ancak bu bilgiyi korumak eğitim maliyetini çok daha pahalı hale getirebilir ve yapay zekâ şirketlerinin buna pek ilgisi yok. Muhtemelen işlem sonrası aşamada olası telif sorunlarını sezgisel olarak değerlendirmeye çalışacaklardır.
  Daha ilginç soru, neredeyse kelimesi kelimesine yeniden üretme durumlarının ötesinde, telif hakkı sahiplerinin eserlerinin topluca yapay zekâyı daha genel bir şekilde etkilediği gerekçesiyle izinsiz kullanım iddiasında bulunup bulunamayacağı.
Üretken yapay zekâya özel, daha net yasalara ihtiyaç var. Gerçek insanlarla çok fazla karşılaştırma ve benzetme yapılıyor.
“Biri ticari marka kapsamındaki materyallere bakarak resim yapmayı öğrenip yanlışlıkla benzer bir şey üretirse ne olur?” gibi şeyler söyleniyor ama bu modeller insan değil ve ayrı bir kategoride yer alıyor.
Bu modellerin bir ölçüde ticari marka ihlali yaptığını düşünüyorum, ama aynı zamanda buna izin verilmesi gerektiğini de düşünüyorum. Nihai sorumluluk, görüntüyü genel kamuya sunulacak bağımsız bir medya olarak kullanan kişide olmalı.
- Ben de bu görüşteyim. Dall-E’nin C3PO üretmesinin kendisi tamamen sorun olmamalı. Ben o çıktıyla para kazanmıyorsam Disney geri çekilmeli.
Bu tür tartışmalarda modellerin asıl meseleden çok sis perdesi gibi işlediğini ve tartışmanın orada takılıp kaldığını düşünüyorum
Modeller, “sorumluluk zinciri” içinde makul bir inkâr edilebilirlik sağlıyor. “LLM”i çıkarıp yerine “lunapark yan gösterisindeki sihirli kutu”yu koyarsanız, LLM’in özel bir şey olduğu ve istisnayı hak ettiği argümanı çok hızlı biçimde ortadan kalkar
- Tamamen katılıyorum
  Betamax içtihadı, ihlal oluşturmayan kayda değer kullanımları olan bir teknolojinin kendi başına ihlal sayılmayacağını söyler
  Yapay zeka çıktılarının telif hakkı koruması doğurmadığına dair zaten emsal var; aynı mantıkla, yapay zekanın üretim eyleminde bir niyet ifade edilmez. Dolayısıyla ihlal olup olmadığı, çıktıyı kullanan insana bağlı olmalıdır. Çünkü kara kutunun kendisinin eyleyen özne olma niteliği yoktur
- Katılıyorum; ayrıca LLM’in endüstride “yıkıcı” bir şekilde üretken ve kârlı kullanılıp insanları işsiz bırakması gibi somut örnekleri önce görmek isterim
  LLM’in ya da daha genel olarak üretim tekniklerinin somehow bir sonraki büyük dalga olduğu sonucuna varmadan önce, ya da “genel” zekânın eşiğinde olduğumuzu iddia etmeden önce, önce o kapıyı göstermeleri gerekir
  O kapı, bir kutuya bir şeyler girip öbür taraftan çıkanları izlemenin eğlence değerinin ötesinde, gerçek sorunları çözmek için endüstriyel benimseme yaşandığını gösteren bir şey olabilir. Ama şimdiye kadar gördüğüm kadarıyla bunu gerçekten yapan bir yer yok gibi

Üretken yapay zekaya daha büyük telif hakkı baskısı geliyor

New York Times davası ve görsel tekrar deneyi

Güvenlik önlemlerinin engelleyemediği benzer üretimler

Kaynağı bilinmeyen kara kutu sorunu

Davaların yayılması ve Microsoft’un riski

İlgili okumalar

1 yorum

Hacker News yorumları