Üretken yapay zekaya daha büyük telif hakkı baskısı geliyor
(garymarcus.substack.com)- New York Times’ın OpenAI’a açtığı davanın ardından, üretken yapay zekanın eğitim ve çıktı aşamalarında telif hakkı ihlali sorumluluğunu nereye kadar taşıması gerektiği daha büyük bir tartışma konusu haline geldi
- Davanın odağında, sohbet botlarının metni neredeyse aynen yeniden üretebilmesi yer alıyor; Marcus ve Reid Southen’in deneyi ise DALL-E’nin de görsellerde benzer tekrarlar üretebildiğini gösteriyor
- Özel adları engelleme gibi güvenlik önlemleri olsa bile, kullanıcıların karakter ya da film adlarını doğrudan yazmadığı istemlerde SpongeBob SquarePants, RoboCop ve video oyunu karakterlerine benzeyen sonuçlar ortaya çıkabiliyor
- Mevcut sistemler, eğitim kaynakları ile üretilen çıktıların kaynak bilgisi ve olası ihlal riski hakkında kullanıcıya bilgi vermediği için, kullanıcı farkında olmadan ihlal niteliğinde çıktılar oluşturabilir
- Marcus, kaynak takibinin mümkün olduğu yeni bir mimari ortaya çıkana kadar ihlal tartışmalarının süreceğini ve New York Times davasının daha fazla davanın başlangıcı olabileceğini düşünüyor
New York Times davası ve görsel tekrar deneyi
- New York Times’ın OpenAI’a dava açtığı dönemde Gary Marcus, film sektöründe konsept sanatçısı olan Reid Southen ile birlikte bir deney yürüttü
- Southen, Marvel, DC, Matrix Resurrections, Hunger Games gibi yapımlarla bağlantılı deneyime sahip biri olarak tanıtılıyor
- Tam raporun gelecek hafta yayımlanacağı, 3 Ocak’ta da IEEE Spectrum’da ek olarak ele alınacağı belirtiliyor
- Davanın odağında, OpenAI sohbet botunun metni neredeyse orijinaliyle aynı şekilde yeniden üretebilmesi bulunuyor
- Marcus ve Southen’in deneyinde, OpenAI’ın görsel yazılımı Bing üzerinden kullanıldığında da görsellerin orijinaline birebir ya da çok yakın tekrarlarının mümkün olduğu belirtiliyor
Güvenlik önlemlerinin engelleyemediği benzer üretimler
- DALL-E’de özel adları ve kasıtlı ihlal girişimlerinin bir kısmını engelleyen güvenlik önlemleri olduğu biliniyor, ancak bunların güvenilir biçimde çalışmadığı söyleniyor
- İhlal olasılığı, kullanıcı doğrudan ihlal amacı taşımadığında ya da karakter ve film adlarından bahsetmediğinde bile ortaya çıkabiliyor
- SpongeBob SquarePants’ten bahsetmeyen kısa bir istemde ilgili sonuçlar çıkabildiği belirtiliyor
- RoboCop’tan bahsedilmeyen durumlar ile video oyunu karakterleri ve marka ihlali riski taşıyan sonuçlar da örnek olarak veriliyor
- X kullanıcısı Blanket_Man01 ve A16Z’den Justine Moore’un da benzer bir olguyu bağımsız olarak keşfettiği söyleniyor
Kaynağı bilinmeyen kara kutu sorunu
- Marcus’a göre üretken yapay zekanın temel sorunu, eğitim kaynakları ile üretilen çıktıların kaynağının kullanıcıya görünmediği bir yapıya sahip olmasında yatıyor
- DALL-E ve ChatGPT gibi sistemler telif hakkıyla korunan materyallerle eğitiliyor
- OpenAI, neyle eğitim yaptığını şeffaf biçimde açıklamıyor
- Üretken yapay zeka sistemleri, telif hakkını ihlal edebilecek materyaller oluşturabiliyor
- Sistem, böyle bir sonuç ortaya çıktığında kullanıcıyı bilgilendirmiyor
- Üretilen görsellerin kaynak bilgisi de sağlanmıyor
- Kullanıcı, oluşturduğu görselin ihlal olup olmadığını bilemeyebilir
- Mevcut DALL-E ve ChatGPT gibi sistemler kara kutuya yakın görülüyor; bu yapıyla kaynak materyale atıf yapmanın zor olduğu düşünülüyor
- Bazı şirketlerin bu alanda araştırma yaptığı, ancak ikna edici bir çözümün henüz bilinmediği belirtiliyor
- Üretilen metin ya da görsellerin kaynağını güvenilir biçimde takip edebilen yeni bir mimari ortaya çıkana kadar ihlallerin sürebileceği düşünülüyor
- İyi bir sistemin kullanıcıya kaynak listesi sunması gerektiği, ancak mevcut sistemlerin bunu yapmadığı söyleniyor
Davaların yayılması ve Microsoft’un riski
- New York Times davasının, birçok davanın ilk örneği olma ihtimalinin yüksek olduğu düşünülüyor
- Marcus’un X’te yaptığı ankette çoğunluk uzlaşma bekledi
- Uzlaşma tutarı konusunda birçok yanıt 100 milyon doların üzerinde bir rakam öngördü; %20 ise 1 milyar dolar bekledi
- Film stüdyolarına, video oyunu şirketlerine ve diğer gazetelere yayılması halinde tutarların büyüyebileceği belirtiliyor
- Örnekler Bing’de DALL-E üzerinden gerçekleştiği için Microsoft’un da sorumluluk riskiyle karşı karşıya olduğu düşünülüyor
1 yorum
Hacker News yorumları
Herkes, böyle bir şeyin birileri tarafından gerçekten sahiplenilebileceği yönündeki kurumsal anlatıyı fazlasıyla kolay kabulleniyor.
Pamuk Prenses ve Külkedisi hikâyelerinin gerçekten sahibi kim? Bu hikâyeler Disney’den çıkmadı; kuşaklar boyunca aktarılan halk masallarının bir parçası. Disney’in başarısı da kısmen, toplulukların yüzyıllar boyunca paylaşıp dönüştürdüğü mevcut anlatıları uyarlamasına dayanıyor.
Bu tartışma yalnızca yapay zekanın teknik ayrıntıları ya da telif hakkının hukuki mantığıyla ilgili değil; paylaştığımız kültürün derin köklerini anlamakla ilgili olmalı.
Kültür özünde ortak bir varlıktır; kolektif hikâyeler ve yeniden yorumlamalar yoluyla evrilir ve büyür.
Üretken yapay zeka ve telif hakkı ihlali tartışmaları, kültürel evrimin bu temelini ıskalıyor gibi görünüyor. Algoritmalar yeni olabilir, ama hikâyeleri yeniden hayal etme ve tekrar kullanma eylemi insanlık kadar eski.
Disney’in mevcut kültür ve mevcut hikâyeler üzerine “fare evi”ni kurup, şimdi de kültürel ifade araçlarını eski ve tuhaf telif haklarına uydurmak için sınırlamayı önermesi bence gerçekten akıl alır gibi değil.
Makaledeki görselde oldukça yeni şeyler kullanılmış ve bunların Mario ya da Coca Cola olup olmadığı bile tartışmalı değil. Nintendo ile Coca Cola ortak bir promosyon yapsaydı, ortaya çıkan görselin aynen böyle olduğuna inanılabilirdi.
Mario’ya benzeyen kıyafetler giymiş kısa, tıknaz bir tesisatçı genel fikrini öne sürselerdi bu başka mesele olurdu; ama bu düpedüz Mario ve Luigi. Robocop ve C3PO. Hiç de incelikli bir durum değil. Böyle markalar AI ile aklanarak silinebiliyorsa, her şey AI ile aklanabilir.
Yenilik LLM’lerde ve onların teknolojisinde; soylu bir kültürel açıklık kavramı altında telif hakkını baştan sona yeniden düşünmekte değil.
Dolayısıyla bu sadece kurumsal bir anlatı değil; doğru ya da yanlış, o anlatının dayandığı hukuk. Şirketler hukukun şekillenmesinde büyük rol oynamış olabilir, ama telif hakkı bireylere de fayda sağlar. Bu, paylaşılan gerçekliğin basit propaganda ya da kurumsal anlatılarla manipüle edilmesi değil; hâkimlerin arabuluculuk ettiği, silahları ve hapishaneleri olan insanların uyguladığı bir şeydir.
Hukuki bir mesele olduğu için mutlaka hukukun teknik ayrıntıları ele alınmalı. “Sadece toplumsal anlatıyı tartışmalıyız” diyerek geçiştirirseniz, maddi sonuçların ve gerçekliğin yerine fantezi koymuş olursunuz. Telif hakkı ve fikrî mülkiyetin yaratıcılığı bastıran yönünü de tartışmalıyız; ama aynı zamanda fiilen olup biteni görmezden gelemeyiz.
Bununla birlikte Georgism yeterince incelenmiyor.
Hukuki sonuçlar insani sonuçlardır ve en az diğer şeyler kadar kültürün parçasıdır. Neyin adil olduğu, emeğin karşılığının nasıl tanındığı ve dağıtıldığıyla ilgilidir.
Bu tür biçimselleştirme, piyasa ekonomisi merkezli olmayan kültürlerde daha az önemli olabilir; “zengin halk masalları dokusu” gibi ifadeler de böyle bir dünyaya dönmeyi çağrıştırıyor. Ancak yapay zekaya nasıl yaklaşacağını düşünen toplum böyle bir toplum değil.
Telif hakkının yeni kopyalama yetenekleri yüzünden geçersizleştiği ya da eskidiği düşüncesi, kelimenin tam anlamıyla tersine çevrilmiş bir fikir. Telif hakkı yeni kopyalama yetenekleri nedeniyle ikna edici hâle geldi.
O dönemdeki somut yetenek sanayileşmiş baskıydı; sıradan yazılım uzmanlarından çok daha zeki görünen kişiler, bu yeteneğin yeni kopyalama gücüne sahip taraf ile değerin temelini oluşturan eserleri yaratan taraf arasında yanlış hizalanmış teşvikler doğurduğunu anlamıştı. Telif hakkı pazarlığının özü bu teşvikleri hizalamaktır.
Yeni kopyalama teknolojileri; neyin yasaklanacağı, sınırlandırılacağı veya izin verileceği, hangi standartların ve uygulama yetkilerinin/sınırlarının konacağı gibi ayrıntıları değiştirebilir. Ama bu pazarlığın bilgeliğini değiştirmez. Bunu değiştirmek için toplumun üretim kapasitesini örgütlemenin ve ödüllendirmenin daha iyi bir yoluna ihtiyaç vardır.
Yine de üretken yapay zeka şirketleri daha fazla para kazansın diye telif hakkını ortadan kaldırma fikri tamamen tuhaf geliyor.
Bana göre soru yanlış
Herkes bunun telif hakkıyla korunan materyallerle eğitildiğini ve ürkütücü derecede benzer çıktılar üretebildiğini biliyordu
Ama bu zaten büyük ölçekte oldu ve büyük şirketler de tamamen işin içine girdi. Sıkılmış diş macununu tekrar tüpe koyma ihtimali yok
Bu, büyük teknoloji şirketlerinin işlerini agresif kullanıcı verisi toplama üzerine kurduğu zamana benziyor. Bunun doğru mu, etik mi, hatta yasal mı olduğu bu aşamada daha çok akademik bir tartışma. Onlar bunu basitçe yaptılar ve toplumun doğru düzgün informed consent’i olmadan fiilen ilerlediler
Burada doğru soru “şimdi ne yapacağız”dır. İzleme teknolojilerinde olduğu gibi yanıt muhtemelen “pek bir şey yok”a yakın olacak
Ucuz müzik kaydı ve üretimi gibi teknolojiler de aynıydı. Bir sanatçıyı bir kez kaydedip plakları kitlesel olarak üretebilirsiniz, ama bu Taylor Swift’i bir kez kaydedip sonra para ödemeden sınırsız kopyalayabileceğiniz anlamına gelmez
1942 müzisyen grevini okumak iyi olur: https://jacobin.com/2022/03/1940s-musicians-strike-american-...
Bu zaten Napster’da, sonra Apple Music’te, şimdi de streaming hizmetlerinde yaşandı
Halk arasında yaygın dosya paylaşımı sürüp gitmek yerine, sahip olmadığımız cihazlara ve streaming aboneliklerine sahip olduk
Apple tüm müziği iPod’a kopyalayıp satmadı; içerik haklarını almak için 10 yıllık sözleşme müzakerelerine ve çok paraya girdi
Neyin doğru neyin yanlış olduğunu söylemeye çalışmıyorum; sadece bu tür mücadelelerin neredeyse hiç anlaşılmadığı bir söz olduğunu söylüyorum
Uber ve AirBnB’nin çoğu büyük şehirde yasa dışı olduğu ama sonunda pazar hâkimiyeti kazandığı zamanları hatırlatıyor
Bence bu daha iyi bile. “Fikri mülkiyet” denen şeye hiçbir zaman inanmadım. Patentler, telif hakları ve hayali “haklar” paketinin tamamı kaldırılmalı
Dünyanın yarısından fazlası, yani Küresel Güney, bu hakları zaten tanımıyor; üstelik sert yasal aşırı uygulama ve tekelci merkezileşme olmadan bunları uygulamak giderek zorlaşıyor
Bunlar milyarlarca, trilyonlarca dolarlık şirketler. Hissedarlar ve üst yönetim bundan ne kadar hoşlanmasa da burada sorumlu toplum üyeleri gibi davranabilecek güçleri var
AB’de bu sorun olmamalı. “Copyright in the Digital Single Market” direktifinin 3. ve 4. maddeleri bunu zaten düzenliyor
Wolters Kluwer özetine göre, ticari makine öğrenimi geliştiricileri dâhil diğer tüm aktörler, yasal olarak erişilebilir eserleri ancak hak sahipleri metin ve veri madenciliği amaçlı kullanımı açıkça saklı tutmamışsa kullanabilir
Bildiğim kadarıyla “eğitim yasak” işareti koyan robot.txt benzeri bir şey tartışılıyor. Muhtemelen belirli güvenlik önlemleri uygulanmalı ve son kullanıcılar üretilen çıktıları kullanırken dikkatli olmalı
Kluwer kaynağı: https://copyrightblog.kluweriplaw.com/2023/02/20/protecting-...
AB mevzuatının orijinal metni: https://eur-lex.europa.eu/eli/dir/2019/790/oj
https://eur-lex.europa.eu/eli/dir/2019/790/oj
Telif hakkı ihlali olmadığını garanti etme sorumluluğu, eseri yayımlayan kişiye aittir
Onu kendiniz çizmiş olmanız, hukuk eğitimi olmayan bir çırak ressama yaptırmış olmanız, fotoğraf çekmiş olmanız ya da yapay zekayla bir görsel üretmiş olmanız bunu değiştirmez
Neden ChatGPT’nin veya başka bir aracın mevcut telifli içeriği üretmeyeceğini varsayıyoruz?
“Üretildiği” için özgün olacağı yönündeki saf varsayımı anlayabiliyorum. Ama “ChatGPT”yi “junior artist” ile değiştirdiğiniz anda bu varsayım çöker
Bir bilimkurgu filmindeki droid’i çizmesini istediğinizi ve başka bir şey söylemediğinizi düşünün. Teliften bahsetmiyorsunuz, özgün olması gerektiğini de söylemiyorsunuz. O zaman ne çizmesini beklersiniz?
O varsayımsal junior artist de en az o kadar, hatta belki daha fazla sorumluluk taşır
Bu makalenin ve NYT davasının özünü hiç anlamamış gibi görünen şaşırtıcı derecede çok yanıt var. ChatGPT, NYT makalelerinin önemli bölümlerini yüzlerce ila binlerce kelime uzunluğunda tamamen orijinal metinle birebir yeniden üretip kamuya açık şekilde sunabiliyordu
Bu türev eser değil. O aşamayı çoktan aşmış durumda. NYT’nin elinde çok güçlü bir dava var; telif hakkının artılarını ve eksilerini tartışanlar ise asıl noktadan uzaklaşıyor
Bu tek dava telif hakkını tek başına altüst etmeyecek. OpenAI’nin öne sürebileceği şey en fazla “bu yeni bir şeydi, böyle olacağını nereden bilebilirdik” düzeyinde. Öyleyse şu anda eğitilmiş modeller çok zor bir durumda
Ayrıca NYT’nin uzlaşacağını sanmıyorum. Sonuçları çok büyük; OpenAI ile uzlaşırsa diğer tüm modellerde de benzer davalar doğacaktır. Dijital içerik yayımlayan diğer tüm medya kuruluşlarının da benzer ölçüde geçerli davaları olur
Bu, üretken yapay zeka için bir dönüm noktası ve ilk düşündüğümüzden çok daha pahalı ya da çok daha kısıtlı hale gelme olasılığı yüksek görünüyor
Yan etki olarak korsan modellerin artacağını düşünüyorum. Yasallığı tamamen göz ardı eden, dağıtık biçimde eğitilen ve ağırlıkları şirketler tarafından değil topluluklar tarafından dağıtılan modeller; örneğin torrent modelleri ortaya çıkabilir
Bu modellerin resmi “uslu” modelleri performansta geçme olasılığı da epey yüksek. Önümüzdeki birkaç yıl ilginç gelişecek gibi
Mantık şu: ChatGPT varsayılan olarak telifli eserleri yeniden üretmez; YouTube’un insanların yüklediği videoları sunması gibi, üçüncü taraf kullanıcıların istekleri veya eylemleriyle yeniden üretir
OpenAI’nin niyeti telif hakkı ihlali değildi ve gerçekten de araştırmacıların çoğu ya da büyük bölümü, modellerin herhangi bir eserin önemli kısımlarını yeniden üretecek kadar aşırı uyumlu olmadığına inanıyordu
Esasen arkasında dev bir şirket olmayan telif hakkının hiçbir anlamı yok; arkasında şirket varsa da, telif hakkında olması gereken sınırlamalardan bağımsız olarak sonsuza dek kilitlenebiliyor
OpenAI’nin eski haberleri birebir yeniden üretebilmesi NYT’ye hiçbir şey kaybettirmiyor
NYT kazanırsa bizim kaybedeceğimiz çok şey var. Artık telif hakkına yeniden bakma zamanı. Bunu gerçekten yapabiliriz; ayrıca oldukça eskidiği için güncellenmesi gerekiyor
Stable Diffusion, Control Net ve LoRA gibi şeylerden azami ölçüde yararlanıldığında diğer kapalı kaynak/proprietary modelleri geride bırakıyor
Biraz idealist olabilir ama sanatın ve yayıncılığın temel amacının yalnızca büyük para kazanmak değil, kültür ve toplum üzerinde etki yaratmak olması gerektiğine her zaman inandım
Bu yüzden özgün eserlerin korunması gerektiğini, ancak yaratıcılığı ve ilhamı teşvik etmek için çok daha hızlı şekilde kamu malı alanına girmeleri gerektiğini düşünüyorum. Geçiş süresi onlarca yıl değil, birkaç yıl ölçeğinde düşünülmeli
Sanatın başlıca amacı bireyde duygu uyandırmaktır. Sanatın ders vermesi gerektiği fikri, bugün bu kadar çok bariz “aktivist” kurgu olmasının muhtemel nedeni
Bunları düzeltmek o kadar da zor görünmüyor. Örneklerin çoğu genel bir açıklama değil, iyi bilinen bir nesneye işaret eden kısaltılmış ifadeler
“video oyunu tesisatçısı” fiilen “Mario” ile eş anlamlı ve karakteri azıcık bile bilen herkes bunu bilir
Benzer şekilde, bir açıklama aracıyla Mario gibi görselleri tarif ettirip [1], “video oyunu tesisatçısı” yazan kişiler için bu tür sonuçları kaldırmak ne kadar zor olabilir?
İnternetin ilk dönemlerinde insanların telif yasalarını ihlal ettiği gerekçesiyle ücretsiz fan fiction’ları ortadan kaldırmaya çalıştıkları zamanları hatırlatıyor. Yaratıcının satmaya çalışmadığı kişisel kullanım için telif yasasını uygulamaya çalışmak bana göre epey korkunç
50 yıl sonrasını hayal edelim. “Robot, okul dioraması için çizdiğim şu resmi keser misin?” “Elbette.” “Bunu da yap.” “Hata: Bu görsel telifli materyal içeriyor olabilir, işlenemiyor.”
Üretken yapay zeka sistemleri telif hakkını ihlal eden materyal üretme konusunda yeterli kapasiteye sahip
Ve bunu yaptıklarında kullanıcıya haber vermiyorlar
Dolayısıyla herhangi bir çıktı, web’de belirsiz ama hâlâ korunan kaynak materyali ihlal edebilir ve o çıktıyı kullanan herkes hiçbir uyarı olmadan dava riskiyle karşı karşıya kalabilir
Bunu düzeltmek çok zor
Kasıtlı olarak ihlal içeren içerik üretmeye çalışmıyorsanız bu tür sonuçları kaldırmak ya da atmak mümkün olabilir; ancak sorun, yapay zekayı kandırıp bu tür içerikleri ürettirmeye çalışan kişiler. Telifli ve markalı eğitim materyallerinin tamamı hariç tutulmadığı sürece onları durdurmak imkânsız olacaktır
Üretken yapay zekanın bir başka sorunu da makalede geçen “DALL-E ve ChatGPT gibi sistemler özünde kara kutu” ifadesi
Bir kullanıcının ya da mağdurun, yapay zekanın neden böyle bir karar verdiğini tam olarak bilme hakkı olduğu durumlarda yapay zeka karar verme sürecinde kullanılırsa ne olur? İş ve hukuk açısından mevcut yapay zeka çözümlerinin riskli olduğunu ve çok sınırlı kullanılmaları gerektiğini düşünüyorum. Çünkü onları yapan kişiler bile yapay zekanın hangi seçimi yapmasına yol açan kesin bilgi parçacığını gösteremiyor
“columbian coffee logo” yazdığınızda zaten var olan marka logoları çıkarsa, bu logoların daha önce var olup olmadığını kontrol etmek için tüm interneti tersine mühendislikle mi incelemek gerekiyor?
Yapay zeka ilham kaynaklarını göstermeli. Bir şeyden ilham alarak üreten insanlar, ne kullandıklarını ve intihal çizgisini aşıp aşmadıklarını tam olarak bilir. Ancak yapay zekanın çalışma biçimi bunun için fazla opak
Yapılması gereken tek şeyin kaynakları ortaya koymak olduğunu düşünüyorum. Ancak bu, yapay zeka şirketlerinin veri kümelerini açıklaması gerektiği anlamına gelir ve sahip olmamaları gereken ya da açıklanmaması gereken bilgiler de ortaya çıkabilir
Anladığım kadarıyla üretken yapay zekâ için hukuki emsal, Google’ın kamu yararı için arama dizini oluşturmak üzere web sitelerini kazıyabilmesine benziyor.
Google ayrıca web sitelerinin önbelleğe alınmış sürümünü de gösterebiliyor ve bu, ilgili sitenin özgün içeriği. Google başka web sitelerinin içeriğini olduğu gibi gösteriyor diye kimsenin bunun telif hakkı ihlali olduğunu söyleyeceğini sanmam.
Bu yüzden bu argümanın zayıf olduğunu düşünüyorum. Tüm kültürel referanslar ve popüler IP’ler, hatta daha az bilinenler bile kaldırılmak zorunda kalırsa yapay zekâ işe yaramaz hale gelir.
Kişisel olarak üretken yapay zekânın, eğitim verilerindeki benzer özgün materyallere bağlantılar sunabilmesi gerektiğini düşünüyorum. Yapay zekâ eğitimine katkıda bulunanları ödüllendirmenin asgari yolu bu.
Üretken yapay zekâ, özgün materyali üreten web sitelerini ve sanatçıları tamamen öldürecek bir yöne giderse bunun uzun vadede sürdürülebilir olduğunu düşünmüyorum. Kaynaklar şeffaflık katar ve kullanıcının bunun halüsinasyon olup olmadığını anlamasına da yardımcı olur.
İnsanlar içeriklerinin eğitimde kullanılmasını opt-out edebilmeli ve gelecekteki sürümlerden kaldırılıp kaldırılmadığını da doğrulayabilmeli.
Açıkçası yapay zekâ şirketleri bunu sadece davalardan kaçınmak için gizli tutuyor. Kıyamet senaryolarından ziyade bu tür alanlarda düzenlemenin faydalı olabileceğini düşünüyorum.
[1]: https://yro.slashdot.org/story/03/07/14/025216/web-caching-g...
[2]: https://www.theguardian.com/technology/2016/apr/27/getty-ima...
Her teknoloji dalgasının, yaratıcıları zaman ve para harcayıp özgün materyal üretmeye ikna eden bir yöntemi vardı; sonra kurallar değişti.
Google içeriğe erişim alanı ve yeni pazarlar vaat etti ve bu gerçekten işe yaradı. Sonra snippet’leri, reklamları ve ziyaretçileri özgün siteye göndermek yerine kendi otoyolunda tutan her türlü mekanizmayı devreye soktu.
Reddit, Stack Overflow vb. puan ve rozet gibi oyunlaştırma unsurları ve toplulukla kullanıcıları özgün içerik katkısında bulunmaya teşvik etti.
Şimdi yapay zekâ bu yaklaşımları sarsıyor. Her aşamada özgün materyal üretme teşviki giderek azalıyor gibi görünüyor. Çünkü karşılığında gelen ödül giderek düşüyor.
Yapay zekâ, hiçbir fayda sağlamadan — yani erişim alanı, oyunlaştırma, topluluk veya tanınma ihtimali olmadan — özgün içeriği papağan gibi tekrarlıyorsa, uzmanlar için artık hangi teşvik kalıyor?
Bu, yorumunu yazmanı etkileyen özgün materyallerin bağlantılarını verememen gibi. O yanıtı üretmeni sağlayan nöron ağırlıklarına ne kadar eğitim girdi? İtalik kullanımını ve bunun kelime yorumuna etkisini nereden öğrendin? Bu foruma uygun tonu nereden öğrendin?
“İnsanlar içeriklerinin eğitimde kullanılmasını opt-out edebilmeliyse”, ben bir kitap yazdığımda senin o kitabı okumanı engellemek için opt-out edebilmeli miyim? Eserimi kimin okuyabileceğine dair koşullar koyabilmeli miyim? Din? Ten rengi? Ezberleme becerisi zayıf insanlar?
Kimin bilgi edinebileceğini sınırlama fikrinin kulağa saçma gelmesini umarım. Öyleyse aynı sınırlama “kim”e değil de “ne”ye uygulandığında neden kabul edilebilir oluyor?
Yapay zekâ şirketlerinin davalardan kaçınmak için gizli tutması araştırma bariyerleri yarattı. Ben ve Joe aynı veri kümesiyle araştırma ve makale üzerinde işbirliği yapabilmek yerine eğitim verilerini saklamak zorunda kalıyoruz. Luddite’lar makineleri parçalamaya gelir diye. Sanki öğrenmek, ancak fazla iyi yapılmadığında kabul edilebilir.
Ancak yapay zekâ eğitiminin adil kullanımın 4 faktörlü testini gerçekten karşılayıp karşılamadığı henüz görülecek.
Üretken yapay zekâda da bunun uygulanabilmesi gerektiğine katılıyorum, ancak bu bilgiyi korumak eğitim maliyetini çok daha pahalı hale getirebilir ve yapay zekâ şirketlerinin buna pek ilgisi yok. Muhtemelen işlem sonrası aşamada olası telif sorunlarını sezgisel olarak değerlendirmeye çalışacaklardır.
Daha ilginç soru, neredeyse kelimesi kelimesine yeniden üretme durumlarının ötesinde, telif hakkı sahiplerinin eserlerinin topluca yapay zekâyı daha genel bir şekilde etkilediği gerekçesiyle izinsiz kullanım iddiasında bulunup bulunamayacağı.
Üretken yapay zekâya özel, daha net yasalara ihtiyaç var. Gerçek insanlarla çok fazla karşılaştırma ve benzetme yapılıyor.
“Biri ticari marka kapsamındaki materyallere bakarak resim yapmayı öğrenip yanlışlıkla benzer bir şey üretirse ne olur?” gibi şeyler söyleniyor ama bu modeller insan değil ve ayrı bir kategoride yer alıyor.
Bu modellerin bir ölçüde ticari marka ihlali yaptığını düşünüyorum, ama aynı zamanda buna izin verilmesi gerektiğini de düşünüyorum. Nihai sorumluluk, görüntüyü genel kamuya sunulacak bağımsız bir medya olarak kullanan kişide olmalı.
Bu tür tartışmalarda modellerin asıl meseleden çok sis perdesi gibi işlediğini ve tartışmanın orada takılıp kaldığını düşünüyorum
Modeller, “sorumluluk zinciri” içinde makul bir inkâr edilebilirlik sağlıyor. “LLM”i çıkarıp yerine “lunapark yan gösterisindeki sihirli kutu”yu koyarsanız, LLM’in özel bir şey olduğu ve istisnayı hak ettiği argümanı çok hızlı biçimde ortadan kalkar
Betamax içtihadı, ihlal oluşturmayan kayda değer kullanımları olan bir teknolojinin kendi başına ihlal sayılmayacağını söyler
Yapay zeka çıktılarının telif hakkı koruması doğurmadığına dair zaten emsal var; aynı mantıkla, yapay zekanın üretim eyleminde bir niyet ifade edilmez. Dolayısıyla ihlal olup olmadığı, çıktıyı kullanan insana bağlı olmalıdır. Çünkü kara kutunun kendisinin eyleyen özne olma niteliği yoktur
LLM’in ya da daha genel olarak üretim tekniklerinin somehow bir sonraki büyük dalga olduğu sonucuna varmadan önce, ya da “genel” zekânın eşiğinde olduğumuzu iddia etmeden önce, önce o kapıyı göstermeleri gerekir
O kapı, bir kutuya bir şeyler girip öbür taraftan çıkanları izlemenin eğlence değerinin ötesinde, gerçek sorunları çözmek için endüstriyel benimseme yaşandığını gösteren bir şey olabilir. Ama şimdiye kadar gördüğüm kadarıyla bunu gerçekten yapan bir yer yok gibi