- Yargıca göre Anthropic, yapay zeka sohbet botu Claude’u eğitmek için yüz binlerce ikinci el kitabı parçalayıp taradı
- Karar metninde ayrıca 7 milyondan fazla korsan kitap indirildiği de belirtiliyor
- Yargıç, satın alınan kitapların dijitalleştirilerek eğitim verisi olarak kullanılmasının adil kullanım kapsamına girdiğine hükmetti
- Buna karşılık, korsan kopya verilerinin kullanımı adil kullanım sayılmadı ve bunun telif hakkı ihlali olduğu vurgulandı
- Bu karar, yapay zeka modeli eğitimi sırasında telif hakkı uygulaması açısından önemli bir emsal olarak değerlendiriliyor
Genel Bakış
- ABD Kaliforniya Kuzey Bölgesi Federal Mahkemesi yargıcı William Alsup, Anthropic’in yapay zeka sohbet botu Claude’u eğitmek için veri kaynağı olarak kitaplar, sosyal medya gönderileri, videolar ve çeşitli başka materyaller kullandığını değerlendirdi
- Anthropic, milyonlarca dolar harcayarak büyük miktarda ikinci el kitap satın aldı; ardından ciltlerini söküp sayfalarını keserek bunları dijital dosyalara dönüştürdü
- Dönüştürülen dosyalar şirket içi bir araştırma kütüphanesinde saklandı, orijinal kitaplar ise elden çıkarıldı
- Ayrıca Amazon ve Alphabet destekli Anthropic, 7 milyondan fazla korsan kitabı ayrı olarak indirip Claude modelinin eğitiminde kullandı
Kitapların kullanımı ve korsan kopyaların edinilme süreci
- Anthropic’in kurucu ortaklarından Ben Mann, 2021’de Library Genesis üzerinden en az 5 milyon kitabı yasa dışı şekilde indirdiğini kabul etti
- 2022’de ise Pirate Library Mirror üzerinden buna ek olarak en az 2 milyon kitap daha indirildi
- Kurucu ortak ve CEO Dario Amodei’nin, “hukuki, teamüle dayalı ve ticari zahmetlerden kaçınmak için kitapları çalmayı (steal) tercih ettiğini” söylediği aktarıldı
- 2023’te üç yazar, kendi kitaplarının korsan kopyalarının izinsiz kullanıldığı gerekçesiyle Anthropic’e karşı toplu dava açtı
Yargıcın değerlendirmesi: kitaplarda adil kullanım ile korsan kopya ayrımı
- Nokta 1: Adil kullanım kabul edildi
- Yargıç, Anthropic’in kitapları büyük ölçekte dijitalleştirmesini ve bunları yapay zeka eğitim verisi olarak kullanmasını “son derece dönüştürücü (exceedingly transformative)” olarak değerlendirdi
- Kararda, “Anthropic’in LLM’i mevcut belgeleri basitçe kopyalamayı ya da onların yerine geçmeyi değil, tamamen farklı bir şey yaratmak için öğreniyor” denildi
- Şirketin doğrudan satın aldığı kitapları dijitalleştirip kütüphanede saklaması adil kullanım kapsamına girdi
- Nokta 2: Korsan kopya kullanımı adil kullanım değil
- Yargıç, Anthropic’in korsan kitapları veri olarak kullanmasını sert biçimde eleştirdi
- “Anthropic’in merkezi kütüphanesinde korsan kitapları kullanma hakkı yoktur ve kalıcı, genel amaçlı bir kütüphane kurmak tek başına adil kullanımı haklı çıkarmaz” ifadesine yer verildi
Etkiler ve sektördeki eğilimler
- Bu karar, telif hakkıyla korunan kitapların yapay zeka modeli eğitim verisi olarak kullanılmasının adil kullanım sayılıp sayılmayacağına ilişkin ilk örneklerden biri oldu
- Son dönemde OpenAI ve çeşitli üretken yapay zeka şirketlerine karşı yaratıcılar, sanatçılar ve medya kuruluşları tarafından benzer davalar art arda açılıyor
- Yapay zeka sektörü, model eğitiminin adil kullanım kapsamında olduğunu savunurken; içerik üreticileri kendi haklarının ihlal edildiğini söylüyor
- Kısa süre önce Disney, yapay zeka görsel üretim şirketi Midjourney’e kendi karakterlerinin telif haklarını ihlal ettiği gerekçesiyle dava açtı
Sonuç
- Anthropic’in kitapları dijitalleştirmesi ve adil kullanım ile ilgili bölüm, yapay zeka araştırmaları ve telif hakkı yorumları açısından bir dönüm noktası niteliğinde görülüyor
- Buna karşılık, korsan kopyaların kullanımı açık biçimde telif hakkı ihlali olarak tanımlandı ve bu durum gelecekte yapay zeka eğitim verisi tedarik standartları için önemli bir referans oluşturdu
1 yorum
Hacker News görüşü
Makalenin orijinal bağlantısı
Hakimin önemli kararının özeti: Anthropic'in telif hakkıyla korunan kitapları yapay zeka eğitimi için kullanması, “son derece dönüştürücü” olduğu gerekçesiyle adil kullanım sayıldı. Anthropic, satın aldığı gerçek kitapları yalnızca merkezi bir kütüphanede dijital olarak sakladığını, yeni kopyalar üretmediğini veya yeniden dağıtmadığını savundu. “Kütüphaneyi korsanlamak” ise açık bir telif hakkı ihlali. İlginç olan, hakimin dahili kullanım için bir kütüphaneyi tarayıp dijitalleştirmenin mümkün olduğunu kabul etmesi ve yapay zeka eğitimi için kullanımını da adil kullanım sayması.
Öte yandan hakimin başka bir noktaya dair söyledikleri de önemli. Anthropic'in korsan kitapları merkezi kütüphane gibi kullanmasının adil kullanım olmadığı açıkça çizilmiş. Yani kitapları doğrudan satın alıp fiziksel olarak tarayarak yapay zeka eğitimi için kullanmak adil kullanım; korsan kopya kullanmak ise adil kullanım değil
Bunun yeni bir karar olduğunu düşünmüyorum. Bence Google zaten 10 yılı aşkın süre önce kitapları dijitale dönüştürmenin izin verilebilir olduğuna dair emsal oluşturmuştu
Bildiğim kadarıyla Meta ile ilgili devam davasında hakim Vince Chhabria adil kullanım iddiasına karşı çıkmıştı ilgili bağlantı (hukukçu değilim)
Burada ‘zehirli ağacın meyvesi’ ilkesinin de uygulanıp uygulanmayacağını merak ediyorum
Eskiden Aaron Swartz'ı neredeyse aynı şey yüzünden ömür boyu hapse göndermeye çalıştıklarını düşününce, zamanın gerçekten ne kadar değiştiğini hissediyorum
Büyük ölçekli telif hakkı ihlaline karışan bireylere verilen gerçek ceza örnekleri ilgili haber
Açıkçası Aaron Swartz davasını anacaklarını düşünmüştüm
Yukarıdaki habere tıklayınca, aslında milyonlarca dolarlık korsan yazılımı ‘satan’ bir işletmeden bahsettiğini gördüm. Tek başına kullanmak değil, açıkça çalıp başkalarına yeniden satarak kâr elde etme vakası. Dönüştürücü kullanım ya da kişisel kullanımla tamamen farklı bir durum
Anthropic bu materyalleri satmıyor. Bir kişinin kitap okuyup özet çıkarması ya da bazı bölümleri alıntılaması yüzünden hapse gönderileceğini de sanmıyorum. Buna rağmen Autodesk'e direndi diye 7 yıl ceza verilmesi, bunun soygundan bile ağır olması, hukuk dünyasının gerçekliğini iyi gösteriyor gibi
Sadece korsan yazılımı yasa dışı biçimde çoğaltıp satma vakasıyla Anthropic'in kitap kullanımı çok farklı bence. Anthropic hiçbir kitabın ‘kopyasını’ üretip dağıtmadı
Yasayı çiğnemeyi düşünüyorsan önce şirket kurup sorumluluğu ona yükle diye yapılan şaka. Yeterli sermayen varsa yasa ihlalinin bile karşılanabildiği gerçeğine dair bir taşlama
Spotify gibi şirketlerin de ilk dönemde korsan materyaller üzerinden büyüdüğüne dair işaretler var. Eskiden beta testlerinde ‘korsan’ mp3 dosyalarının kullanıldığına dair söylentiler vardı. Gerçekten de ‘Scene’ etiketi taşıyan parçaların indirildiğini deneyimleyenler olmuş ilgili haber
Crunchyroll da başlangıçta korsan anime yayın sitesi gibiydi ama resmi lisans alarak yasallaştı. 2006'da başladı, 2008'de VC yatırımı aldı, 2009'da lisans anlaşması yaptı Forbes haberi, Venturebeat haberi
Aslında yalnızca Spotify değil, çoğu teknoloji devi de hukukun gri alanlarında ya da düzenlemeleri görmezden gelerek — yani pazarı ‘disrupt’ ederek — para kazanıyor. Çünkü elde edilen haksız kazanç çoğu zaman hukuki yaptırımdan çok daha büyük. Bence Amazon'dan sonra yatırım parasıyla ‘adil rekabeti’ hiçe sayıp zararına fiyatlama yapmak da çok yaygınlaştı. ABD'li büyük teknoloji şirketleri adeta yasayı etkisizleştirerek büyüdü
‘Resmi olarak edinilmemiş ses dosyası’ ile ‘telifsiz ses dosyası’ farklı kavramlar. Streaming lisansı alınmış olsa bile orijinal dosya elde olmayabiliyor
Spotify'ın ilk arayüzünün Limewire'ın birebir kopyası seviyesinde olduğundan da bahsediliyor
Google Music'te de kullanıcıların mp3 vb. dosyaları doğrudan yüklediği bir model vardı; o dönemde dosyanın yasa dışı olmasının Google'ın sorumluluğunda olmadığı savunuluyordu. Amazon'un da benzer bir hizmeti olmuştu ilgili yazı
Yapay zeka geleceğini inşa ettiğini söyleyen insanların etiği bu şekilde bir kenara bırakması düşündürücü. Çin onlarca yıl sahte ürün sorunu yüzünden yaptırımlarla karşılaştıysa, Anthropic de yasa dışı faaliyetlere karıştıysa ihracat kısıtlamaları da meşru olabilir diye düşünüyorum
Çin'deki sahte ürün sorununa karşı gerçekte ne yaptığımızı merak ediyorum. Cezaların çoğu ancak yerelde yakalanan sahte malların ithalatını durdurmakla sınırlıydı; gerçek anlamda caydırıcı cezalar pek uygulanmadı. Hatta ABD şirketleri uzun süre üretimi dışarı vererek fikri mülkiyet ihlaline uygun bir ortam yarattı
Asıl etik dışı olan taraf, kitapları hiç satın almayan şirketler. Ekonomik ve hukuki gücün varsa işin içinden daha kolay sıyrılabildiğin bir gerçeklik var
Toplumdaki yaygın çifte standartlar ve güce tanınan dokunulmazlık eleştiriliyor. Alkollü araç kullanma, şiddet, vergi kaçırma gibi örneklerle; toplumun bütünüyle güç, servet ve etkiye göre eğildiği vurgulanıyor. Bir yayınevi kitabımı kopyalarsa dava açabilirim ama bir yapay zeka şirketi çalarsa büyük hukuk büroları yüzünden dava açmak bile zor. Gerçek dünyada eşitlik bir yanılsama ve güçlü olan taraf her zaman avantajlı
Facebook sloganındaki gibi, ‘bir şeyleri kırıp hızla ilerlemek’ erdem sayılan bir çağdayız
Kitaplardaki bilgiyi kullanmanın neden etik dışı olduğu konusunda şüpheliyim. Anthropic bu kitapları yeniden satmadı. Kitaptaki bilginin kendisi telif hakkıyla korunmaz. Alıntı yapmak her zaman mümkündür
Anthropic kurucu ortaklarından Ben Mann'ın 2021'de Library Genesis'ten milyonlarca korsan kitap indirdiği iddia ediliyor. Hırsızlık hırsızlıktır. Çifte standartları bırakalım diyen bir görüş
Korsanların çoğu yalnızca ‘kişisel tüketim’ amacıyla hareket ediyor; korsan içerik üzerinden ‘kâr elde etmek’ ise başka bir seviye
Bu sadece basit bir hırsızlık değil; pazar hakimiyeti kurmak için hedefli biçimde çalıp etik davranan şirketleri piyasadan silmek, çok sayıda yazara daha büyük zarar veriyor. Bence bu, ‘örgütlü suç’a daha yakın
“Hırsızlık hırsızlıktır” sözü fazla basit kaçıyor. Bir ürünü alıp çıkmış olsan bile, koşullara göre ceza çok farklı olabilir. Ayrıntılar önemli
Önce ‘hırsızlık’ın tanımını doğru yapmak gerekir
“Kopyalama hırsızlık değildir.” Bir şeyi kopyaladığında, asıl sahibi kendi kopyasına sahip olmaya devam eder. Kopyalamaya ‘hırsızlık’ dersen başka aşırı iddiaların da önü açılır deniyor
Büyük ölçekli yapay zeka veri eğitiminin gerçekliğinde, korsan içerik ve para cezası, milyonlarca kitabı tek tek satın alıp işlemekten çok daha ucuz. Elbette bu meşrulaştırılamaz ama insan kendi yerinde olsaydı verimlilik yüzünden aynı tercihi yapabileceğini düşünerek bir çelişki hissediyor
Bu mantığın sorunu şu: Yıllarca kitap yazan çok sayıda öğretmen ve yazar, büyük şirketler telif ihlali yaptığında dava bile açamayabilir. Sonuçta yazarlar yazmaktan vazgeçebilir ve bunun şimdiden görülmeye başlandığı söyleniyor
Kasıtlı ihlalde eser başına en fazla 150 bin dolar ceza var. Eğer ihlal edilen tüm materyaller için karar verilirse, ortaya Anthropic'in piyasa değerinden bile büyük bir rakam çıkabilir. Ama gerçekte bu tür aşırı sonuçlar uygulanmıyor; 2000'lerin başındaki Napster işleten gençlerle bugünkü ölçek için hukuk aynı ölçüyü kullanmıyor
“Korsanlık yüzünden hapse girilmez mi?” sorusu var. DVD'lerdeki FBI uyarılarına bakılırsa, ilkesel olarak ağır suç sayılması gerekir
Aslında habere göre Anthropic'in çok sayıda kitabı resmi olarak satın alıp eğitimde kullandığı örnekler de var. İlgili davadaki tüm kitaplar arasında resmi olarak satın alınmış olanlar da bulunuyor. İkinci el kitaplar toplu alımda daha ucuz
Hukuki riski ‘sıfır’a indirmek istiyorsan, yayınevleriyle doğrudan iletişime geçip yapay zeka eğitimi lisansı müzakere etmek gerekir. Netflix, Spotify ve diğer tüm medya şirketleri böyle yapıyor. Yapay zeka şirketlerine neden farklı bir ilke uygulanıyor, bunu anlamıyorum
Bir kitabın sahibi isem, onu kendi bilgisayarımda taramanın yasal olması gerektiğini düşünüyorum. Yapay zeka şirketlerinin durumuna da biraz üzülüyorum. Telif hakkı kuralları sanki yapay zekayı hedef alacak şekilde giderek daha katı hale geliyor. Ben bir kitabın içeriğinden fikir alıp yeni bir şey üretsem de, kitap telifine geri ödeme borcum olduğunu düşünmüyorum
Haberde ne dendiğini dikkatli okumak lazım. Metinde de kendi kitabını tarayıp yapay zeka eğitiminde kullanabileceğin açıkça yazıyor. Hatta bu karar yapay zeka şirketleri için büyük bir olumlu gelişme. Tersini okumayı anlamıyorum
Adil kullanım tartışmalarında kaçırılan nokta, bu kullanımın telif hakkı sahibinin pazarına somut biçimde zarar verip vermediğidir. Bir bireyin bir kitaptan bir şey öğrenip yazarla rekabete girdiğini kanıtlamak zor olabilir. Ama yapay zekanın büyük ölçekte öğrenip piyasaya sürülen bir model üzerinden yazar gelirini düşürmesi nispeten daha net gösterilebilir. Eğer yapay zeka telifli eserler üzerinden yazarı ikame edebiliyorsa, bu adil kullanımın ruhuna uymuyor
Telif hakkı yasası bana mantıksal olarak tutarlı bir yapıya sahip değilmiş gibi geliyor. Bilgi özgürlüğü ve yeniliği teşvik etme gibi ilk amaçları da belirsiz. Yasa yorumu hakimin öznel değerlendirmesine bağlı kalıyor. Sonuçta hukukun gerçek mantığı ‘para’ ve telif hakkının gücü de büyük sermaye tarafından korunuyor. Eğer artık bu sistem sermayenin önüne engel çıkarmaya başlıyorsa, şimdiye kadarki DRM ve telif söylemlerinin nasıl değişeceğini yaşayarak göreceğiz
Ölçek büyüyünce her şey farklı işler. Bireysel hak ve normları mega sistemlere olduğu gibi uygulayamazsın; toplumsal olarak da böyle bir ayrım gerekli. Parası olan taraf bu sorunu görmezden gelmeyi mümkün kıldı ve yaşanan karmaşanın temel nedeni de ‘ölçek’ konusunda yeterli düzenleme olmaması
Özet: Hakim, Claude eğitimi için kitap kullanımını adil kullanım saydı ama ‘korsan’ kullanımını yasa dışı buldu
YouTube'un son dönemde indirme engellerini artırmasının, rakip yapay zeka şirketlerinin veri seti toplamasını engellemek için olabileceğini düşünüyorum
Başkalarını suçlamak kolay ama mevcut başlıktaki en üst yorum da sonuçta Business Insider'dan ‘çalınmış’ içeriğe bağlantı veriyor. Kimsenin tamamen adil olmadığı bir gerçek
Bunun Business Insider'dan nasıl ‘çalınmış’ içerik olduğunu merak ediyorum. Aynı makaleyi resmi web sitesinde de görebiliyorsun; tarayıcı önbelleği ya da arşiv de özünde çok farklı değil
Bu bugün başlıktaki en iyi yorum. Buradaki mantıksal taklaları izlemek ilginç bence