Anthropic, kitap yazarlarıyla davayı uzlaştırmak için 1,5 milyar dolar ödemeyi kabul etti
(nytimes.com)- Anthropic, yazarlarla davayı 1,5 milyar dolara uzlaştırmayı kabul etti
- 1,5 milyar dolar, ABD telif hakkı davaları tarihinde görülen en büyük tazminat tutarı
- Anthropic, 500 bin yazara eser başına 3.000 dolar ödemeyi planlıyor
1 yorum
Hacker News görüşleri
Haberi archive.ph üzerinden görüntüle
Burada asıl tartışma konusu model eğitiminin kendisi değil, bunun net olmasını isterim
Eğitimin kendisi adil kullanım (fair use) kapsamına giriyor, sorun kitapların izinsiz kopyalanmasıyla (pirating) ilgili; Anthropic veri toplarken bu durum yanlışlıkla yaşandı
İkinci el kitap alıp tarayarak eğitmekte sorun yok
Rainbows End birçok açıdan zamanının ötesinde bir romandı
İkinci el kitap alıp tarayarak eğitmenin kabul edilebilir olduğu fikrine karşılık, gerçekte bunu yapan bir şirket olacağını sanmıyorum
Ortada onlarca milyar dolarlık VC fonu varken, kim tek tek kitap satın alıp rahat rahat taramakla uğraşır ki
Herkes cezayı göze almayı seçer ve ceza seviyesi caydırıcı olmaktan çok uzak
Bu, Uber’in başlangıçta taksi lisansı olmadan işe girip sonrasında yatırım parasıyla cezaları ve lobiciliği kullanarak krizi atlatmasına benziyor
Anthropic için de tek tek yayınevleriyle lisans anlaşması yapmak yerine DRM’siz PDF ve ePUB’ları bulduğu gibi içeri atmak çok daha hızlı ve verimliydi
Bu olay bir uzlaşma, yani emsal ya da hukuka aykırılığın kabulü değil
Ne eğitimin adil kullanım olduğu ne de taramanın sorun olmadığı bu olayla kesinleşmiş değil
Bu mesele gelecekte başkalarının mücadele etmesi gerekecek bir konu
Rainbows End romanının çağı öngördüğüne katılıyorum
Okumayı seven herkes için çok iyi bir kitap ve yazar Vernor Vinge, 'singularity' (tekillik) terimini de popülerleştirmişti
Goodreads'te Rainbows End bilgileri
İkinci el kitap satın alıp okuma fikrinin kendisinin garip olduğunu düşünüyorum
Herkesin kütüphanedeki tüm kitapları özgürce okuma hakkı olması gerektiğini düşünüyorum
Bilgi bu dünyada sunulmak için var ve insanların ona aktif biçimde erişmesi gerekir
Aaron Swartz, eğer libgen’in bu kadar sıradanlaştığı bir dönemi görseydi ne düşünürdü diye merak ediyorum
Uzlaşma şartlarının özeti
Eser sayısı 500 bini aşarsa her ek eser için 3 bin dolar daha eklenecek
Gelecekte oluşacak ihlaller ve üretken yapay zeka çıktılarından doğacak ihlaller bu uzlaşmayla çözülmüş sayılmıyor
Buradaki önemli noktalardan biri, ortada hiçbir “hukuki emsal” kalmamış olması
Benzer davalar açılırsa her şeyin baştan yeniden tartışılması gerekecek
İnsanlar genelde ancak kaybedeceklerini düşündüklerinde böyle bir uzlaşmayı seçer
Bu, Google’ın Epic ile davasında mahkeme kararı çıkmadan önce hızla aleyhine bir uzlaşmaya gitmesine benziyor
Uzlaşma sadece tazminatla ilgili değil, veri setlerinin imhasını da içeriyor
Habere göre Anthropic, “söz konusu yasa dışı materyali fiilen kullanmadığını” savunuyor
Eğer herhangi bir üretken yapay zeka şirketi bu korsan verilerle eğitim yapıp bunu ticarileştirseydi, tüm sektör sarsılabilirdi
Bundan sonra daha kaç örnek çıkacağını merak ediyorum
Bu hesaba göre, tüm kitapları doğrudan satın almak çok daha ucuz olmaz mı diye merak ediyorum
Eser sayısının sadece 500 bin olması şaşırtıcı
Çünkü milyonlarca kitabın indirildiği yönünde bir izlenim vardı
Yazarların doğrudan katılıp katılamayacağını merak ediyorum
“Eser başına 3 bin dolar” ise, bu kitapları telif anlaşmasıyla lisanslamak için oldukça iyi bir koşul gibi görünüyor
Toplanan onca paranın sonunda yayınevlerine verilmek için toplanmış olduğu hissine kapılıyorum
Yatırımcılara “büyük dava masrafları gibi ciddi giderlere hazırlıklı olacağız” diye yapılan bir sunumu gözümde canlandırabiliyorum
Haberde gördüğüm kadarıyla Anthropic kısa süre önce ek 13 milyar dolar daha topladı ve kuruluşundan bu yana toplamda 27 milyar doların üzerinde yatırım aldı
Tazminat rakamı devasa olsa bile, elde ettiği yatırımın yanında küçük kalıyor
Şaka gibi ama aslında bunun mükemmel bir yatırım sunumu olduğunu düşünüyorum
Hukuki meselelerden kaynaklanan potansiyel riski ortadan kaldırmak şirketin değerini artırır
Özellikle hukuki belirsizliğin azalması, aynı sektördeki şirketlerin yatırım çekiciliğini artırır
Aslında sistemin tam da böyle işlediğini düşünüyorum
Her bireysel fırsat ya da avantaj, mevcut sermayenin işine yarayıp yaramadığına bağlı
Paranın nasıl hareket ettiğine dair makul bir bahane kurulabildiği sürece, sermaye açısından ayrıntılar pek önemli değil
Para hareket ettikten sonra yapılan şey, herkesin kabul edebileceği bir hikâye kurmak
Bu uzlaşma da iki tarafın da memnun kalabileceği “eğitim sorun değil, sorun korsan materyaldi” anlatısını kurmanın bir yolu
Asıl motivasyon, yapay zeka eğitiminin başlı başına yasa dışı olduğuna dair bir emsal oluşmasını engellemek gibi görünüyor
Anthropic, düzenlemelerden kaçıp hızlı hareket etme stratejisini istedi
Kimse onu böyle davranmaya zorlamadı
Eğer yazarsanız, çalışmanızın dahil edilip edilmediğini kontrol etmeniz için kaynak ve süreç bilgisi paylaşılmış
LibGen veri setinde yazar adına göre arama yapma rehberi
Uzlaşmanın resmî sitesinde iletişim bilgisi kaydı
Açık kaynak yapay zeka açısından bakınca bu üzücü
Eğitim için korsan materyal kullanmak da adil kullanım sayılmalı
Aksi halde yalnızca Anthropic gibi parası bol büyük şirketler yayınevlerine dev meblağlar ödeyerek yapay zeka geliştirebilir ve milyarlarca kitabı satın alıp eğitimde kullanmak gibi bir yol fiilen imkânsız hale gelir
Bu sadece bir uzlaşma; ne emsal ne de hukuka aykırılığın kabulü anlamına geliyor
Sonuçta pahalı mühendisleri ve on binlerce GPU’yu doğrudan finanse edebilenler de yine yalnızca büyük şirketler
Pratikte tabandan gelen LLM topluluklarının eğitim verisinin hukukiliğine o kadar da duyarlı olacağını sanmıyorum
Adil kullanım, materyalin nasıl elde edildiğiyle değil, ona “hukuka uygun şekilde erişildikten” sonra ne yapıldığıyla ilgilidir
Eğer erişim hukuka uygun değilse, adil kullanım tartışması da en baştan mümkün değildir
Bu tartışma sanki model eğitiminin başlı başına bir hak olduğu varsayımına dayanıyor gibi
İstenen tüm kitapları satın alıp modeli onlarla eğitmenin gerçekte ne kadara mal olacağını merak ediyorum
Aklıma gelen bir şey de şu: Web’de yayımlanan içeriğin yalnızca insanlar tarafından ücretsiz kullanılmasına izin verip, AI crawler kullanılması durumunu bu vakadaki gibi korsanlık saydırıp cezalandırmanın bir yolu var mı
İlk soruya yanıt olarak, “giriş duvarı” koyup sözleşme kabul süreci işletmekle bu mümkün olabilir; ama gerçek tazminat tutarları gibi somut sözleşme hükümlerini bir avukatın incelemesi gerekir
Aslında bu yöntemi tavsiye etmem
Kullanıcı betikleri gibi bazı otomasyon araçları da ihlal kapsamına girebilir, sorun burada
DMCA güvenlik önlemi sayılabilecek bir CAPTCHA sistemi eklemek de mümkün görünüyor
Aynı içeriği ücretli bir API üzerinden sunmak da bir yöntem olabilir
Bunun hukuken de teknik olarak da mümkün olmadığını düşünüyorum
Muhtemelen denenebilir ama telif hukukunda çok çeşitli istisnalar var ve konu son derece karmaşık
Örneğin “her kullanım serbest, sadece akademi yasak” gibi bir şart konsa bile üniversitelerin buna mutlaka uyma yükümlülüğü olmayabilir
Mahkemeler zaten LLM eğitimini dönüştürücü kullanım (transformative use) olarak değerlendirmişse, “sadece LLM eğitimi yasak” şartı koymanın özel olarak daha güçlü bir yaptırımı olmaz
Bu, bir müzisyenin “müziğim sadece bütünüyle dinlensin, sampling yasak” demesine rağmen bunun etkili olmamasına benziyor
Telif hakkının amacı “bilim ve yararlı sanatların ilerlemesini teşvik etmek” olduğu için, akademik erişimin korunması yazarın bireysel kontrolünden daha ağır basabiliyor
Ders kitapları da telif hakkına tabi ve gerçekten akademik adil kullanım istisnaları varsa kopyalamanın serbest olabilmesi gerekirken bunun pratikte pek uygulanmaması da kafa karıştırıcı
Uluslararası açıdan bakınca, hukuki yaptırım ya da uzlaşmanın ülkelere göre nasıl sonuç doğurduğunu, başka ülkelerde yeni davalar açılıp ek yaptırımlar gelip gelemeyeceğini merak ediyorum
Çin yapay zeka sektörü için büyük bir avantaj gibi görünüyor
Batılı şirketler veri toplama ve eğitim konusunda daha fazla kısıtla karşılaşırken, Çin ya da diğer ülkelerdeki yapay zeka şirketleri çok daha fazla ve daha kaliteli veriden yararlanabilecek durumda