Bu projeyi yeniden lisanslama hakkı yok
(github.com/chardet)chardetin orijinal yazarı Mark Pilgrim, projede LGPL lisans ihlali olduğunu belirterek son sürüm 7.0.0’daki MIT lisansına geçişin geri alınmasını talep etti- Bakımcılar bunu “tam yeniden yazım” olarak nitelendirse bile, özgün koda doğrudan maruz kalınarak yazılmış bir türev olduğu için LGPL altında kalması gerektiğini açıkça ifade etti
- Birçok geliştirici, yapay zeka destekli yeniden yazımın gerçekten bir “clean room implementation” olup olmadığını ve LLM’nin özgün kod üzerinde eğitilip eğitilmediğini tartıştı
- Bazıları API uyumluluğu ve adil kullanım (fair use) ihtimalinden söz etti, ancak çoğunluk telif hakkı ihlali olasılığı ve yapay zeka ile üretilen kodun hukuki belirsizliği konusunda endişe duydu
- Bu tartışma, yapay zekanın ürettiği kodda telif sorumluluğu, açık kaynak projelerinde lisans değiştirme süreçleri ve bakımcı yetkisinin sınırları açısından önemli bir emsal olarak görülüyor
Mark Pilgrim’in itirazı
- Mark Pilgrim,
chardetin orijinal yazarı olduğunu ve projenin LGPL lisansı ile dağıtıldığını belirtti- Sürüm 7.0.0’da bakımcının “yeniden lisanslama yetkimiz var” iddiasının yanlış olduğunu vurguladı
- LGPL kapsamındaki kodun değiştirilse bile aynı lisans altında yayımlanması gerektiğini, “tam yeniden yazım” iddiasının ise hukuki dayanağı olmadığını söyledi
- “Koda üretici eklenmesinin” yeni bir hak doğurmadığını da açıkça ifade etti
- Pilgrim, projenin orijinal LGPL lisansına geri döndürülmesini talep etti
Topluluğun ilk tepkisi
- Bir kullanıcı, yapay zeka destekli yeniden yazımdan önceki sürümün bir fork’unun olup olmadığını sordu; başka bir kullanıcı 6.0.0 sürüm bağlantısını paylaştı
- Bazıları “hukuken Mark haklı” diyerek LGPL ihlali ihtimalini kabul etti
- Başka kullanıcılar ise “yapay zeka ile yeniden yazım kaçınılmaz bir ödünleşim” diyerek pratik bir bakış açısı sundu
Hukuki tartışma: API, telif hakkı ve adil kullanım
- Bir kullanıcı, Google LLC v. Oracle America, Inc. kararına atıf yaparak API’lerin de telif koruması kapsamında olabileceğini belirtti
- API uyumluluğunu amaçlayan yeniden yazımın, adil kullanım şartlarını karşılamıyorsa yasa dışı olabileceğini açıkladı
- Buna karşı başka bir kullanıcı, Google davasında adil kullanımın kabul edildiğini söyleyerek itiraz etti
- Tartışma, API uyumlu yeniden yazımların hukuka uygunluğu ve yapay zeka tarafından üretilen kodun telif statüsü konularına genişledi
Yapay zeka kod üretimi ve clean room implementation tartışması
- Bazıları, “eğer yapay zeka özgün kod üzerinde eğitildiyse” bunun clean room implementation sayılamayacağını belirtti
- LLM’nin
chardetkodunu öğrenip öğrenmediği, hukuki değerlendirmenin kilit noktası olabilir
- LLM’nin
- Diğerleri ise “yapay zeka yalnızca girdi ve çıktılara göre kod ürettiyse bunun mümkün olabileceğini” savundu
- Buna karşılık “öyleyse lisansın kendisi anlamsız hale gelir” şeklinde itirazlar yükseldi
- Yapay zeka kodunda telif sorumluluğunun belirsizliği ve lisans uyumunu doğrulamanın zorluğu başlıca sorunlar olarak öne çıktı
Lisans uyumluluğu ve GPL tartışması
- Bazıları MIT lisansının GPL ile uyumlu olmadığını öne sürdü; ancak başka bir kullanıcı FSF’nin resmi belgelerine atıf yaparak MIT’nin (Expat) GPL ile uyumlu olduğunu açıkladı
- Buna rağmen, “LGPL kodunu MIT olarak yeniden lisanslamanın yine de ihlal olduğu” konusunda çoğunluk hemfikirdi
- Başka bir kullanıcı da “LGPL kodunun sağladığı itibar ve depoyu koruyup sözleşmeyi terk edemezsiniz” diye belirtti
Yapay zeka eğitim verisi ve güven sorunu
- Birçok kullanıcı, “Claude’un LGPL kodu üzerinde eğitilmediğine gerçekten güvenilebilir mi?” sorusunu gündeme getirdi
- Yapay zeka modellerinin eğitim verisinin izlenemezliği, hukuki risk olarak gösterildi
- Bazıları, “yapay zeka kodu intihal ihtimali taşıyorsa kullanımından kaçınılmalı” görüşünü savundu
- Araştırma alıntılarıyla, yapay zeka kodunun %2 ila %5’inin mevcut kodun kopyası olabileceğine dair istatistikler paylaşıldı
Proje kimliği ve bakımcı yetkisi
- Bazıları, “önceki katkıcıların kodu tamamen kaldırıldıysa yeni sürüm bağımsız olabilir” dedi
- Ancak buna karşı, “aynı isim ve itibarı kullanmak yine de uygun değil” itirazı yapıldı
- “Telif hakkı ismi değil, ifadeyi korur” görüşü de dile getirildi
- Bakımcı tüm mevcut kodu kaldırdıysa bunun hukuki ihlal olmayabileceğini savunanlar da vardı; ancak buna dair açık bir kanıt sunulmadı
Topluluğun genel yaklaşımı
- Birçok kullanıcı, hem Mark Pilgrim hem de Dan Blanchard’ın katkılarına saygı duyduklarını, aynı zamanda yapay zeka, telif ve açık kaynak yönetişimi gibi karmaşık meselelerin farkında olunması gerektiğini söyledi
- Tartışma, yapay zeka ile üretilen kodun hukuki sorumluluğu, proje lisansı değişikliğinin meşruiyeti ve açık kaynak bakımcı yetkisinin sınırları gibi konulara yayıldı
- Bazıları, “v7.0.0’ı fork’layıp LGPL’ye geri döndürelim” önerisini de dile getirdi
Temel tartışma başlıklarının özeti
- LGPL → MIT geçişinin hukuka uygunluğu: Orijinal yazarın onayı olmadan mümkün olmadığı görüşü baskın
- Yapay zeka ile yeniden yazımın telif statüsü: Eğitim verisine maruz kalma durumuna göre türev eser sayılabilir
- Clean room implementation olup olmadığı: Yapay zekanın özgün koda başvurmadığının kanıtlanması gerekir
- Proje adı ve itibarının kullanımı: Aynı adla yeniden dağıtım hukuki ve etik tartışma yaratıyor
- Yapay zeka kodunun güvenilirliği: İntihal riski ve tedarik zinciri istikrarı endişeleri
Bu mesele, yapay zekanın ürettiği kodlarda telif hakkı ve açık kaynak lisans uyumu etrafındaki en dikkat çekici örneklerden biri olarak görülüyor; ileride yapay zeka geliştirme araçlarının hukuki sorumluluk yapısını etkileyebilir.
1 yorum
Hacker News görüşleri
Pilgrim'in clean room telif hakkı kavramını yanlış anladığını düşünüyorum
“Tamamen yeniden yazım” iddiası önemli değil. Hukuken bağımsız bir uygulama mümkün olabilir.
Clean room, yalnızca davayı basitleştirmeye yarayan usule ilişkin bir araçtır; orijinal koda hiç maruz kalmamak hukuki bir zorunluluk değildir.
Nitekim Linux da Unix'in iç yapısını biliyordu ama bağımsız olarak uygulandı
JPlag'in düşük benzerlik skoru, intihal olmadığını gösteren ikna edici bir kanıt gibi görünüyor
“Kod tabanını biliyorsan yeniden yazım da telif ihlalidir” iddiası tamamen geçerli değil
İç bilgi patent alanına girer; telif hakkıyla ilgili değildir.
Ancak orijinal kodu yanına koyup cümleleri değiştirerek ilerlemek ihlaldir.
Yapay zeka orijinal koda bakıp benzer kod üretiyorsa, bu fiilen paralel kopyalama sayılma ihtimali yüksektir.
Ama orijinali görmeden tamamen yeni yazılırsa mümkündür. Yine de hukuken savunması zor olduğu için şirketler açısından risk unsuru sayılmalıdır
Patentte bağımsız icat olsa bile ihlal mümkünken, telif hakkında esas olan yaratımın bağımsızlığıdır.
Ancak daha önce görülmüş bir eserle aynı sonucu üretirseniz jüriyi ikna etmek zor olur
Sonuçta benzerlik varsa delillerin üstünlüğü (preponderance of evidence) ölçütüyle ihlal kararı çıkma olasılığı yüksektir
Buna karşılık özgün eseri hiç bilmiyorsanız bağımsız yaratım kabul edilir
Fikirlerin kendisi korunmaz ama ifade korunur.
LLM eğitim sürecinde orijinal kodu gördüyse bu hukuken gri bir alandır
Asıl mesele LGPL ihlali olup olmadığıdır.
Yeni kod orijinale dayanıyorsa türev eser sayılır ve LGPL olarak kalmalıdır.
“Tamamen yeniden yazım” denmiş olsa bile orijinal koda maruz kalındıysa lisans ihlali olabilir
Clean room yalnızca dava savunmasına yönelik usuli bir araçtır ve ispat yükü davacıdadır.
Linux veya GNU araçları da Unix'i biliyordu ama yasaldı
Danışmanlık sırasında ilginç bir örnek gördüm.
Bir SaaS şirketinin mühendisi, Claude Code ile kendi uygulamalarını tersine mühendislikten geçirip API uyumlu bir backend'i bir haftada yaptı.
“Bir rakip bunu yaparsa kendimizi nasıl koruruz?” diye soruldu
Kodun kendisi işin çekirdeğiyse zaten risk altındasınızdır.
Rekabetten korkmak yerine daha iyi ürün yapmak önemlidir
Artık “Slack veya Drive'ı yeniden uygulayalım” demek gerçek dışı olmayan bir çağdayız
API açık bir arayüzdür, bu yüzden koruma konusu değildir
IBM BIOS veya DOS'un tersine mühendislik örneklerinde olduğu gibi, bağımsız uygulama yasaldır
Bakımcı **emanetçi (trustee)**dir, sahibi değil.
Orijinal yazarın lisansını keyfi olarak değiştirmemelidir.
Kod gerçekten tamamen yeniyse yeni bir adla proje başlatılmalıdır.
“Eski sürümü dondurun” gibi söylemler topluluk ruhuna aykırıdır
2021 tarihli bir yorumda zaten “chardet LGPL tabanlı olduğu için yeniden lisanslanamaz” denmişti.
Bunu bilerek yeniden yazdıysa bu pervasız bir karar ve orijinal yazara karşı saygısızlık olur
Yapay zeka orijinal kodu görmüş halde yazdıysa bu bir clean room uygulaması değildir.
Biri spesifikasyon hazırlayan, diğeri uygulayan iki ayrı yapay zeka ekibi olsa kabul edilir mi?
Bu, IBM dönemindeki emsali izler ama model zaten orijinalle eğitildiyse yine sorunludur
Ancak spesifikasyonun ifadesel unsurlar içermediği doğrulanmalıdır
Eğitim verisinde orijinalin bulunduğu bir durumda karşılaştırmanın kendisi anlamsız hale gelir
“Wikipedia'dan kopyala-yapıştır yapıp birkaç kelime değiştirirsek olur mu?” şakasındaki gibi,
sonuçta kasıtlı kaçınma mümkün değildir.
Bağımlılık sürümlerini sabitlemek gerekecek kadar güvenin zorlaştığı bir dönemdeyiz
Oysa hukuk bütüncül değerlendirmeyi esas alır.
Mahkemeler “delillerin üstünlüğü” ölçütüyle karar verir; sadece kelimeleri değiştirmek yeni bir eser yaratmaz.
Orijinal zorunlu bir dayanak idiyse, türev eser sayılma ihtimali yüksektir.
Eğitim verisinde orijinal varsa telif ihlali davasının kaçınılmaz olacağı öngörülüyor
Öte yandan Mark Pilgrim'in yeniden ortaya çıkması ilginç
Onun Wikipedia sayfasında “internetten kaybolma” hikâyesi yer alıyor.
Python kitapları hâlâ tavsiye edilebilir
“Yapay zeka GPL kodla eğitildiyse, bütün yapay zeka kodu GPL ile kirlenmiş (tainted) olmuyor mu?” diye şaşıranlar var
ABD'deki clean room süreci sadece davayı kısaltmaya yönelik bir stratejidir