Nico'nun veri odası için Papermark kodunu çaldığı iddiası
(twitter.com/mfts0)- Nico'nun veri odası ürününün kendi geliştirdiği bir sonuç değil, Papermark'ın açık kaynak ve kurumsal lisanslı kodlarından alınmış gibi göründüğüne dair iddialar kamuoyuna yansıdı
- Temel tartışma konusu telif hakkı ve lisans ihlali olup, iddiayı gündeme getiren kişi ürünün derhal kaldırılmasını talep ediyor
- Bu konu, “hızlı hareket edip bir şeyleri kırmak” değil, dolandırıcılığa daha yakın olduğu yönünde sert eleştirilere yol açtı
- Söz konusu ürün tartışmasının Nico'nun diğer işlerine de şüphe düşürebileceği belirtiliyor
- Garry Tan, Jared Friedman ve Y Combinator da etiketlenerek konu YC topluluğunun itibarı meselesine doğru genişledi
Papermark kodunun çalındığı iddiası
- Nico'nun veri odası ürününün şirket içinde geliştirilmediği, Papermark'ın açık kaynak ve kurumsal lisanslı kodlarından alınmış gibi göründüğü yönünde kamuya açık bir iddia ortaya atıldı
- İddiayı gündeme getiren kişi bunun basit bir hızlı ürün geliştirme ya da “vibe coding” olarak görülmesinin zor olduğunu, telif hakkı ve lisans ihlali ihtimali bulunduğunu düşünüyor
- Talepler net
- Söz konusu ürünün derhal kaldırılması gerektiği savunuluyor
- İhlal doğruysa, bu basit bir hatadan daha ciddi bir eylem olarak değerlendirilebilir
Eleştirilerin yayılması
- Eleştiriler Nico'nun yalnızca veri odası ürünüyle sınırlı kalmayıp, şirketin genel işlerinin güvenilirliğini de sorgulatıyor
- Garry Tan, Jared Friedman ve Y Combinator'ın etiketlenmesiyle konu kişiler arası bir anlaşmazlığın ötesine geçerek YC topluluğunun itibarıyla da ilişkilendi
- Şu anda kamuya açıklanan içerikte iddialar ve talepler merkezde yer alıyor; ek doğrulama ya da karşı açıklama sunulmuş değil
1 yorum
Hacker News yorumları
Bir web sayfası ekran görüntüsünü Figma Make gibi araçlara koyarsanız oldukça benzer bir kopyasını üretebilirsiniz.
Ekran görüntüsünden tam olarak böyle bir izlenim geliyor; çok benziyor ama birebir aynı değil. Metinlerin büyük ölçüde aynı olması da muhtemelen bundan kaynaklanıyor. Metni yeniden yazmayı bile üretken metin araçlarına bırakmamış olmaları sadece özensizlik.
Başka bir Twitter yorumuna bakılırsa, muhtemelen yapay zekaya Papermark’ı kopyalamasını söylemişler.
Yapay zeka yorumunda sayfanın “reference”a göre hizalandığı gibi izler var.
https://xcancel.com/ffumarola/status/2070479755892371713#m
Verdikleri yanıt şöyleydi:
Nico’nun içtenlikle “kodu kopyalamadık” demeyi makul bir savunma sanmasına pek şaşırmam. Çünkü bu net bir kural gibi görünüyor; aşırı “shape rotator” tipleri, hukuk gibi alanlardaki muğlaklıkta çoğu zaman zorlanıyor. Aslında telif hakkı ihlali, pornografiyi ayırt etme ölçütü gibi; görünce çoğu zaman anlarsınız.
Bir yerlerde bu şirketin/sektörün dünyadaki yapay zekanın en önemli uygulama alanı olduğunu da iddia etmişti. Kopyaladıklarından şüphem yok; en azından güvenilir biri değil.
https://x.com/nico_laqua/status/2061130574358773852?s=20
Bunu dava açmaya daha yatkın bir şirkete yapmış olsalardı dava edilme ihtimalleri epey yüksek olurdu; davayı kazanma şanslarının da aşağı yukarı 50’ye 50 olduğunu düşünüyorum. Bunun yaratıcı/sanatsal unsurların kopyalanması mı, yoksa sadece işleyiş biçiminin kopyalanması mı sayılacağını söylemek zor; ama işlevi kopyalamak sorun olmayabilirken kullanıcı deneyimini toptan kopyaladığınızda hızla telif hakkı ihlaline dönüşür.
Metinlerin de bir due diligence veri odası çözümü için yeterince beklenebilir, standart ifadeler olduğunu düşünüyorum.
Bu tartışmanın arka planını biraz daha açıklayabilir misin? Nico kim, Papermark nedir ve ne yapar, hiç bilmiyorum.
Ayrı olarak, insanların mevcut çözümleri ya da projeleri vibe coding ile taklit etmekle kalmayıp, açık kaynak kodu “çalmaya” ve açık kaynağın ahlaki, etik ve hukuki öncüllerine uymadan diledikleri gibi kullanmaya daha alışır hale geldiği görülüyor. Eskisine göre açık kaynak ihlalleri her yerde artıyor gibi ama büyük hukuki sonuçlar yok gibi hissediyorum.
Üstelik yalnızca yapay zeka üzerinden gelen yeni geliştiricilerin önemli bir kısmı FOSS’un bira gibi bedava demek değil, özgürlük ile ilgili olduğunu anlamıyor ya da umursamıyor.
Donanımsal bir ses örnekleyicisinin ikili veri dosyalarını ayrıştıran bir GPL3 kütüphanesi üzerinde çalışıyorum. Biri kütüphanemin üzerine çeşitli işler yapabilen bir uygulama geliştirdi ve GPL3 lisansına uydu.
Ancak yakın zamanda biri bu uygulamayı tamamen vibe coding ile kopyalayıp, bir web sitesi ve yaklaşık 60 dolarlık satın alma bağlantısı bile koydu. Sadece renkleri farklı, arayüzü birebir aynı olan çok bariz bir kopyaydı ve GPL3 koşullarına hiç uymuyordu. Moderatörler gönderiyi listeden kaldırdı ve kopya uygulamanın geliştiricisini engelledi; forum topluluğu da orijinal uygulama geliştiricisini destekledi. DMCA kaldırma talebi de gönderdik ve birkaç gün sonra kopya site kapandı.
Orijinal uygulama geliştiricisi şanslıydı; çünkü o üreticiyle ilgili gönderilerin paylaşıldığı fiilen tek bir ana forum var ve moderatörler de yapay zeka bağlantılı şeylerden hoşlanmıyor. İronik biçimde, orijinal uygulama geliştiricisi de kendi işini tamamen vibe coding ile yapıyor. O forum ve moderatörler olmasaydı, açıkçası hem orijinal uygulama geliştiricisi hem de GPL3 kütüphanesinin bakımcısı olan ben mahvolurduk.
Merkezileşmenin avantajları var. Bu yoksa, herkesin kapalı kaynağa dönmesi ya da başkalarının emeğine saygı göstermeye dair tartışmayı zorla gündeme getirecek kitlesel bir hareket dışında pek alternatif göremiyorum. Şimdiye kadar onur ve topluluk tepkisi sistemine yaslanıyorduk.
Şirketler ne yaparlarsa yapsınlar sıyrılmaya alışıyor. “Hızlı hareket et ve bir şeyleri kır” sözü aslında teknolojiyle ilgiliydi, ama artık hukuka yönelik bir tavra dönüştü. Uber bu akımı popülerleştirdi, şimdi herkes aynısını yapıyor. Yapay zekanın telif hakkı hukukunu kırması da bu akımın bir parçası.
Yeni hukuk kaybedenler içindir zihniyeti yüzünden önümüzde zorlu bir dönem olacak gibi.
Artık internetteki her şeyin fiilen herkesin istediği gibi aldığı bir şeye dönüştüğünü kabul etmek gerekiyor.
Çünkü kesin olarak kaybetmenin tek yolu oyuna katılmamaktır.
Papermark, DocSend’e açık kaynak bir alternatiftir. Kendi sunucunda ya da barındırılan sürüm olarak kullanılabildiği için DocSend’e kıyasla çok daha maliyet etkin olduğundan popülerdir.
Corgi, YC’nin yatırım yaptığı ve diğer YC startup’larına sigorta satan bir sigorta startup’ıdır. Nico kurucusudur. Kısa süre önce yaklaşık 3 milyar dolar değerlemeyle 100 milyon dolar topladı ve şu anda YC’nin özellikle desteklediği şirketlerden biridir.
Sigorta underwriting süreci çok sayıda belge gerektirdiği için Corgi, DocSend’e her ay binlerce dolar ödüyordu. Nedendir bilinmez, Corgi’nin 12 kişilik bir ekip kurup kendi DocSend alternatifi olan Dataroom’u geliştirdiği anlaşılıyor. Ardından Corgi bunu ayda 10 dolardan başlayan daha ucuz bir DocSend olarak konumlandırıp, zaten kalabalık olan pazarda bir SaaS ürünü haline getirmeye karar verdi.
Papermark, Corgi’nin Dataroom’unun kendi açık kaynak ürünüyle aynı ifadelerin ve yapının büyük bölümünü kullandığını hemen fark etti. Bu yüzden Corgi’nin Papermark’ün çalışmasını kaynak göstermeden aldığını düşündü. Corgi ise ürünler arasında kelime kelime örtüşen kısımlar olmasının basit bir tesadüf olduğunu söyleyerek bunu reddediyor.
Bir başka YC startup’ı Delve ise Corgi’nin şüphe altında olduğu şeyleri ve çok daha fazlasını gerçekten yaparken yakalandı ve YC’den çıkarıldı.
Bana göre onun mantığı kabaca iki şeye dayanıyor:
Ama burada en büyük ipucu iki ürünün aynı yerleşimi ve metinleri. Bir LLM’e “bu ürünü yaz ve 1:1 kopyasını çıkar” diye talimat vermek de sağduyulu bir tanıma göre hâlâ kopyalamadır. Hiçbir şeyin kopyalanmadığını iddia etmek anlamsız.
ShadCN, yapay zekanın %90’dan fazla durumda otomatik seçtiği en popüler tasarım sistemi ve lovable gibi platformlarda da varsayılana yakın.
Google API’yi kopyaladı ama implementasyonu clean room olarak tuttu ve bunun sonunda açıkça adil kullanım olduğuna hükmedildi. API yeniden uygulaması gibi katı bir konuda bile adil kullanım geçerliyse, arayüz ya da yerleşim kopyalama gibi çok daha muğlak konulara da uygulanabileceği düşünülebilir.
İnsanların neden hâlâ eski Twitter olan şeyi ciddiyetle kullandığını anlamıyorum.
Dedikleri gibi kodu kopyalayıp yapıştırmamış olsalar bile, fiilen LLM’in depoyu crawl etmesinin sonucuna dayanarak aynı kodu yeniden üretmiş ve lisansa saygı göstermemiş olabilirler.
Mahkemenin değerlendirmesi için iyi bir hukuk davası olabilir. Savunmaları “Biz LLM’e yalnızca sizin çalışmanızı yeniden üretmesini söyledik, yani kodu ‘biz’ kopyalamadık” gibi görünüyor. Kötü bir koku bırakıyor.
Söz konusu lisans: https://github.com/papermark/papermark?tab=License-1-ov-file
AGPL; temel olarak kullanıcılar yazılımla ağ üzerinden etkileşime girse bile kaynak kodun yayımlanması gerektiği anlamına geliyor. O kodu kullanan projelerin de AGPL olması gerekir.
Bunu ayrıştırarak aşmanın yolları var. Örneğin AGPL lisanslı bir kimlik doğrulama sunucusu kullanılıyor diye iş mantığını içeren kodun da bundan etkilenmesi gerekmez.
Özellikle geçmişteki tartışmaları gördülerse, ürünü lisansa uygun şekilde tasarlamanın bir yolunu bulabilirlerdi.
Ancak bunu, gerçekten kodun kopyalandığı varsayımıyla söylüyorum; biz bunu kesin olarak bilmiyoruz. Çok benzer görünüyor ama bunun nasıl uygulanacağından pek emin değilim
Bu modellerle ilgili telif hakkı meseleleri gerçekten karmakarışık
Teknoloji sektörü hırsızlığı normalleştirmek ve buna inovasyon demek için her şeyi yapar
Tipik bir YC startup’ı hamlesi