F/OSS Tarihsel Materyalizmi: LLM'leri reddetmemeli, geri kazanmalıyız
(writings.hongminhee.org)F/OSS'u LLM eğitiminden engellemek yerine, eğitim sonucunda ortaya çıkan modelin özgürleştirilmesi gerektiğini savunan görüş
- Yakın zamanda yayımlanan 〈Özgür/Açık Kaynak Yazılım ve LLM eğitimi üzerine〉(On FLOSS and training LLMs) yazısı, F/OSS topluluğundaki hayal kırıklığını iyi yansıtıyor — yapay zeka şirketlerinin küstahlığı, hukukun sınırları vb.
- Ancak yazarın önerdiği crawler engelleme, GitHub'dan ayrılma, yapay zeka araçları kullanıcılarını dışlama gibi geri çekilme stratejileri önemli bir fırsatı kaçırıyor
Sorun eğitim değil, enclosure
- Asıl sorun, LLM'lerin bizim kodumuzla eğitilmesi değil; ortaya çıkan sonucun mülkiyetli modellere dönüştürülerek özel mülk haline getirilmesi
- Bu yeni bir sorun değil — F/OSS'un şimdiye kadar mücadele ettiği tam da bu
- ortak varlıkların özel mülkleştirilmesi
- kolektif bilginin tekelleştirilmesi
- değerin çoğunluktan azınlığa tek yönlü akması
GPL'in tarihsel kalıbı: yeni teknoloji → yeni sömürü → yeni lisans
F/OSS lisanslaması, teknolojik değişime göre sürekli evrildi:
- GPLv2 (1991) — yalnızca ikili dosya dağıtımını engelledi → kaynak kodunu açma yükümlülüğü
- GPLv3 (2007) — Tivoization'ı (donanım kilidi) engelledi → kurulum bilgilerini de zorunlu kıldı
- AGPL (2007) — SaaS boşluğunu kapattı → ağ üzerinden sunumu da dağıtım saydı
Peki şimdi? Ortaya çıkan şey eğitim boşluğu:
- Şirketler F/OSS kodunu mülkiyetli modellerin eğitim verisi olarak kullanıyor
- Ama modeli yayımlama ya da eğitimin kaynaklarını açıklama zorunluluğu yok
- Bu tipik bir sömürü biçimi — karşılıklılık olmadan değer çıkarımı
Çözüm: GPLv4 veya TGPL (Training GPL) gibi bir eğitim copyleft'i
Önerilen koşullar:
- Eğitim açıkça izinli olmalı (F/OSS özgürlük ilkeleriyle uyumlu)
- Ancak ortaya çıkan model özgürleştirilmeli — ağırlıklar uyumlu bir copyleft lisansıyla yayımlanmalı
- Eğitim verisinin belgelenmesi zorunlu olmalı
- Fine-tune edilmiş modeller de bu yükümlülüğü devralmalı
- Ağ kullanımı (API sunumu) da dağıtım sayılmalı
→ GPLv3'ün ikili dosyalar için kaynak kodunu zorunlu kılması gibi, eğitim copyleft'i de eğitilmiş sistemler için model ağırlıklarını zorunlu kılmalı
Neden geri çekilmekten daha önemli
Geri çekilme stratejilerinin sorunları:
- Meydanı bırakıyor — OpenAI/Anthropic zaten ihtiyaç duyduğu her şeyi topladı. Geri çekilme, yalnızca Llama/Mistral gibi açık kaynak LLM'leri engeller
- Sorunu yanlış teşhis ediyor — mesele teknolojinin kendisi değil, onu kimin ve nasıl kullandığı
- Topluluğu bölüyor — “etik dışı araçlar” kullananları dışlamak mı? Bunun sınırı nerede? Saflık testleri ancak hareketi bölmeye yarar
- F/OSS'un temel stratejisinden vazgeçiyor — GPL'in dehası kullanımı yasaklamak değil, özgürlüğün aktarılmasını zorunlu kılmasıydı. Geri çekilme bunun tam tersi bir felsefe
Gerçekliği kavrayış farkı
- antirez (Redis'in kurucusu): LLM'ler geri döndürülemez → uyum sağla ve piyasa rekabetine güven
- Orijinal yazının yazarı: direniş anlamlı → geri çekil ve erişimi engelle
- Bu yazı: LLM'ler geri döndürülemez → ama esas mesele kimin sahip olduğu
Soru, LLM kullanılıp kullanılmayacağı değil:
- Modelle kimin sahip olduğu?
- Modeli eğiten ortak varlıklardan kim fayda sağlıyor?
- Milyonlarca F/OSS geliştiricisinin katkısının sonucu mülkiyetli olmak zorunda mı?
→ mesele, kolektif emeğin meyvesinin kolektifin elinde kalıp kalmayacağı ya da özel mülke dönüşüp dönüşmeyeceği
Şimdi tarihsel bir fırsat
- Şu anda AI eğitimi ve model açıklığını yönetecek normlar üzerine bir tartışma sürüyor
- Topluluk içi tartışmalar hararetli
- Açık kaynak AI modelleri artarken, hangi lisansların uygulanacağı hâlâ belirlenmiş değil
F/OSS geliştiricileri geri çekilirse: 5 yıl içinde şirketler ve şirket dostu mahkemeler tüm normları belirler → eğitim boşluğu yerleşir → açık kaynak AI kalıcı olarak dezavantajlı hale gelir
Biz katılırsak: eğitim copyleft'ini ileri iteriz → modelin özgürleştirilmesini talep eden lisanslarla kod yayımlarız → geleceği biz kurarız
Sonuç tek cümlede
> Crawler'ları engellemek değil, crawling'in kurallarını değiştirmek gerekir. LLM'leri reddetmek değil, geri kazanmak gerekir.
→ tarihsel materyalist bir bakışla: yeni üretici güçler (LLM'ler), yeni üretim ilişkileri (eğitim copyleft'i) talep ediyor
→ Linus'un Linux'u GPL ile yayımlarken “şirketler kullanamasın” demek yerine “herkes kullansın ama geliştirirsen paylaş” demesi gibi
→ kod herkesinse, onunla eğitilen AI modellerinin de herkesin olduğu bir gelecek için
1 yorum
Yazının içeriğine katılıyorum. Ancak nereden başlayıp ne için ne kadar mücadele edeceğimizi sorarsanız, insan kendini çaresiz hissediyor.