- Açık kaynak yapay zeka devrimi henüz gerçekleşmedi
- Elbette etkileyici açık ağırlık modelleri var ve ağırlıkları paylaşanlara teşekkürler, ancak bir modeli yeniden üretemiyorsanız bu gerçek anlamda açık kaynak değildir
- Linux'ta kod tabanı olmadan yalnızca ikililerin yayımlandığını hayal edin. Ya da ikilileri üretmek için kullanılan derleyici olmadan yalnızca kod tabanının yayımlandığını düşünün. Bugünkü durum tam olarak bu
- Bunun çeşitli dezavantajları var
- Projeye yeniden katkıda bulunulamaz
- Proje, OSS geri bildirim döngüsünün faydalarından yararlanamaz
- Modelde arka kapı (ör. gizli ajanlar) bulunup bulunmadığını doğrulamak zordur
- Veri ve içerik filtrelerinin şirket politikalarıyla uyumlu olup olmadığı doğrulanamaz
- Modeli yenilemek için şirkete bağımlı kalınır
- Kod tabanından veri hattına kadar her şeyin açık olduğu gerçek bir açık kaynak LLM projesi, büyük değer ve yaratıcılık üretebilir ve güvenliği iyileştirebilir
- Ancak ağırlıkları yeniden üretmek, kod derlemek kadar kolay olmadığı için bu basit bir iş değildir. Hesaplama gücü ve uzmanlık gerekir.
- Ayrıca katkıları incelemek zordur; çünkü performansı nasıl etkilediği ancak bir sonraki eğitimi çalıştırdığınızda anlaşılır
- Yine de yeterince motive olmuş kişi veya gruplar bu ayrıntıları çözebilir; mevcut OSS'den oldukça farklı görünebilir, ancak bu yeni zorluklar da bu alanı ilginç kılan neden
3 yorum
Doğru söz,
Dolayısıyla open source artık bir Myth ya da Urban Legend hâline geliyor. Gerçekte bu sitelerde tam anlamıyla yeniden üretilebilir, kelimenin gerçek anlamıyla açık kaynak model neredeyse yok denebilir. Çoğu sadece marketing stunt.
Nereden baktığınızı anlıyorum ama... bugünlerde çıkan modelleri eğitmek için gereken hesaplama gücü ve süre, sıradan bireylerin yeniden üretmesini zorlaştıracak bir noktaya gelmiş durumda; o yüzden nasıl değerlendirmek gerekir pek emin değilim.
Yine de veri setinin yayımlanması konusunda ben de bir ölçüde katılıyorum.
Hacker News görüşü