DeepSeek çıkarım motorunu açık kaynağa taşıma yolculuğu
(github.com/deepseek-ai)- DeepSeek ekibi, dahili çıkarım motorunu (DeepSeek Inference Engine) açık kaynağa geri kazandırma planını açıkladı
- Mevcut çıkarım motoru vLLM tabanlı ve DeepSeek-V3 ile R1 modellerine yönelik dağıtım talebi arttıkça paylaşım seçeneği değerlendiriliyor
- Mevcut kod, altyapı bağımlılıkları ve bakım yükü nedeniyle tamamının yayımlanması zor, bunun yerine yön modülerleştirme ve işlev bazlı katkı modeline çevrildi
- Bundan sonra açık kaynak topluluğuyla yakın iş birliği içinde performans optimizasyonları ve yeniden kullanılabilir işlevlerin paylaşılması planlanıyor
- DeepSeek, çıkarım optimizasyonu ve model yayınlarında toplulukla Day-0 destek eşzamanlamasını sağlama konusunda daha aktif olacak
DeepSeek çıkarım motorunu açık kaynağa taşıma yolculuğu
Open Source Week'e gelen tepki ve sonraki katkılar
- Yakın zamanda düzenlenen Open Source Week kapsamında çeşitli kütüphaneler açık kaynak olarak yayımlandı
- Topluluktan gelen olumlu tepkiyle birlikte iş birliği, tartışma ve hata düzeltmeleri aktif biçimde sürdü
- Bunun sonucunda DeepSeek dahili çıkarım motorunun da açık kaynak olarak paylaşılmasına karar verildi
Temel teknoloji
- DeepSeek'in eğitim çerçevesi PyTorch tabanlı
- Çıkarım motoru, vLLM projesinin erken dönem bir fork'u üzerine geliştirildi ve DeepSeek modellerine özel çok sayıda özelleştirme içeriyor
Tüm sistemi açık kaynak olarak yayımlamanın pratik kısıtları
- Kod tabanı farkı: 1 yıldan uzun süre önceki bir vLLM fork'undan başlandı; yapı benzer olsa da önemli ölçüde değişti
- Dahili altyapı bağımlılığı: Küme yönetim araçları gibi DeepSeek'e özgü altyapıyla güçlü biçimde bağlı olduğu için dış kullanım zor
- Bakım kaynağı eksikliği: Küçük bir araştırma ekibi olarak büyük ölçekli bir açık kaynak projeyi sürekli yönetmeye yetecek kaynak bulunmuyor
Alternatif: mevcut açık kaynak projeleriyle iş birliği
Bundan sonra katkılar şu yönde yapılacak:
- Modüler işlev çıkarımı: Yeniden kullanılabilir bileşenler ayrıştırılarak bağımsız kütüphaneler halinde katkı sunulacak
- Performans optimizasyonlarının paylaşılması: Dahili uygulamadaki performans iyileştirmeleri ve tasarım fikirleri mevcut açık kaynak projelerine aktarılacak
Topluluğa teşekkür ve vizyon
- Açık kaynak topluluğu olmasaydı AGI geliştirmesindeki ilerleme mümkün olmazdı
- İşletim sistemi, diller, ML çerçeveleri ve çıkarım motorları gibi yapay zeka inovasyonunun temeli açık kaynak ekosistemi
- DeepSeek, toplulukla eşgüdüm içinde AGI'nin faydalarının tüm insanlığa katkı sunabilmesi için çalışmayı sürdürecek
> [!NOTE]
> Bu yazı, DeepSeek Inference Engine kod tabanını açık kaynaklaştırma stratejisi hakkında bir bilgilendirmedir.
> Gelecekte model yayımlamalarıyla ilgili olarak DeepSeek, açık kaynak topluluğu ve donanım ortaklarıyla iş birliğini genişletmeyi sürdürecek.
> Özellikle model yayınından önce, çıkarımla ilgili teknolojileri önceden paylaşarak ve hizalayarak farklı donanım ortamlarında Day-0 itibarıyla SOTA desteğinin mümkün olmasını sağlamak için ekosistemi koordine etmeye devam edecek.
1 yorum
Hacker News görüşleri
Mart ayında vLLM, DeepSeek makalesindeki iyileştirmeleri uyguladı ve vLLM v0.7.3'ün DeepSeek performansı yaklaşık 3 katın üzerinde arttı
Kod tabanı ayrışma noktasına dair görüşe katılıyorum
Ticari yapay zeka şirketlerinin araştırma sonuçlarını ve know-how'ı paylaşma motivasyonu
"Açık kaynak topluluğu için ilginç bir şey var, ancak bunu şirket dışında çalıştırabilmek için çok fazla düzenleme gerekiyor ve yayımlandıktan sonra bunu düzgün şekilde sürdürecek personel yok"
DeepSeek'in iyi mühendislik çalışmaları görüldü
Bunun, Çin'in ABD hakimiyetine karşılık vermek için açık kaynak yapay zeka araçları, modelleri vb. büyük ölçekte piyasaya sürme stratejisi olup olmadığı merak ediliyor
tl;dr "vLLM fork'u sürdürülemez hâle geldi ve şimdi bunu kamuya açık şekilde yeniden inşa etmeyi planlıyorlar"
Bunun sansürü uygulamanın bir yolu gibi hissettirdiği söyleniyor