8 puan yazan GN⁺ 2025-04-15 | 1 yorum | WhatsApp'ta paylaş
  • DeepSeek ekibi, dahili çıkarım motorunu (DeepSeek Inference Engine) açık kaynağa geri kazandırma planını açıkladı
  • Mevcut çıkarım motoru vLLM tabanlı ve DeepSeek-V3 ile R1 modellerine yönelik dağıtım talebi arttıkça paylaşım seçeneği değerlendiriliyor
  • Mevcut kod, altyapı bağımlılıkları ve bakım yükü nedeniyle tamamının yayımlanması zor, bunun yerine yön modülerleştirme ve işlev bazlı katkı modeline çevrildi
  • Bundan sonra açık kaynak topluluğuyla yakın iş birliği içinde performans optimizasyonları ve yeniden kullanılabilir işlevlerin paylaşılması planlanıyor
  • DeepSeek, çıkarım optimizasyonu ve model yayınlarında toplulukla Day-0 destek eşzamanlamasını sağlama konusunda daha aktif olacak

DeepSeek çıkarım motorunu açık kaynağa taşıma yolculuğu

Open Source Week'e gelen tepki ve sonraki katkılar

  • Yakın zamanda düzenlenen Open Source Week kapsamında çeşitli kütüphaneler açık kaynak olarak yayımlandı
  • Topluluktan gelen olumlu tepkiyle birlikte iş birliği, tartışma ve hata düzeltmeleri aktif biçimde sürdü
  • Bunun sonucunda DeepSeek dahili çıkarım motorunun da açık kaynak olarak paylaşılmasına karar verildi

Temel teknoloji

  • DeepSeek'in eğitim çerçevesi PyTorch tabanlı
  • Çıkarım motoru, vLLM projesinin erken dönem bir fork'u üzerine geliştirildi ve DeepSeek modellerine özel çok sayıda özelleştirme içeriyor

Tüm sistemi açık kaynak olarak yayımlamanın pratik kısıtları

  • Kod tabanı farkı: 1 yıldan uzun süre önceki bir vLLM fork'undan başlandı; yapı benzer olsa da önemli ölçüde değişti
  • Dahili altyapı bağımlılığı: Küme yönetim araçları gibi DeepSeek'e özgü altyapıyla güçlü biçimde bağlı olduğu için dış kullanım zor
  • Bakım kaynağı eksikliği: Küçük bir araştırma ekibi olarak büyük ölçekli bir açık kaynak projeyi sürekli yönetmeye yetecek kaynak bulunmuyor

Alternatif: mevcut açık kaynak projeleriyle iş birliği

Bundan sonra katkılar şu yönde yapılacak:

  • Modüler işlev çıkarımı: Yeniden kullanılabilir bileşenler ayrıştırılarak bağımsız kütüphaneler halinde katkı sunulacak
  • Performans optimizasyonlarının paylaşılması: Dahili uygulamadaki performans iyileştirmeleri ve tasarım fikirleri mevcut açık kaynak projelerine aktarılacak

Topluluğa teşekkür ve vizyon

  • Açık kaynak topluluğu olmasaydı AGI geliştirmesindeki ilerleme mümkün olmazdı
  • İşletim sistemi, diller, ML çerçeveleri ve çıkarım motorları gibi yapay zeka inovasyonunun temeli açık kaynak ekosistemi
  • DeepSeek, toplulukla eşgüdüm içinde AGI'nin faydalarının tüm insanlığa katkı sunabilmesi için çalışmayı sürdürecek

[!NOTE]
Bu yazı, DeepSeek Inference Engine kod tabanını açık kaynaklaştırma stratejisi hakkında bir bilgilendirmedir.
Gelecekte model yayımlamalarıyla ilgili olarak DeepSeek, açık kaynak topluluğu ve donanım ortaklarıyla iş birliğini genişletmeyi sürdürecek.
Özellikle model yayınından önce, çıkarımla ilgili teknolojileri önceden paylaşarak ve hizalayarak farklı donanım ortamlarında Day-0 itibarıyla SOTA desteğinin mümkün olmasını sağlamak için ekosistemi koordine etmeye devam edecek.

1 yorum

 
GN⁺ 2025-04-15
Hacker News görüşleri
  • Mart ayında vLLM, DeepSeek makalesindeki iyileştirmeleri uyguladı ve vLLM v0.7.3'ün DeepSeek performansı yaklaşık 3 katın üzerinde arttı

    • Hâlâ iyileştirme için çok alan var
    • vLLM kullanılarak sharegpt veri setinde 5K token/sn, rastgele 2000/100 ile 12K token/sn benchmark yapıldı
    • DeepSeek-V3/R1 çıkarım sistemi genel bakışına göre her H800 düğümü, prefill sırasında ortalama 73.7k token/sn girdi (cache hit dahil) veya decoding sırasında 14.8k token/sn çıktı sağlıyor
    • DeepSeek farklı bir çıkarım mimarisi dağıtıyor, ancak bu durum iyileştirme için çok alan olduğunu gösteriyor
    • Daha fazla açık kaynak bekleniyor
  • Kod tabanı ayrışma noktasına dair görüşe katılıyorum

    • DeepSeek modellerine uyacak şekilde özelleştirilmiş, vLLM'in erken bir fork'una dayanmak ölçeklendirmeyi zorlaştırıyor
    • Sürdürülebilir bir alt kütüphaneyi ayırıp bilgiyi doğrudan paylaşma yaklaşımı, toplulukla iş birliği yapmak için iyi bir yöntem
    • Engeller var ama katkı sunmamanın kolay yolunu seçmiyorlar
    • Teknoloji hakkında yalnızca bilgi paylaşmak daha iyi olabilir, ama bu yine de bilgi paylaşımı
    • Bunu yapmamaları daha kolay olurdu gibi görünüyor
    • Onlara övgülerimi gönderiyorum
  • Ticari yapay zeka şirketlerinin araştırma sonuçlarını ve know-how'ı paylaşma motivasyonu

    • Google'ın Transformer mimarisini neden yayımladığı
    • İnsanlık için iyi bir şey yapmak ve ilerlemeyi teşvik etmek isteyebilirler
    • Şirket yönetiminin ticari çıkarlara aykırı görünen böyle bir adımı nasıl atabildiği merak konusu
    • Bilgi ve fikri mülkiyet paylaşımını teşvik eden ticari bir mantık olup olmadığı merak ediliyor
  • "Açık kaynak topluluğu için ilginç bir şey var, ancak bunu şirket dışında çalıştırabilmek için çok fazla düzenleme gerekiyor ve yayımlandıktan sonra bunu düzgün şekilde sürdürecek personel yok"

    • Birçok şirket bu durumda
    • "Bunu biz sürdürmeyeceğiz ama istediğiniz gibi fork edebilirsiniz" notuyla açık kaynak yapılmasını isterdim
  • DeepSeek'in iyi mühendislik çalışmaları görüldü

    • Umarım devam eder
  • Bunun, Çin'in ABD hakimiyetine karşılık vermek için açık kaynak yapay zeka araçları, modelleri vb. büyük ölçekte piyasaya sürme stratejisi olup olmadığı merak ediliyor

    • Bunun pazar için iyi bir şey olduğu düşünülüyor
  • tl;dr "vLLM fork'u sürdürülemez hâle geldi ve şimdi bunu kamuya açık şekilde yeniden inşa etmeyi planlıyorlar"

  • Bunun sansürü uygulamanın bir yolu gibi hissettirdiği söyleniyor