9 puan yazan GN⁺ 2025-12-10 | 1 yorum | WhatsApp'ta paylaş
  • Devstral 2, 123B parametreli yeni nesil bir açık kaynak kodlama modeli olarak, SWE-bench Verified'de 72.2% performans elde ederek rekabetçi modellere göre yüksek verimlilik sağlıyor
  • Devstral Small 2 24B parametreyle tüketici donanımında da çalışabilir ve Apache 2.0 lisansıyla yayınlanıyor
  • Mistral Vibe CLI, Devstral tabanlı açık kaynak terminal ajanı olarak, kodu doğal dil ile keşfetme, düzenleme ve çalıştırma sunuyor
  • Devstral 2, Claude Sonnet'a göre en fazla 7 kat maliyet etkinliği, DeepSeek V3.2'den 5 kat daha küçük olmasına rağmen yüksek performansını koruyor
  • Açık kaynak ekosisteminde büyük ölçekli kod otomasyonu ve dağıtık zekâ hızlandırması için kilit bir araç olarak görülüyor

Devstral 2 Genel Bakış

  • Devstral 2, 123B parametreli yoğun bir transformer modeli olup 256K bağlam penceresi destekliyor
    • SWE-bench Verified'de 72.2% performans elde ederek, açık ağırlıklı modeller arasında üst sıralarda yer alıyor
    • Değiştirilmiş MIT lisansı ile açıklandı ve açık kaynak kod ajanları için yeni bir standart sundu
  • Devstral Small 2, 68.0% SWE-bench Verified performansı ile en fazla 5 kat daha büyük modellerle benzer seviyede kalıyor
    • Tüketici donanımında yerel olarak çalıştırılabilir, hızlı çıkarım ve kişiselleştirilmiş geri bildirim döngüsü sağlıyor
    • Görsel girişleri destekleyerek multimodal ajan çalıştırmaya imkân tanıyor
  • Devstral 2 (123B) ve Small 2 (24B), sırasıyla DeepSeek V3.2'den 5 ve 28 kat, Kimi K2'den 8 ve 41 kat daha küçüktür
    • Kompaktlaştırılmış model yapısı ile sınırlı donanımda dağıtım kolaylaşır

Üretime Hazır İş Akışı Desteği

  • Devstral 2, kod tabanı gezintisi ve çoklu dosya değişiklik yönetimini destekleyerek mimari düzeyde bağlamı korur
    • Çerçeve bağımlılık takibi, hata algılama ve otomatik yeniden deneme işlevlerini içerir
    • Hata düzeltme ve eski sistemleri modernleştirme görevlerini yürütebilir
  • Belirli diller veya büyük kurumsal kod tabanlarına özgü ince ayar desteği
  • DeepSeek V3.2 ve Claude Sonnet 4.5 ile yapılan insan değerlendirme karşılaştırmasında DeepSeek'e karşı üstünlük (42.8% kazanma oranı) sağlandı
    • Bununla birlikte Claude Sonnet 4.5'e karşı hâlâ performans farkı bulunuyor
  • Cline, Devstral 2'yi “üst düzey bir açık kaynak kodlama modeli” olarak nitelendirerek, araç çağrı başarı oranının kapalı modellerle benzer olduğunu bildirdi
  • Kilo Code, lansmanından sonraki ilk 24 saat içinde 17B token kullanımı kaydettiklerini duyurdu

Mistral Vibe CLI

  • Devstral tabanlı açık kaynak CLI kod asistanı olarak, doğal dil komutlarıyla kod keşfi, düzenleme ve çalıştırma sağlar
    • Apache 2.0 lisansıyla açık kaynak olarak yayınlanmıştır
    • Terminalde veya IDE'de (Agent Communication Protocol entegrasyonu ile) kullanılabilir
  • Ana özellikler
    • Proje farkındalıklı bağlam: Dosya yapısı ve Git durumunu otomatik tarar
    • Akıllı referanslar: @ otomatik tamamlama, ! komut çalıştırma, eğik çizgi komutlarıyla ayar değiştirme
    • Çoklu dosya orkestrasyonu: Tüm kod tabanını anlayarak mimari seviyede çıkarım
    • Sürekli geçmiş, otomatik tamamlama ve tema özelleştirme desteği
  • Betik çalıştırma, otomatik onay geçişi, yerel model ayarı, yetki kontrolü gibi iş akışı özelleştirmeleri mümkün

Dağıtım ve Kullanım

  • Devstral 2 şu anda ücretsiz API olarak sunuluyor, ileride girdi/çıktı başına $0.40/$2.00 ücret uygulanacak
    • Devstral Small 2 için ücretlendirme $0.10/$0.30
  • Kilo Code, Cline gibi açık ajan araçlarıyla birlikte kullanılabilir
  • Zed IDE eklentisi ile Vibe CLI doğrudan kullanılabilir
  • Devstral 2 için veri merkezi sınıfı GPU (en az 4×H100) gereklidir ve build.nvidia.com üzerinden denenebilir
    • Devstral Small 2, tek GPU veya CPU ortamında da çalıştırılabilir
    • NVIDIA NIM desteği yakında gelecek
  • En iyi performans için sıcaklık 0.2 ayarı ve Vibe CLI'nin en iyi uygulamaları önerilir

Topluluk ve İşe Alım

  • Mistral, Devstral 2, Small 2 ve Vibe CLI ile proje paylaşımı ve geri bildirim katılımını teşvik ediyor
    • X/Twitter, Discord ve GitHub kanalları üzerinden iletişime geçilebilir
  • Açık kaynak araştırma ve arayüz geliştirme için personel alımı sürüyor; başvurular Mistral'in resmi iş sayfasından yapılabilir

1 yorum

 
GN⁺ 2025-12-10
Hacker News yorumu
  • llm install llm-mistral komutuyla Mistral modelini kurup, llm mistral refresh sonrasında llm -m mistral/devstral-2512 "Generate an SVG of a pelican riding a bicycle" ile bir SVG görseli oluşturmuş
    Ortaya çıkan sonuç bu bağlantıdan görülebilir. 123B model için oldukça iyi bir sonuç
    Model ID’si tam doğru olmayabilir diye doğrudan Mistral’a sormuş

    • Artık “pelikanın bisiklete bindiği bir SVG üret” gibi prompt’ların eğitim verisi içinde yer alma ihtimali de var. Benchmark için iyi ama benchmaxxing’den kaçınmak istiyorsak rastgele testler de gerekli diye düşünüyorum
    • Acaba bu model Space Jam 1996 web sitesini de yeniden üretebilir mi diye merak ettim
    • SVG bir tür kod olsa da çalıştırılabilir kod değil; bu yüzden kodlama modeli değerlendirmelerinde biraz yanıltıcı olabilir. Yine de sonuç etkileyici
    • llm aracını nereden bulduğunu merak ediyorum
    • Bisikleti atlayıp havalı bir motosiklete yükseltmiş gibi görünüyor
  • Mistral, SOTA’nın yaklaşık 1 yıl gerisinde ama hız ve fiyat rekabeti açısından daha iyi hale geliyor. Benim kullanımım için hâlâ yeterli değil ama hızla yetişiyor. Rakip modeller olarak Haiku 4.5, Gemini 3 Pro Fast ve OpenAI’nin yeni hafif modeli (GPT 5.1 Codex Max Extra High Fast?) görüyorum

    • OpenAI’nin yeni modelinin adının Garlic olduğu söyleniyor; herhalde gerçekten bu isimle çıkmaz, değil mi?
    • Deepseek-v3.2 ile karşılaştırınca genel yetenekleri çok daha zayıf ve fiyatı da 5 kat daha pahalı
  • Devstral 2’yi CLI’da çalıştırıp 500KB’lık kişisel bir projeyi incelettim
    Programın ne yaptığını doğru şekilde anladı, 2 bug’ı düzeltti, kod iyileştirmeleri yaptı ve 2 küçük özellik ekledi.
    Yeni bir bug oluşturdu ama ben söyleyince hemen düzeltti.
    Kod değişiklikleri minimaldi ve gereksiz yeniden yazımlar yoktu.
    Kesin bir sonuca varmak için erken ama oldukça yetkin bir model gibi görünüyor

    • Hangi donanımda çalıştırdığını merak ediyorum
  • Devstral’ı kendim denemeyi düşünüyorum. Önceki model de yerel ajan tabanlı kodlama için fena değildi.
    Ama “Vibe CLI” adı fazla hafif bir hava veriyor.
    ‘Vibe-coding’, modelin sınırlarını denemek için eğlenceli olabilir ama kalite kontrolü gerektiren profesyonel işler için uygun değil.
    Bugünlerde herkes vibe-coding’e odaklanmış durumda ama insan zekâsını destekleyen profesyonel LLM araçları nerede diye merak ediyorum

    • Yeni CLI ajanı mistral-vibe Python ile yazılmış ve Zed’in ACP protokolünü destekliyor
    • Pek çok uygulama kısa vadeli iş hedefleri için geliştirilmiş geçici servisler olduğundan, agentic coding bu tür “kartondan servisler” için yeterince kullanışlı. Ama endüstriyel veri altyapısı için uygun değil
    • Bizim geliştirdiğimiz Brokk tam da böyle bir profesyonel araç. Tanıtım için bu blog yazısına bakabilirsiniz
    • “Yani Claude Code yetersiz mi demek istiyorsun?” şeklinde bir tepki de var
    • Artık kod kalitesinden çok spesifikasyon ve test kalitesinin daha önemli olduğu yönünde görüşler de var
  • Devstral Small 2 çalıştırmak için 5.000 dolarlık bir donanım kurulumu düşünüyorum.
    Mac 32GB, RTX 4090, DGX Spark, RTX 5090, harici GPU (Oculink) gibi seçeneklerde token işleme hızının nasıl olduğunu merak ediyorum

    • 5.000 dolar biraz arada kalmış bir bütçe, bu yüzden bulut GPU kiralamayı öneririm.
      En yüksek performans için RTX 5090, CUDA uyumluluğu için DGX Spark, büyük modeller içinse Strix Halo 128GB veya M3 Ultra uygun.
      Gerçek benchmark’ları r/LocalLLaMA üzerinde aramak en iyisi
    • Çift 3090 (24GB×2) kurulumu şu anda fiyat/performans açısından en iyi seçenek.
      Daha da ileri gitmek isterseniz 8×V100 sunucular da var (32GB×8, 512GB RAM, NVLink). Yalnız 240V elektrik gerekiyor
    • Ben 7900XTX + 128GB DDR4 kombinasyonu kullanıyorum. Ayrıca NVIDIA’dan hoşlanmıyorum
  • “Vibe CLI” adı fazla hafif görünen bir araç gibi duruyor.
    Ben Claude Code’u sık kullanıyorum ama buna vibe-coding demem

    • Bu tür bir isimlendirme muhtemelen pazarlama amaçlı bir meme. “Fransız şirket vibe ile kod yazan bir araç çıkardı!” gibi haberlerle dikkat çekmek istiyor olabilirler
    • LLM ile kod yazmanın doğası gereği daha çok hafif işler için uygun olduğunu düşünüyorum
    • Claude’a kod yazdırıyorsan bu zaten vibe-coding’dir
    • Belki de sadece mizahi bir isimlendirmedir
  • React kullanmayan bir CLI olması hoşuma gitti.
    Vibe-cli, Textual framework ile yapılmış

    • Ama Python tabanlı olduğu için çıktı hızı yavaş olur mu diye endişeliyim. Daha önce Aider’da da benzer bir sorun yaşamıştım
  • Mistral, Claude’dan token başına 10 kat daha ucuzsa oldukça cazip olabilir.
    Performansı 10 kat daha kötü değilse bu iyi bir nokta

    • GPT 5-mini de Haiku’dan çok daha ucuz ama pratikte kullandığımda tam bir zaman kaybı olmuştu.
      İş yerinde Haiku, Sonnet ve Opus kullanıyoruz; kişisel bütçemde ise minimax m2 kullanıyorum
    • 10 kat ucuz ama 2 kat yavaşsa sonuçta token israfı yüzünden daha pahalıya bile gelebilir
    • Mevcut SOTA modeller bile kodlama performansında kusursuz değil; bu yüzden özellikle fiyat optimizasyonuna odaklanmak için güçlü bir neden görmüyorum
  • Mistral-vibe için bir AUR paketi hazırladım
    Paket bağlantısı

  • Nix kullanıcıları aşağıdaki komutla doğrudan çalıştırabilir

    nix run github:numtide/llm-agents.nix#mistral-vibe
    

    Repo her gün güncelleniyor

    • Gerçekten harika bir proje olduğunu düşünüyorum. Paylaştığın için teşekkürler