4 puan yazan GN⁺ 2025-12-03 | 1 yorum | WhatsApp'ta paylaş
  • Mistral 3 serisi, 3B, 8B, 14B boyutlarındaki yoğun modeller ve 41B aktif/675B toplam parametreye sahip Mistral Large 3 ile birlikte yeni nesil bir açık kaynak yapay zeka model ailesidir
  • Tüm modeller Apache 2.0 lisansıyla yayınlanarak geliştiricilerin ve şirketlerin diledikleri gibi kullanmasına ve özelleştirmesine olanak tanır
  • Mistral Large 3, NVIDIA H200 GPU 3000 ile eğitilmiş Mixture-of-Experts mimarisini benimsemiş olup çok dilli sohbet ve görüntü anlama görevlerinde en iyi performansı yakalamıştır
  • Ministral 3 uç ortam için tasarlanmıştır; maliyet başına en iyi performansı sunar ve akıl yürütme(reasoning) türevi model, AIME ‘25’te %85 doğruluk kaydetmiştir
  • Mistral 3, Mistral AI Studio, Hugging Face, AWS, Azure gibi ana platformlarda anında kullanılabilir ve açık yapay zeka ekosisteminin büyümesini hedefler

Mistral 3 Özeti

  • Mistral 3, Mistral AI’nın yeni nesil model ailesi olup yoğun küçük modeller (3B, 8B, 14B) ile büyük seyrek model Mistral Large 3’ten oluşur
    • Mistral Large 3, 41B aktif parametreye ve 675B toplam parametreye sahip bir Mixture-of-Experts(MoE) yapısıdır
    • Tüm modeller Apache 2.0 lisansıyla yayınlanarak açık kaynak topluluğunun kullanımına açılmıştır
  • Modeller farklı sıkıştırma formatlarında sunularak, dağıtık erişilebilirliği artırır
  • Ministral model ailesi, maliyet/verimlilik oranı en yüksek OSS modellerinden biri olarak değerlendirilmektedir

Mistral Large 3: Açık Ağırlıklı En Üst Düzey Model

  • Mistral Large 3, NVIDIA H200 GPU 3000 ile sıfırdan eğitilmiş bir açık ağırlıklı modeldir
    • Mixtral serisinden sonraki ilk Mixture-of-Experts modeli ve Mistral’in ön eğitim teknolojisindeki evrimi yansıtır
  • Eğitimin ardından, genel istem (prompt) performansında en iyi açık ağırlıklı modellerle eşdeğer performans göstermiş;
    görsel anlama ve İngilizce dışı çok dillilikteki sohbet performansında da güçlü sonuçlar elde etmiştir
  • LMArena sıralama tablosunda OSS non-reasoning (akıl yürütmesiz) model klasmanında 2., genel OSS modeller arasında 6.
  • Temel(base) ve talimatlı(instruct) ince ayar sürümleri yayınlanmıştır; akıl yürütme(reasoning) sürümü ise kısa süre içinde çıkacak

NVIDIA·vLLM·Red Hat İş Birliği

  • Mistral Large 3, vLLM ve Red Hat iş birliğiyle açık kaynak topluluğunda kolay erişim sağlar
    • llm-compressor ile üretilen NVFP4 formatlı checkpoint’ler sunulmaktadır
    • vLLM üzerinden Blackwell NVL72, 8×A100, 8×H100 sistemlerinde verimli çalıştırma mümkün hale gelir
  • NVIDIA iş birliğiyle TensorRT-LLM, SGLang vb. çözümlerde düşük hassasiyetli çıkarım (inference) desteği gelir
    • Blackwell attention ve MoE çekirdekleri, prefill/decode ayrık servis, tahminsel/öngörülü kod çözme (speculative decoding) işlevleri entegredir
  • DGX Spark, RTX PC, Jetson cihazları gibi uç ortamlar için de optimize edilmiş dağıtım desteği sağlanır

Ministral 3: Uç için Zeki Modeller

  • Uç ve yerel ortamlara yönelik Ministral 3 serisi 3B, 8B ve 14B olmak üzere üç boyutta sunulur
    • Her model base, instruct ve reasoning olmak üzere üç varyantla yayınlanmıştır
    • Tüm varyantlar görsel anlama ve çok dilli işleme özelliklerini içerir
  • Maliyet/verimlilik oranı en yüksek OSS modeli olarak,
    instruct modeli, rakipleriyle eşdeğer veya daha iyi sonuçlar verirken token sayısını 10 kat azaltır
  • reasoning varyant modeli, doğruluk odaklı senaryolarda güçlüdür ve
    14B modeli AIME ‘25’te %85 doğruluk elde etmiştir

Dağıtım ve Erişilebilirlik

  • Mistral 3 anında aşağıdaki platformlarda kullanılabilir
    • Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, Modal, IBM WatsonX, OpenRouter, Fireworks, Unsloth AI, Together AI
    • Kısa sürede NVIDIA NIM ve AWS SageMaker üzerinden de sunulması planlanmaktadır
  • Şirketler için özel model eğitim hizmeti sunulmaktadır
    • Alan odaklı görevler, özgün veri kümeleriyle performans iyileştirme ve özel ortam dağıtımı gibi alanlarda destek

Mistral 3’ün Temel Değeri

  • Öncü performans ve açık erişilebilirlik: Kapalı model düzeyinde performansın açık kaynak olarak sağlanması
  • Çok modlu ve çok dilli destek: 40’tan fazla dilde metin, görüntü ve mantıksal anlama yapabilme
  • Ölçeklenebilir verimlilik: 3B~675B parametre aralığıyla uçtan kurumsal ayağa kadar kapsama
  • Uyarlanabilir kullanılabilirlik: Kod yazımı, belge analizi, araç kullanımı gibi farklı iş akışlarına entegre edilebilirlik

İleriye Dönük Adımlar

  • Model belgeleri ve teknik materyaller Mistral Docs ile AI Governance Hub’da sunuluyor
  • API kullanımı, Hugging Face ve Mistral AI platformu üzerinden anında mümkündür
  • Kurumsal özel eğitim ve fine-tuning başvuru kanalı yürütülmektedir
  • Topluluk etkileşimi Twitter/X, Discord, GitHub üzerinden yapılabilir

Sonuç

  • Mistral 3, şeffaflık, erişilebilirlik ve kolektif gelişim temelinde açık yapay zeka ekosistemini genişletmeyi hedefliyor
  • Çıkarım, verimlilik ve gerçek dünya uygulamaları alanlarında yeni olanaklar açarak,
    “anlamayı eyleme dönüştüren” yeni nesil bir açık model kimliğine yerleşiyor

1 yorum

 
GN⁺ 2025-12-03
Hacker News görüşleri
  • Ben phrasing.app üzerinde verileri tutarlı bir biçime sokmak için büyük dil modelleri (LLM) kullanıyorum
    Birkaç ay önce mistral-3-medium-0525'e geçtim; çünkü gpt-5 sık sık garip çıktılar üretiyordu ve bu da epey uğraştırıyordu
    Mistral hızlı, ucuz ve biçimlendirme talimatlarına tam olarak uyuyor. Gerçek kullanımda benchmark'lardan çok daha iyi
    Çok nadiren (%0,1) tuhaf sonuç veriyor ama gpt-5'in %15'lik başarısızlık oranıyla kıyaslanınca çok daha istikrarlı
    Yeni modelleri de yakında test edip sonuçları paylaşmayı planlıyorum

    • Eskiden birden fazla chatbot aboneliğim vardı ama şimdi Grok, ChatGPT, Gemini, Deepseek, Mistral arasında dönüşümlü gidip geliyorum
      API tarafında en büyük avantajın modelin beklendiği gibi davranması olduğunu düşünüyorum
      Artık Openrouter üzerinden ihtiyacım olan modeli seçip kullanıyorum
      Son dönemde reklam tabanlı chatbot'ların artmasının nedeni bence, benchmark'ların aksine gerçek kullanıcıların farkı pek hissedemeyip ücretli aboneliklerini iptal etmeleri
      OpenAI bugün yine bir aylık ücretsiz deneme önerdi; sanki iki ay önce de kullanmış olduğumu unutmuş gibi
    • Ben de benzer bir deneyim yaşadım. Mistral modelleri benchmark'ta en üstte olmayabilir ama sınıflandırma veya özetleme gibi basit işlerde en verimli olanlar bunlar
      Özellikle mistral-small'ı batch API ile kullanınca maliyet/performans oranı çok iyi oluyor
    • LLM'leri benchmark'larla değerlendirme biçiminin sınırları olduğunu düşünüyorum
      Aşırı uyum gerçek kullanım kalitesini düşürüyor olabilir ve Chatbot Arena'nın ortaya çıkış nedeni de buydu: gerçek kullanım değerlendirmesi
      Ama ona da biçime uyma ya da aşırı uyumluluk gibi unsurların fazla etki ettiği yönünde eleştiriler var
      Sonuçta işe özel uzmanlaşmış modellere daha çok ihtiyaç olduğunu düşünüyorum
    • Mistral model kullanım örneğini paylaştığın için teşekkürler
      Yine de phrasing.app'teki “Hand-crafted by humans” ifadesi, gerçekte gelişmiş LLM'ler kullanılıyor olması nedeniyle biraz ironik geldi
    • gpt-5'in %15 olasılıkla garip çıktılar verdiğini mi söylüyorsun, merak ettim
      Yoksa Mistral'ın hata oranını gpt-5.1'in karmaşık görevlerdeki başarısızlık oranıyla mı karşılaştırdın?
      Ayrıca Mistral'da bir Tool Use modeli olup olmadığını da merak ediyorum. Yeni bir kodlama modeli gelirse güzel olur
  • Yeni büyük modelin DeepseekV2 mimarisi kullanması ilginç
    Resmî sayfada bundan bahsedilmiyor ama açık kaynak modellerin en güncel yapıları benimsemesi bence iyi bir şey
    K2 de benzer bir yaklaşım izledi ve gerçek koda (mistral_large_3.py) bakarsanız DeepseekV3 tabanlı olduğunu görürsünüz
    “Bilim her zaman açıklık ve paylaşım üzerine ilerler” sözündeki gibi, bu şeffaflık sevindirici
    Şimdi evde 14B modeli test etmeyi planlıyorum; ayrıca Vision özelliğinin eklenmiş olması da heyecan verici

    • Sonuçta Ar-Ge'yi Deepseek kopyalamaya harcayıp, ekledikleri tek özgün özellik olan Vision tarafına daha az ağırlık vermişler gibi görünüyor
      Hugging Face sayfasında da Mistral Large 3'ün multimodal görevlerde Vision'a özel modellerin gerisinde kaldığı açıkça yazıyor
    • Açıkçası bugünlerde model performansını belirleyen şeyin mimari farklardan çok veri, ince ayar ve pipeline olduğunu düşünüyorum
    • Her şeyin açık olmasını isteyip, gerçekten açıklandığında da kullananları eleştirmek bana çifte standart gibi geliyor
  • 3B Vision modelinin doğrudan tarayıcıda çalışması şaşırtıcı
    3GB'lık modeli indirince hemen çalıştırabiliyorsunuz ve bir Hugging Face demosu var
    Simon Willison'ın yazısı da bakmaya değer

    • Böyle bir teknolojiyle görme engelliler için gerçek zamanlı video betimleme aracı gibi erişilebilirlik araçları yapılabilir
      Sadece sesi değil, videodaki eylemleri de anlatan bir özelliği hayal ediyorum
  • Avrupa'nın Mistral'ının geri dönmesine sevindim
    Apache 2.0 lisansıyla yeniden açık kaynağa dönmüş olması da olumlu
    Bir dönem tüketici GPU'larına uygun küçük modellerde en iyilerden biriydi; bu Ministral 14B'nin de benchmark'lardaki kadar iyi çıkmasını umuyorum

    • Aslında bu başarının arkasında ABD'li VC fonları olduğunu düşünüyorum
      Avrupa içinde kalsaydı bu ölçekte bir yapay zeka eğitim bütçesi bulmak zor olurdu
  • Yeni model harika görünüyor ama OpenAI·Google·Anthropic gibi SOTA modellerle karşılaştırma olmaması biraz eksik hissettiriyor
    Çünkü genel konumunu anlamak zorlaşıyor

    • LMArena sonuçlarına bakınca Mistral Large 3 28. sırada ve üst sıralardaki modellerle puan farkı çok büyük değil
      En iyi model 1491 puandayken Mistral 1418 puanda; yani performans farkı küçük
    • Ama böyle karşılaştırmalar muhtemelen reklam düzenlemelerine takılabildiği için şirketler bundan kaçınıyor gibi görünüyor
    • Zaten Mistral da kapalı modellerle rekabet etmenin zor olduğunu biliyor olmalı
      GPT-OSS ile bile kıyaslamamaları biraz temkinli bir adım gibi duruyor
    • Karşılaştırma sonuçlarını yayımlamamış olmaları bile bence başlı başına çok şey anlatıyor
  • Avrupa'nın çabasını destekliyorum

    • Ama Avrupa içinde de Londra'daki DeepMind gibi çok canlı yapay zeka araştırmalarının olduğunu unutmamak lazım
    • Denge olsun diye “Windows 11, Amerika'nın en büyük başyapıtı” şakasını yapmak istiyorum
  • Açıkçası dün Deepseek 3.2 bütün ilgiyi üstüne çekmiş gibi hissettirdi
    Bu karşılaştırmanın Deepseek 3.1'e göre yapılmış olması biraz hayal kırıklığı
    Resmî haber'e göre 3.2'de ciddi iyileştirmeler var

  • İyi model ağırlıklarını yayımlamak için nasıl bir teşvik olduğunu hâlâ tam anlayamıyorum
    OpenAI'nin gpt-oss gibi benchmark odaklı modeller sunması bir PR hamlesi olabilir,
    Çinli şirketler de ABD'li büyük teknoloji firmalarının konumunu sarsmak için benzer bir strateji izliyor gibi görünüyor
    Bundan sonra da iyi açık ağırlıklı modellerin gelmeye devam edip etmeyeceğinden emin değilim

    • Çünkü kapalı modellerle para kazanmak zor
      Açık ağırlıklar, kurumsal ince ayar hizmetleri gibi ikincil gelir kanalları açıyor
      Şeffaflık, kontrol, gizlilik ve maliyet düşürme şirketler için önemli olduğu için
      bu açık ekosistemin uzun vadede kapalı modellerin pazarını aşındırma ihtimali var
      İlgili hizmet için: Mistral Custom Model Training
    • gpt-oss sadece benchmark için değil; gerçek anlamda matematik problem çözme konusunda da çok güçlü
      Kaggle'daki AIME3 yarışmasında da üst sıralarda kalmayı sürdürüyor
    • Şu anda gelir modeli belirsiz olduğu için AI şirketleri en iyi modeli yapmaktan çok VC fonu toplamaya odaklanıyor
      Açık modeller yayımlanınca şirket değeri hızla artıyor ve bu da GPU bulmayı kolaylaştırıyor
      Ama sürdürülebilir bir iş modeli sonunda ortaya çıkmazsa bu büyük bir sorun olur
    • gpt-oss'nin araç çağırma performansı mükemmel ve genel olarak istikrarlı
    • Google'ın benchmark'ları manipüle ettiği izlenimi çok güçlü
      Gemini benchmark'larda önde görünse de gerçek kullanım kalitesi daha düşük
  • Birkaç modelin toplam benchmark puanlarını karşılaştırdım
    Gemini 3.0 Pro 84,8 ile birinci, DeepSeek 3.2 83,6, GPT-5.1 ise 69,2
    Mistral Large 3'ün puanı 41,9 ile düşük ama 14B·8B·3B modelleri SOTA seviyesinde
    ve Qwen3'teki gibi sansür sorunu da yok

    • Gemini 3 ile GPT-5.1/Opus 4.5 arasındaki büyük farkı merak ediyorum
      Gemini'nin hangi alanlarda bu kadar güçlü olduğunu bilmek isterim
  • Benchmark'larda Gemini en iyi görünüyor ama pratikte ChatGPT ya da Claude'dan daha kötü hissettiriyor
    Daha sık saçmalıyor ve Google sanki sadece benchmark puanlarını yükseltiyormuş gibi geliyor
    Umarım Mistral gibi açık kaynak alternatifler bu pazarı aşındırır

    • Açık ağırlıklı LLM'lerin amacı kapalı modelleri yenmek değil
      Bunlar ekosistemin denge unsuru olarak işlev görüyor ve tekelleşmeyi önleme açısından anlam taşıyor
    • Ben on-prem k8s cluster kurmayı öğrenirken Gemini'yi kullandım ve bu konularda oldukça doğruydu
      Muhtemelen eğitim verisinde bu alan iyi temsil ediliyordu
    • Benim sorularımda Gemini 3, GPT-5.1'e göre daha az halüsinasyon üretti
    • Kişisel olarak Gemini beni en çok hayal kırıklığına uğratan model oldu; ayrıca aşırı tanıtımı da doğal gelmiyor
    • Kodlama dışı işlerde Gemini, Google Search entegrasyonu sayesinde dayanak göstermekte daha avantajlı olabilir