Mistral 3 model serisi duyuruldu
(mistral.ai)- Mistral 3 serisi, 3B, 8B, 14B boyutlarındaki yoğun modeller ve 41B aktif/675B toplam parametreye sahip Mistral Large 3 ile birlikte yeni nesil bir açık kaynak yapay zeka model ailesidir
- Tüm modeller Apache 2.0 lisansıyla yayınlanarak geliştiricilerin ve şirketlerin diledikleri gibi kullanmasına ve özelleştirmesine olanak tanır
- Mistral Large 3, NVIDIA H200 GPU 3000 ile eğitilmiş Mixture-of-Experts mimarisini benimsemiş olup çok dilli sohbet ve görüntü anlama görevlerinde en iyi performansı yakalamıştır
- Ministral 3 uç ortam için tasarlanmıştır; maliyet başına en iyi performansı sunar ve akıl yürütme(reasoning) türevi model, AIME ‘25’te %85 doğruluk kaydetmiştir
- Mistral 3, Mistral AI Studio, Hugging Face, AWS, Azure gibi ana platformlarda anında kullanılabilir ve açık yapay zeka ekosisteminin büyümesini hedefler
Mistral 3 Özeti
- Mistral 3, Mistral AI’nın yeni nesil model ailesi olup yoğun küçük modeller (3B, 8B, 14B) ile büyük seyrek model Mistral Large 3’ten oluşur
- Mistral Large 3, 41B aktif parametreye ve 675B toplam parametreye sahip bir Mixture-of-Experts(MoE) yapısıdır
- Tüm modeller Apache 2.0 lisansıyla yayınlanarak açık kaynak topluluğunun kullanımına açılmıştır
- Modeller farklı sıkıştırma formatlarında sunularak, dağıtık erişilebilirliği artırır
- Ministral model ailesi, maliyet/verimlilik oranı en yüksek OSS modellerinden biri olarak değerlendirilmektedir
Mistral Large 3: Açık Ağırlıklı En Üst Düzey Model
- Mistral Large 3, NVIDIA H200 GPU 3000 ile sıfırdan eğitilmiş bir açık ağırlıklı modeldir
- Mixtral serisinden sonraki ilk Mixture-of-Experts modeli ve Mistral’in ön eğitim teknolojisindeki evrimi yansıtır
- Eğitimin ardından, genel istem (prompt) performansında en iyi açık ağırlıklı modellerle eşdeğer performans göstermiş;
görsel anlama ve İngilizce dışı çok dillilikteki sohbet performansında da güçlü sonuçlar elde etmiştir - LMArena sıralama tablosunda OSS non-reasoning (akıl yürütmesiz) model klasmanında 2., genel OSS modeller arasında 6.
- Temel(base) ve talimatlı(instruct) ince ayar sürümleri yayınlanmıştır; akıl yürütme(reasoning) sürümü ise kısa süre içinde çıkacak
NVIDIA·vLLM·Red Hat İş Birliği
- Mistral Large 3, vLLM ve Red Hat iş birliğiyle açık kaynak topluluğunda kolay erişim sağlar
- llm-compressor ile üretilen NVFP4 formatlı checkpoint’ler sunulmaktadır
- vLLM üzerinden Blackwell NVL72, 8×A100, 8×H100 sistemlerinde verimli çalıştırma mümkün hale gelir
- NVIDIA iş birliğiyle TensorRT-LLM, SGLang vb. çözümlerde düşük hassasiyetli çıkarım (inference) desteği gelir
- Blackwell attention ve MoE çekirdekleri, prefill/decode ayrık servis, tahminsel/öngörülü kod çözme (speculative decoding) işlevleri entegredir
- DGX Spark, RTX PC, Jetson cihazları gibi uç ortamlar için de optimize edilmiş dağıtım desteği sağlanır
Ministral 3: Uç için Zeki Modeller
- Uç ve yerel ortamlara yönelik Ministral 3 serisi 3B, 8B ve 14B olmak üzere üç boyutta sunulur
- Her model base, instruct ve reasoning olmak üzere üç varyantla yayınlanmıştır
- Tüm varyantlar görsel anlama ve çok dilli işleme özelliklerini içerir
- Maliyet/verimlilik oranı en yüksek OSS modeli olarak,
instruct modeli, rakipleriyle eşdeğer veya daha iyi sonuçlar verirken token sayısını 10 kat azaltır - reasoning varyant modeli, doğruluk odaklı senaryolarda güçlüdür ve
14B modeli AIME ‘25’te %85 doğruluk elde etmiştir
Dağıtım ve Erişilebilirlik
- Mistral 3 anında aşağıdaki platformlarda kullanılabilir
- Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, Modal, IBM WatsonX, OpenRouter, Fireworks, Unsloth AI, Together AI
- Kısa sürede NVIDIA NIM ve AWS SageMaker üzerinden de sunulması planlanmaktadır
- Şirketler için özel model eğitim hizmeti sunulmaktadır
- Alan odaklı görevler, özgün veri kümeleriyle performans iyileştirme ve özel ortam dağıtımı gibi alanlarda destek
Mistral 3’ün Temel Değeri
- Öncü performans ve açık erişilebilirlik: Kapalı model düzeyinde performansın açık kaynak olarak sağlanması
- Çok modlu ve çok dilli destek: 40’tan fazla dilde metin, görüntü ve mantıksal anlama yapabilme
- Ölçeklenebilir verimlilik: 3B~675B parametre aralığıyla uçtan kurumsal ayağa kadar kapsama
- Uyarlanabilir kullanılabilirlik: Kod yazımı, belge analizi, araç kullanımı gibi farklı iş akışlarına entegre edilebilirlik
İleriye Dönük Adımlar
- Model belgeleri ve teknik materyaller Mistral Docs ile AI Governance Hub’da sunuluyor
- API kullanımı, Hugging Face ve Mistral AI platformu üzerinden anında mümkündür
- Kurumsal özel eğitim ve fine-tuning başvuru kanalı yürütülmektedir
- Topluluk etkileşimi Twitter/X, Discord, GitHub üzerinden yapılabilir
Sonuç
- Mistral 3, şeffaflık, erişilebilirlik ve kolektif gelişim temelinde açık yapay zeka ekosistemini genişletmeyi hedefliyor
- Çıkarım, verimlilik ve gerçek dünya uygulamaları alanlarında yeni olanaklar açarak,
“anlamayı eyleme dönüştüren” yeni nesil bir açık model kimliğine yerleşiyor
1 yorum
Hacker News görüşleri
Ben phrasing.app üzerinde verileri tutarlı bir biçime sokmak için büyük dil modelleri (LLM) kullanıyorum
Birkaç ay önce mistral-3-medium-0525'e geçtim; çünkü gpt-5 sık sık garip çıktılar üretiyordu ve bu da epey uğraştırıyordu
Mistral hızlı, ucuz ve biçimlendirme talimatlarına tam olarak uyuyor. Gerçek kullanımda benchmark'lardan çok daha iyi
Çok nadiren (%0,1) tuhaf sonuç veriyor ama gpt-5'in %15'lik başarısızlık oranıyla kıyaslanınca çok daha istikrarlı
Yeni modelleri de yakında test edip sonuçları paylaşmayı planlıyorum
API tarafında en büyük avantajın modelin beklendiği gibi davranması olduğunu düşünüyorum
Artık Openrouter üzerinden ihtiyacım olan modeli seçip kullanıyorum
Son dönemde reklam tabanlı chatbot'ların artmasının nedeni bence, benchmark'ların aksine gerçek kullanıcıların farkı pek hissedemeyip ücretli aboneliklerini iptal etmeleri
OpenAI bugün yine bir aylık ücretsiz deneme önerdi; sanki iki ay önce de kullanmış olduğumu unutmuş gibi
Özellikle mistral-small'ı batch API ile kullanınca maliyet/performans oranı çok iyi oluyor
Aşırı uyum gerçek kullanım kalitesini düşürüyor olabilir ve Chatbot Arena'nın ortaya çıkış nedeni de buydu: gerçek kullanım değerlendirmesi
Ama ona da biçime uyma ya da aşırı uyumluluk gibi unsurların fazla etki ettiği yönünde eleştiriler var
Sonuçta işe özel uzmanlaşmış modellere daha çok ihtiyaç olduğunu düşünüyorum
Yine de phrasing.app'teki “Hand-crafted by humans” ifadesi, gerçekte gelişmiş LLM'ler kullanılıyor olması nedeniyle biraz ironik geldi
Yoksa Mistral'ın hata oranını gpt-5.1'in karmaşık görevlerdeki başarısızlık oranıyla mı karşılaştırdın?
Ayrıca Mistral'da bir Tool Use modeli olup olmadığını da merak ediyorum. Yeni bir kodlama modeli gelirse güzel olur
Yeni büyük modelin DeepseekV2 mimarisi kullanması ilginç
Resmî sayfada bundan bahsedilmiyor ama açık kaynak modellerin en güncel yapıları benimsemesi bence iyi bir şey
K2 de benzer bir yaklaşım izledi ve gerçek koda (
mistral_large_3.py) bakarsanız DeepseekV3 tabanlı olduğunu görürsünüz“Bilim her zaman açıklık ve paylaşım üzerine ilerler” sözündeki gibi, bu şeffaflık sevindirici
Şimdi evde 14B modeli test etmeyi planlıyorum; ayrıca Vision özelliğinin eklenmiş olması da heyecan verici
Hugging Face sayfasında da Mistral Large 3'ün multimodal görevlerde Vision'a özel modellerin gerisinde kaldığı açıkça yazıyor
3B Vision modelinin doğrudan tarayıcıda çalışması şaşırtıcı
3GB'lık modeli indirince hemen çalıştırabiliyorsunuz ve bir Hugging Face demosu var
Simon Willison'ın yazısı da bakmaya değer
Sadece sesi değil, videodaki eylemleri de anlatan bir özelliği hayal ediyorum
Avrupa'nın Mistral'ının geri dönmesine sevindim
Apache 2.0 lisansıyla yeniden açık kaynağa dönmüş olması da olumlu
Bir dönem tüketici GPU'larına uygun küçük modellerde en iyilerden biriydi; bu Ministral 14B'nin de benchmark'lardaki kadar iyi çıkmasını umuyorum
Avrupa içinde kalsaydı bu ölçekte bir yapay zeka eğitim bütçesi bulmak zor olurdu
Yeni model harika görünüyor ama OpenAI·Google·Anthropic gibi SOTA modellerle karşılaştırma olmaması biraz eksik hissettiriyor
Çünkü genel konumunu anlamak zorlaşıyor
En iyi model 1491 puandayken Mistral 1418 puanda; yani performans farkı küçük
GPT-OSS ile bile kıyaslamamaları biraz temkinli bir adım gibi duruyor
Avrupa'nın çabasını destekliyorum
Açıkçası dün Deepseek 3.2 bütün ilgiyi üstüne çekmiş gibi hissettirdi
Bu karşılaştırmanın Deepseek 3.1'e göre yapılmış olması biraz hayal kırıklığı
Resmî haber'e göre 3.2'de ciddi iyileştirmeler var
İyi model ağırlıklarını yayımlamak için nasıl bir teşvik olduğunu hâlâ tam anlayamıyorum
OpenAI'nin gpt-oss gibi benchmark odaklı modeller sunması bir PR hamlesi olabilir,
Çinli şirketler de ABD'li büyük teknoloji firmalarının konumunu sarsmak için benzer bir strateji izliyor gibi görünüyor
Bundan sonra da iyi açık ağırlıklı modellerin gelmeye devam edip etmeyeceğinden emin değilim
Açık ağırlıklar, kurumsal ince ayar hizmetleri gibi ikincil gelir kanalları açıyor
Şeffaflık, kontrol, gizlilik ve maliyet düşürme şirketler için önemli olduğu için
bu açık ekosistemin uzun vadede kapalı modellerin pazarını aşındırma ihtimali var
İlgili hizmet için: Mistral Custom Model Training
Kaggle'daki AIME3 yarışmasında da üst sıralarda kalmayı sürdürüyor
Açık modeller yayımlanınca şirket değeri hızla artıyor ve bu da GPU bulmayı kolaylaştırıyor
Ama sürdürülebilir bir iş modeli sonunda ortaya çıkmazsa bu büyük bir sorun olur
Gemini benchmark'larda önde görünse de gerçek kullanım kalitesi daha düşük
Birkaç modelin toplam benchmark puanlarını karşılaştırdım
Gemini 3.0 Pro 84,8 ile birinci, DeepSeek 3.2 83,6, GPT-5.1 ise 69,2
Mistral Large 3'ün puanı 41,9 ile düşük ama 14B·8B·3B modelleri SOTA seviyesinde
ve Qwen3'teki gibi sansür sorunu da yok
Gemini'nin hangi alanlarda bu kadar güçlü olduğunu bilmek isterim
Benchmark'larda Gemini en iyi görünüyor ama pratikte ChatGPT ya da Claude'dan daha kötü hissettiriyor
Daha sık saçmalıyor ve Google sanki sadece benchmark puanlarını yükseltiyormuş gibi geliyor
Umarım Mistral gibi açık kaynak alternatifler bu pazarı aşındırır
Bunlar ekosistemin denge unsuru olarak işlev görüyor ve tekelleşmeyi önleme açısından anlam taşıyor
Muhtemelen eğitim verisinde bu alan iyi temsil ediliyordu