- Mistral 3 serisi, 3B, 8B, 14B boyutlarındaki yoğun modeller ve 41B aktif/675B toplam parametreye sahip Mistral Large 3 ile birlikte yeni nesil bir açık kaynak yapay zeka model ailesidir
- Tüm modeller Apache 2.0 lisansıyla yayınlanarak geliştiricilerin ve şirketlerin diledikleri gibi kullanmasına ve özelleştirmesine olanak tanır
- Mistral Large 3, NVIDIA H200 GPU 3000 ile eğitilmiş Mixture-of-Experts mimarisini benimsemiş olup çok dilli sohbet ve görüntü anlama görevlerinde en iyi performansı yakalamıştır
- Ministral 3 uç ortam için tasarlanmıştır; maliyet başına en iyi performansı sunar ve akıl yürütme(reasoning) türevi model, AIME ‘25’te %85 doğruluk kaydetmiştir
- Mistral 3, Mistral AI Studio, Hugging Face, AWS, Azure gibi ana platformlarda anında kullanılabilir ve açık yapay zeka ekosisteminin büyümesini hedefler
Mistral 3 Özeti
- Mistral 3, Mistral AI’nın yeni nesil model ailesi olup yoğun küçük modeller (3B, 8B, 14B) ile büyük seyrek model Mistral Large 3’ten oluşur
- Mistral Large 3, 41B aktif parametreye ve 675B toplam parametreye sahip bir Mixture-of-Experts(MoE) yapısıdır
- Tüm modeller Apache 2.0 lisansıyla yayınlanarak açık kaynak topluluğunun kullanımına açılmıştır
- Modeller farklı sıkıştırma formatlarında sunularak, dağıtık erişilebilirliği artırır
- Ministral model ailesi, maliyet/verimlilik oranı en yüksek OSS modellerinden biri olarak değerlendirilmektedir
Mistral Large 3: Açık Ağırlıklı En Üst Düzey Model
- Mistral Large 3, NVIDIA H200 GPU 3000 ile sıfırdan eğitilmiş bir açık ağırlıklı modeldir
- Mixtral serisinden sonraki ilk Mixture-of-Experts modeli ve Mistral’in ön eğitim teknolojisindeki evrimi yansıtır
- Eğitimin ardından, genel istem (prompt) performansında en iyi açık ağırlıklı modellerle eşdeğer performans göstermiş;
görsel anlama ve İngilizce dışı çok dillilikteki sohbet performansında da güçlü sonuçlar elde etmiştir
- LMArena sıralama tablosunda OSS non-reasoning (akıl yürütmesiz) model klasmanında 2., genel OSS modeller arasında 6.
- Temel(base) ve talimatlı(instruct) ince ayar sürümleri yayınlanmıştır; akıl yürütme(reasoning) sürümü ise kısa süre içinde çıkacak
NVIDIA·vLLM·Red Hat İş Birliği
- Mistral Large 3, vLLM ve Red Hat iş birliğiyle açık kaynak topluluğunda kolay erişim sağlar
- llm-compressor ile üretilen NVFP4 formatlı checkpoint’ler sunulmaktadır
- vLLM üzerinden Blackwell NVL72, 8×A100, 8×H100 sistemlerinde verimli çalıştırma mümkün hale gelir
- NVIDIA iş birliğiyle TensorRT-LLM, SGLang vb. çözümlerde düşük hassasiyetli çıkarım (inference) desteği gelir
- Blackwell attention ve MoE çekirdekleri, prefill/decode ayrık servis, tahminsel/öngörülü kod çözme (speculative decoding) işlevleri entegredir
- DGX Spark, RTX PC, Jetson cihazları gibi uç ortamlar için de optimize edilmiş dağıtım desteği sağlanır
Ministral 3: Uç için Zeki Modeller
- Uç ve yerel ortamlara yönelik Ministral 3 serisi 3B, 8B ve 14B olmak üzere üç boyutta sunulur
- Her model base, instruct ve reasoning olmak üzere üç varyantla yayınlanmıştır
- Tüm varyantlar görsel anlama ve çok dilli işleme özelliklerini içerir
- Maliyet/verimlilik oranı en yüksek OSS modeli olarak,
instruct modeli, rakipleriyle eşdeğer veya daha iyi sonuçlar verirken token sayısını 10 kat azaltır
- reasoning varyant modeli, doğruluk odaklı senaryolarda güçlüdür ve
14B modeli AIME ‘25’te %85 doğruluk elde etmiştir
Dağıtım ve Erişilebilirlik
- Mistral 3 anında aşağıdaki platformlarda kullanılabilir
- Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, Modal, IBM WatsonX, OpenRouter, Fireworks, Unsloth AI, Together AI
- Kısa sürede NVIDIA NIM ve AWS SageMaker üzerinden de sunulması planlanmaktadır
- Şirketler için özel model eğitim hizmeti sunulmaktadır
- Alan odaklı görevler, özgün veri kümeleriyle performans iyileştirme ve özel ortam dağıtımı gibi alanlarda destek
Mistral 3’ün Temel Değeri
- Öncü performans ve açık erişilebilirlik: Kapalı model düzeyinde performansın açık kaynak olarak sağlanması
- Çok modlu ve çok dilli destek: 40’tan fazla dilde metin, görüntü ve mantıksal anlama yapabilme
- Ölçeklenebilir verimlilik: 3B~675B parametre aralığıyla uçtan kurumsal ayağa kadar kapsama
- Uyarlanabilir kullanılabilirlik: Kod yazımı, belge analizi, araç kullanımı gibi farklı iş akışlarına entegre edilebilirlik
İleriye Dönük Adımlar
- Model belgeleri ve teknik materyaller Mistral Docs ile AI Governance Hub’da sunuluyor
- API kullanımı, Hugging Face ve Mistral AI platformu üzerinden anında mümkündür
- Kurumsal özel eğitim ve fine-tuning başvuru kanalı yürütülmektedir
- Topluluk etkileşimi Twitter/X, Discord, GitHub üzerinden yapılabilir
Sonuç
- Mistral 3, şeffaflık, erişilebilirlik ve kolektif gelişim temelinde açık yapay zeka ekosistemini genişletmeyi hedefliyor
- Çıkarım, verimlilik ve gerçek dünya uygulamaları alanlarında yeni olanaklar açarak,
“anlamayı eyleme dönüştüren” yeni nesil bir açık model kimliğine yerleşiyor
Henüz yorum yok.