Mistral 3 model serisi duyuruldu

(mistral.ai)

4 puan yazan GN⁺ 2025-12-03 | 1 yorum | WhatsApp'ta paylaş

Mistral 3 serisi, 3B, 8B, 14B boyutlarındaki yoğun modeller ve 41B aktif/675B toplam parametreye sahip Mistral Large 3 ile birlikte yeni nesil bir açık kaynak yapay zeka model ailesidir
Tüm modeller Apache 2.0 lisansıyla yayınlanarak geliştiricilerin ve şirketlerin diledikleri gibi kullanmasına ve özelleştirmesine olanak tanır
Mistral Large 3, NVIDIA H200 GPU 3000 ile eğitilmiş Mixture-of-Experts mimarisini benimsemiş olup çok dilli sohbet ve görüntü anlama görevlerinde en iyi performansı yakalamıştır
Ministral 3 uç ortam için tasarlanmıştır; maliyet başına en iyi performansı sunar ve akıl yürütme(reasoning) türevi model, AIME ‘25’te %85 doğruluk kaydetmiştir
Mistral 3, Mistral AI Studio, Hugging Face, AWS, Azure gibi ana platformlarda anında kullanılabilir ve açık yapay zeka ekosisteminin büyümesini hedefler

Mistral 3 Özeti

Mistral 3, Mistral AI’nın yeni nesil model ailesi olup yoğun küçük modeller (3B, 8B, 14B) ile büyük seyrek model Mistral Large 3’ten oluşur
- Mistral Large 3, 41B aktif parametreye ve 675B toplam parametreye sahip bir Mixture-of-Experts(MoE) yapısıdır
- Tüm modeller Apache 2.0 lisansıyla yayınlanarak açık kaynak topluluğunun kullanımına açılmıştır
Modeller farklı sıkıştırma formatlarında sunularak, dağıtık erişilebilirliği artırır
Ministral model ailesi, maliyet/verimlilik oranı en yüksek OSS modellerinden biri olarak değerlendirilmektedir

Mistral Large 3: Açık Ağırlıklı En Üst Düzey Model

Mistral Large 3, NVIDIA H200 GPU 3000 ile sıfırdan eğitilmiş bir açık ağırlıklı modeldir
- Mixtral serisinden sonraki ilk Mixture-of-Experts modeli ve Mistral’in ön eğitim teknolojisindeki evrimi yansıtır
Eğitimin ardından, genel istem (prompt) performansında en iyi açık ağırlıklı modellerle eşdeğer performans göstermiş;
görsel anlama ve İngilizce dışı çok dillilikteki sohbet performansında da güçlü sonuçlar elde etmiştir
LMArena sıralama tablosunda OSS non-reasoning (akıl yürütmesiz) model klasmanında 2., genel OSS modeller arasında 6.
Temel(base) ve talimatlı(instruct) ince ayar sürümleri yayınlanmıştır; akıl yürütme(reasoning) sürümü ise kısa süre içinde çıkacak

NVIDIA·vLLM·Red Hat İş Birliği

Mistral Large 3, vLLM ve Red Hat iş birliğiyle açık kaynak topluluğunda kolay erişim sağlar
- llm-compressor ile üretilen NVFP4 formatlı checkpoint’ler sunulmaktadır
- vLLM üzerinden Blackwell NVL72, 8×A100, 8×H100 sistemlerinde verimli çalıştırma mümkün hale gelir
NVIDIA iş birliğiyle TensorRT-LLM, SGLang vb. çözümlerde düşük hassasiyetli çıkarım (inference) desteği gelir
- Blackwell attention ve MoE çekirdekleri, prefill/decode ayrık servis, tahminsel/öngörülü kod çözme (speculative decoding) işlevleri entegredir
DGX Spark, RTX PC, Jetson cihazları gibi uç ortamlar için de optimize edilmiş dağıtım desteği sağlanır

Ministral 3: Uç için Zeki Modeller

Uç ve yerel ortamlara yönelik Ministral 3 serisi 3B, 8B ve 14B olmak üzere üç boyutta sunulur
- Her model base, instruct ve reasoning olmak üzere üç varyantla yayınlanmıştır
- Tüm varyantlar görsel anlama ve çok dilli işleme özelliklerini içerir
Maliyet/verimlilik oranı en yüksek OSS modeli olarak,
instruct modeli, rakipleriyle eşdeğer veya daha iyi sonuçlar verirken token sayısını 10 kat azaltır
reasoning varyant modeli, doğruluk odaklı senaryolarda güçlüdür ve
14B modeli AIME ‘25’te %85 doğruluk elde etmiştir

Dağıtım ve Erişilebilirlik

Mistral 3 anında aşağıdaki platformlarda kullanılabilir
- Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, Modal, IBM WatsonX, OpenRouter, Fireworks, Unsloth AI, Together AI
- Kısa sürede NVIDIA NIM ve AWS SageMaker üzerinden de sunulması planlanmaktadır
Şirketler için özel model eğitim hizmeti sunulmaktadır
- Alan odaklı görevler, özgün veri kümeleriyle performans iyileştirme ve özel ortam dağıtımı gibi alanlarda destek

Mistral 3’ün Temel Değeri

Öncü performans ve açık erişilebilirlik: Kapalı model düzeyinde performansın açık kaynak olarak sağlanması
Çok modlu ve çok dilli destek: 40’tan fazla dilde metin, görüntü ve mantıksal anlama yapabilme
Ölçeklenebilir verimlilik: 3B~675B parametre aralığıyla uçtan kurumsal ayağa kadar kapsama
Uyarlanabilir kullanılabilirlik: Kod yazımı, belge analizi, araç kullanımı gibi farklı iş akışlarına entegre edilebilirlik

İleriye Dönük Adımlar

Model belgeleri ve teknik materyaller Mistral Docs ile AI Governance Hub’da sunuluyor
API kullanımı, Hugging Face ve Mistral AI platformu üzerinden anında mümkündür
Kurumsal özel eğitim ve fine-tuning başvuru kanalı yürütülmektedir
Topluluk etkileşimi Twitter/X, Discord, GitHub üzerinden yapılabilir

Sonuç

Mistral 3, şeffaflık, erişilebilirlik ve kolektif gelişim temelinde açık yapay zeka ekosistemini genişletmeyi hedefliyor
Çıkarım, verimlilik ve gerçek dünya uygulamaları alanlarında yeni olanaklar açarak,
“anlamayı eyleme dönüştüren” yeni nesil bir açık model kimliğine yerleşiyor

1 yorum

GN⁺ 2025-12-03

Hacker News görüşleri

Ben phrasing.app üzerinde verileri tutarlı bir biçime sokmak için büyük dil modelleri (LLM) kullanıyorum
Birkaç ay önce mistral-3-medium-0525'e geçtim; çünkü gpt-5 sık sık garip çıktılar üretiyordu ve bu da epey uğraştırıyordu
Mistral hızlı, ucuz ve biçimlendirme talimatlarına tam olarak uyuyor. Gerçek kullanımda benchmark'lardan çok daha iyi
Çok nadiren (%0,1) tuhaf sonuç veriyor ama gpt-5'in %15'lik başarısızlık oranıyla kıyaslanınca çok daha istikrarlı
Yeni modelleri de yakında test edip sonuçları paylaşmayı planlıyorum
- Eskiden birden fazla chatbot aboneliğim vardı ama şimdi Grok, ChatGPT, Gemini, Deepseek, Mistral arasında dönüşümlü gidip geliyorum
  API tarafında en büyük avantajın modelin beklendiği gibi davranması olduğunu düşünüyorum
  Artık Openrouter üzerinden ihtiyacım olan modeli seçip kullanıyorum
  Son dönemde reklam tabanlı chatbot'ların artmasının nedeni bence, benchmark'ların aksine gerçek kullanıcıların farkı pek hissedemeyip ücretli aboneliklerini iptal etmeleri
  OpenAI bugün yine bir aylık ücretsiz deneme önerdi; sanki iki ay önce de kullanmış olduğumu unutmuş gibi
- Ben de benzer bir deneyim yaşadım. Mistral modelleri benchmark'ta en üstte olmayabilir ama sınıflandırma veya özetleme gibi basit işlerde en verimli olanlar bunlar
  Özellikle mistral-small'ı batch API ile kullanınca maliyet/performans oranı çok iyi oluyor
- LLM'leri benchmark'larla değerlendirme biçiminin sınırları olduğunu düşünüyorum
  Aşırı uyum gerçek kullanım kalitesini düşürüyor olabilir ve Chatbot Arena'nın ortaya çıkış nedeni de buydu: gerçek kullanım değerlendirmesi
  Ama ona da biçime uyma ya da aşırı uyumluluk gibi unsurların fazla etki ettiği yönünde eleştiriler var
  Sonuçta işe özel uzmanlaşmış modellere daha çok ihtiyaç olduğunu düşünüyorum
- Mistral model kullanım örneğini paylaştığın için teşekkürler
  Yine de phrasing.app'teki “Hand-crafted by humans” ifadesi, gerçekte gelişmiş LLM'ler kullanılıyor olması nedeniyle biraz ironik geldi
- gpt-5'in %15 olasılıkla garip çıktılar verdiğini mi söylüyorsun, merak ettim
  Yoksa Mistral'ın hata oranını gpt-5.1'in karmaşık görevlerdeki başarısızlık oranıyla mı karşılaştırdın?
  Ayrıca Mistral'da bir Tool Use modeli olup olmadığını da merak ediyorum. Yeni bir kodlama modeli gelirse güzel olur
Yeni büyük modelin DeepseekV2 mimarisi kullanması ilginç
Resmî sayfada bundan bahsedilmiyor ama açık kaynak modellerin en güncel yapıları benimsemesi bence iyi bir şey
K2 de benzer bir yaklaşım izledi ve gerçek koda (mistral_large_3.py) bakarsanız DeepseekV3 tabanlı olduğunu görürsünüz
“Bilim her zaman açıklık ve paylaşım üzerine ilerler” sözündeki gibi, bu şeffaflık sevindirici
Şimdi evde 14B modeli test etmeyi planlıyorum; ayrıca Vision özelliğinin eklenmiş olması da heyecan verici
- Sonuçta Ar-Ge'yi Deepseek kopyalamaya harcayıp, ekledikleri tek özgün özellik olan Vision tarafına daha az ağırlık vermişler gibi görünüyor
  Hugging Face sayfasında da Mistral Large 3'ün multimodal görevlerde Vision'a özel modellerin gerisinde kaldığı açıkça yazıyor
- Açıkçası bugünlerde model performansını belirleyen şeyin mimari farklardan çok veri, ince ayar ve pipeline olduğunu düşünüyorum
- Her şeyin açık olmasını isteyip, gerçekten açıklandığında da kullananları eleştirmek bana çifte standart gibi geliyor
3B Vision modelinin doğrudan tarayıcıda çalışması şaşırtıcı
3GB'lık modeli indirince hemen çalıştırabiliyorsunuz ve bir Hugging Face demosu var
Simon Willison'ın yazısı da bakmaya değer
- Böyle bir teknolojiyle görme engelliler için gerçek zamanlı video betimleme aracı gibi erişilebilirlik araçları yapılabilir
  Sadece sesi değil, videodaki eylemleri de anlatan bir özelliği hayal ediyorum
Avrupa'nın Mistral'ının geri dönmesine sevindim
Apache 2.0 lisansıyla yeniden açık kaynağa dönmüş olması da olumlu
Bir dönem tüketici GPU'larına uygun küçük modellerde en iyilerden biriydi; bu Ministral 14B'nin de benchmark'lardaki kadar iyi çıkmasını umuyorum
- Aslında bu başarının arkasında ABD'li VC fonları olduğunu düşünüyorum
  Avrupa içinde kalsaydı bu ölçekte bir yapay zeka eğitim bütçesi bulmak zor olurdu
Yeni model harika görünüyor ama OpenAI·Google·Anthropic gibi SOTA modellerle karşılaştırma olmaması biraz eksik hissettiriyor
Çünkü genel konumunu anlamak zorlaşıyor
- LMArena sonuçlarına bakınca Mistral Large 3 28. sırada ve üst sıralardaki modellerle puan farkı çok büyük değil
  En iyi model 1491 puandayken Mistral 1418 puanda; yani performans farkı küçük
- Ama böyle karşılaştırmalar muhtemelen reklam düzenlemelerine takılabildiği için şirketler bundan kaçınıyor gibi görünüyor
- Zaten Mistral da kapalı modellerle rekabet etmenin zor olduğunu biliyor olmalı
  GPT-OSS ile bile kıyaslamamaları biraz temkinli bir adım gibi duruyor
- Karşılaştırma sonuçlarını yayımlamamış olmaları bile bence başlı başına çok şey anlatıyor
Avrupa'nın çabasını destekliyorum
- Ama Avrupa içinde de Londra'daki DeepMind gibi çok canlı yapay zeka araştırmalarının olduğunu unutmamak lazım
- Denge olsun diye “Windows 11, Amerika'nın en büyük başyapıtı” şakasını yapmak istiyorum
Açıkçası dün Deepseek 3.2 bütün ilgiyi üstüne çekmiş gibi hissettirdi
Bu karşılaştırmanın Deepseek 3.1'e göre yapılmış olması biraz hayal kırıklığı
Resmî haber'e göre 3.2'de ciddi iyileştirmeler var
İyi model ağırlıklarını yayımlamak için nasıl bir teşvik olduğunu hâlâ tam anlayamıyorum
OpenAI'nin gpt-oss gibi benchmark odaklı modeller sunması bir PR hamlesi olabilir,
Çinli şirketler de ABD'li büyük teknoloji firmalarının konumunu sarsmak için benzer bir strateji izliyor gibi görünüyor
Bundan sonra da iyi açık ağırlıklı modellerin gelmeye devam edip etmeyeceğinden emin değilim
- Çünkü kapalı modellerle para kazanmak zor
  Açık ağırlıklar, kurumsal ince ayar hizmetleri gibi ikincil gelir kanalları açıyor
  Şeffaflık, kontrol, gizlilik ve maliyet düşürme şirketler için önemli olduğu için
  bu açık ekosistemin uzun vadede kapalı modellerin pazarını aşındırma ihtimali var
  İlgili hizmet için: Mistral Custom Model Training
- gpt-oss sadece benchmark için değil; gerçek anlamda matematik problem çözme konusunda da çok güçlü
  Kaggle'daki AIME3 yarışmasında da üst sıralarda kalmayı sürdürüyor
- Şu anda gelir modeli belirsiz olduğu için AI şirketleri en iyi modeli yapmaktan çok VC fonu toplamaya odaklanıyor
  Açık modeller yayımlanınca şirket değeri hızla artıyor ve bu da GPU bulmayı kolaylaştırıyor
  Ama sürdürülebilir bir iş modeli sonunda ortaya çıkmazsa bu büyük bir sorun olur
- gpt-oss'nin araç çağırma performansı mükemmel ve genel olarak istikrarlı
- Google'ın benchmark'ları manipüle ettiği izlenimi çok güçlü
  Gemini benchmark'larda önde görünse de gerçek kullanım kalitesi daha düşük
Birkaç modelin toplam benchmark puanlarını karşılaştırdım
Gemini 3.0 Pro 84,8 ile birinci, DeepSeek 3.2 83,6, GPT-5.1 ise 69,2
Mistral Large 3'ün puanı 41,9 ile düşük ama 14B·8B·3B modelleri SOTA seviyesinde
ve Qwen3'teki gibi sansür sorunu da yok
- Gemini 3 ile GPT-5.1/Opus 4.5 arasındaki büyük farkı merak ediyorum
  Gemini'nin hangi alanlarda bu kadar güçlü olduğunu bilmek isterim
Benchmark'larda Gemini en iyi görünüyor ama pratikte ChatGPT ya da Claude'dan daha kötü hissettiriyor
Daha sık saçmalıyor ve Google sanki sadece benchmark puanlarını yükseltiyormuş gibi geliyor
Umarım Mistral gibi açık kaynak alternatifler bu pazarı aşındırır
- Açık ağırlıklı LLM'lerin amacı kapalı modelleri yenmek değil
  Bunlar ekosistemin denge unsuru olarak işlev görüyor ve tekelleşmeyi önleme açısından anlam taşıyor
- Ben on-prem k8s cluster kurmayı öğrenirken Gemini'yi kullandım ve bu konularda oldukça doğruydu
  Muhtemelen eğitim verisinde bu alan iyi temsil ediliyordu
- Benim sorularımda Gemini 3, GPT-5.1'e göre daha az halüsinasyon üretti
- Kişisel olarak Gemini beni en çok hayal kırıklığına uğratan model oldu; ayrıca aşırı tanıtımı da doğal gelmiyor
- Kodlama dışı işlerde Gemini, Google Search entegrasyonu sayesinde dayanak göstermekte daha avantajlı olabilir

Mistral 3 model serisi duyuruldu

Mistral 3 Özeti

Mistral Large 3: Açık Ağırlıklı En Üst Düzey Model

NVIDIA·vLLM·Red Hat İş Birliği

Ministral 3: Uç için Zeki Modeller

Dağıtım ve Erişilebilirlik

Mistral 3’ün Temel Değeri

İleriye Dönük Adımlar

Sonuç

İlgili okumalar

1 yorum

Hacker News görüşleri