MiniMax-M3 sahneye çıktı: Temel benchmark performanslarında GPT-5.5 ve Gemini 3.1 Pro'yu geride bırakırken maliyeti yalnızca %5-10 seviyesinde
(venturebeat.com)Çinli yapay zeka girişimi MiniMax, mevcut ABD ticari modellere kıyasla %5-10 düzeyindeki çarpıcı maliyetle GPT-5.5 ve Gemini 3.1 Pro'yu geride bırakan açık ağırlıklı, çok modlu büyük dil modeli 'M3'ü resmen duyurdu.
Tam çeviri
Çinli yapay zeka girişimi MiniMax, frontier düzeyinde kodlama performansı ve 1 milyon token bağlam penceresine sahip çok modlu büyük dil modeli 'M3'ü duyurarak küresel kurumsal yapay zeka pazarında büyük yankı uyandırdı. M3, önümüzdeki 10 gün içinde Hugging Face ve GitHub üzerinden 'Open Weights' açık kaynak lisansıyla dağıtılacak; böylece şirketler modeli kendi iç sunucularına yerel olarak indirip özel optimizasyonlar yapabilecek. Şu anda lansmana özel olarak 1 milyon giriş tokenı başına 0,3 dolar ve çıkış tokenı başına 1,20 dolar (toplam maliyet 1,50 dolar ) fiyatla sunuluyor; normal fiyat geçerli olduğunda bile ABD'nin önde gelen ticari modellerinin maliyetinin yalnızca %8-20'si {p:14} seviyesinde kalarak Google, OpenAI ve Anthropic gibi ABD'li teknoloji devlerini maliyet açısından açık ara geride bırakıyor.
M3'ün bu kadar dramatik maliyet düşüşü sağlamasının temel sırrı, geleneksel transformer'ların karesel oranda artan işlem maliyeti patlamasını çözen 'MiniMax Sparse Attention (MSA)' mimarisi. MSA teknolojisi, veriyi yüksek hassasiyetli bloklara bölüp yalnızca gerekli sorguları dinamik olarak eşleştirerek donanım verimliliğini en üst düzeye çıkarıyor; 1 milyon token işlerken işlem gereksinimini mevcut seviyenin 20'de 1'ine {p:5} indiriyor ve decoding hızını 15 kat artırıyor. Bu yapısal yenilik sayesinde M3, otonom yazılım mühendisliği yeteneğini ölçen SWE-Bench Pro'da %59,0 {p:59} elde ederek kapalı model olan GPT-5.5 ve Gemini 3.1 Pro'yu geçti; web gezinme ve bilgi erişimi performansında da (BrowseComp %83,5 {p:84}) önceki Claude Ops 4.7 rekorunu aştı.
Yakın zamanda çıkan en yüksek performanslı kapalı model Claude Ops 4.8 (SWE-Bench Pro %69,2 ) ile karşılaştırıldığında, ultra zor akıl yürütme alanında bir miktar performans farkı bulunsa da M3, devasa API abonelik ücretleri olmadan güçlü bir yerel otomasyon çıtası sunuyor. Ayrıca MiniMax, M3 ile çalışan; kendi kodunu yazan, bağımsız doğrulama döngüleri işleten ve otonom olarak düzeltme yapan 'MiniMax Code' ajan ürün ailesini de tanıttı ve aylık 20 dolardan (Plus) başlayan agresif bir fiyatlandırma getirdi. Sıkı veri gizliliği ve mevzuat uyumunun zorunlu olduğu kurumsal ortamlarda, M3'ün açık ağırlıklarla sunulmasının bulut veri sızıntısı riskini kökten engelleyerek şirketlere özgü temel varlıkların kurum içinde tutulması açısından son derece yüksek fiyat/performans sağlayacağı öngörülüyor.
Yazarın bir cümlesi
Sanırım ollama bulutunda denemem gerekecek
2 yorum
Modelin gerçekten rakipleriyle başa baş olduğu iddiası biraz abartılı olabilir ama fiyatı gerçekten şaşırtıcı.
Şu an kullanıyorum; diğer Çin modellerinde olduğu gibi yazarken araya Çince çıkması gibi bir sorun yok. Görünüşe göre tool call işini de iyi yapıyor.