MiniMax M2 modelinin temel özeti
- Modele genel bakış: Çinli MiniMax’in M2 modeli (23 milyar parametre, seçmeli etkinleştirme mimarisi), Claude Opus 4.1’i aşan performans gösterirken maliyeti Claude Sonnet’in %8’i ($0.30 / 1 milyon giriş tokeni) düzeyinde ve hızı 2 kat daha yüksek.
- Verimlilikte yenilik: MoE yapısıyla yalnızca gerekli parametreleri etkinleştirerek maliyeti %92 düşürüyor; geliştirme odağı pratik kullanıma yönelik (karmaşık kodlama ve ajan görevlerini çözme).
- Benchmark performansı: Intelligence Index’te 61 puanla açık kaynakta 1. sırada; SWE-bench’te 69.4, Terminal-Bench’te 46.3, BrowseComp’ta 44 puan alarak Claude ve Gemini modellerine yaklaşıyor ya da onları geride bırakıyor.
- Gerçek kullanım: Matematik, kodlama ve ajan iş akışlarında (veri analizi, issue araştırması, programlama) güçlü performans gösteriyor; geliştirici testleriyle hata düzeltme yeteneğini kanıtlıyor.
- Kullanım şekli: Web hizmeti (https://agent.minimax.io/) üzerinden ücretsiz kullanılabilir, API entegrasyonu desteklenir; Hugging Face açık kaynak sürümünün (MIT lisansı) indirilmesi önerilir (belirli ayarlar gereklidir).
- Anlamı: Açık kaynak modellerin yükselişiyle yapay zeka rekabeti verimlilik ve pratiklik odaklı bir yapıya kayıyor.
3 yorum
23B ise (asıl metin 230B) mac mini'ye bile kurulabilir gibi geldiği için kısa süreliğine heyecanlanmıştım..
Ben de... 23B'nin Claude 4.1 Opus seviyesinde olduğu söylenince Hugging Face'e gidip baktım, meğer 230B'ymiş; hayal kırıklığına uğradım.....
23 milyar değil, 230 milyar parametre.