- Magistral, Mistral AI'nin alan odaklı kullanım, şeffaflık ve çok dilli akıl yürütme için özelleştirilmiş ilk akıl yürütme (reasoning) modeli
- Açık kaynak Magistral Small (24B parametre) ve kurumsal sürüm Magistral Medium olmak üzere iki versiyonla sunuldu
- Düşünce zinciri (Chain of Thought) tabanlı çok dilli akıl yürütmeyi, adım adım mantıksal süreci kullanıcının dilinde şeffaf biçimde sunuyor
- AIME2024'te Magistral Medium %73,6 (en yüksek %90), Small ise %70,7 (en yüksek %83,3) performans gösterdi
- Hukuk, finans, sağlık gibi regülasyona tabi sektörler, veri mühendisliği, yazılım geliştirme ve yaratıcı içerik gibi farklı dil ve sektörlerde doğru adım adım mantık ilerleyişi ile 10 kat daha hızlı yanıt süresi sağlıyor
Magistral — Mistral AI'nin İlk Akıl Yürütme Modeli Duyuruldu
- Magistral, gerçek dünya problem çözme becerisi ve geri bildirim temelli iyileştirme odağına sahip bir reasoning modeli
- Magistral Small, 24B parametreli açık kaynak sürüm; Magistral Medium ise daha güçlü kurumsal sürüm olarak iki ayrı versiyonda sunuluyor
- Performans göstergeleri:
- Magistral Medium: AIME2024'te %73,6, çoğunluk oyu ölçütünde %90
- Magistral Small: sırasıyla %70,7 ve %83,3
- Küresel diller ve yazı sistemleri temelinde Chain of Thought muhakemesi uyguluyor; ana dil seviyesinde düşünce akışı sağlayabiliyor
- Yapısal hesaplama, programlama mantığı, karar ağaçları, kural tabanlı sistemler gibi çok çeşitli görevler için uygun
- Le Chat'in Think mode ve Flash Answers özellikleriyle yanıt hızını rakiplere kıyasla 10 kat artırıyor
- Resmî makalede algoritmalar, eğitim altyapısı, pekiştirmeli öğrenme teknikleri ve eğitim içgörüleri genelinde değerlendirmelere yer veriliyor
Model ve teknik ayrıntılar
- Şeffaf akıl yürütme süreci:
- Magistral, çok adımlı mantık için optimize edildi; böylece kullanıcılar akıl yürütme sürecini kendi dillerinde görebiliyor ve izleyebiliyor
- Genel amaçlı modellere kıyasla yorumlanabilirlik ve doğrulama yetenekleri güçlendirilmiş durumda
- Sürekli model güncellemeleri ve hızlı iyileştirme hedefleniyor
- Çok dilli akıl yürütme: İngilizce, Fransızca, İspanyolca, Almanca, İtalyanca, Arapça, Rusça, Çince ve diğer dillerde yüksek doğruluk ve mantıksal tutarlılık sağlıyor
- Yanıt hızı:
- Magistral Medium, Le Chat'in Flash Answers özelliği sayesinde rakiplere göre 10 kat daha yüksek token işleme hızıyla gerçek zamanlı akıl yürütme ve geri bildirim desteği sunuyor
- ChatGPT gibi başlıca rakip modellere kıyasla hız tarafında üstünlüğünü gösteriyor
Açık kaynak ve topluluk katılımı
- Magistral Small, Apache 2.0 lisansı ile yayımlandı
- Kullanıcılar yapı ve akıl yürütme yaklaşımı üzerinde doğrudan analiz, değişiklik ve yeniden yapılandırma yapabiliyor
- Önceki açık kaynak modeller, ether0 ve DeepHermes 3 gibi yenilikçi araştırma projelerinde kullanılmıştı
Geniş kapsamlı kullanım örnekleri
- Magistral, hukuk, finans, yazılım geliştirme ve hikâye anlatımı gibi hassas adım adım akıl yürütme ve şeffaflığın önemli olduğu alanlar için optimize edildi
-
İş stratejisi ve operasyonlar
- Stratejik planlama, risk değerlendirmesi, veri temelli karar alma ve karmaşık kısıtlar altında optimal çözüm hesaplama gibi görevleri yerine getirebiliyor
-
Regülasyona tabi sektörler ve kamu
- Hukuk, finans, sağlık ve kamu uzmanları mantıksal akıl yürütme yolunu izleyebiliyor ve denetlenebilirlik sağlayabiliyor
- Sonuçların denetlenebilirliği ve mevzuata uyum gereksinimlerini destekliyor
-
Sistemler, yazılım ve veri mühendisliği alanı
- Akıl yürütmeyen LLM'lere kıyasla programlama, proje tasarımı, backend mimarisi ve veri mühendisliği desteğinin kalitesini artırıyor
- Harici araçlar ve API entegrasyonları gibi çok adımlı işlerde etkili
-
İçerik üretimi ve iletişim
- Magistral, yaratıcı yazarlık ve hikâye anlatımında da güçlü sonuçlar veriyor
- Yalnızca tutarlı metin değil, özgün ve sıra dışı fikirler üretme yeteneği de sunuyor
Kullanım ve dağıtım yolları
- Small sürümü indirildikten sonra self-hosted olarak dağıtılabiliyor
- Medium sürümü Le Chat (web), API ve Amazon SageMaker üzerinden hemen kullanılabiliyor
- Yakında IBM WatsonX, Azure AI ve Google Cloud Marketplace için de ek destek gelecek
- Kuruma özel, on-premise dağıtım için ayrıca iletişime geçilebiliyor
1 yorum
Hacker News görüşleri
ollama run hf.co/unsloth/Magistral-Small-2506-GGUF:UD-Q4_K_XLkomutuyla ollama'da çalıştırılabildiğini, llama.cpp tarafında ise--jinja,--temp 0.7,--top-p 0.95gibi seçeneklerin mutlaka kullanılması gerektiğini özellikle belirtiyor. Ollama'nın bağlam uzunluğunu da 8192'nin üstüne çıkarmak tavsiye ediliyor; ek rehber de resmi dokümanda bulunabiliyor-yazıp boşluk tuşuna basınca bunun sık sık en-dash'e dönüşmesi nedeniyle yanlış anlaşılmamak için özellikle düzelttiğini paylaşan bir deneyim aktarılıyor