7 puan yazan xguru 23 시간 전 | 1 yorum | WhatsApp'ta paylaş
  • Metin, görsel, video ve sesi tek bir mimari içinde birleşik olarak işleyen yerel bir omni-modal model; ajan görevlerine özel olarak tasarlanmış
  • MIT lisansı ile ticari dağıtım ve fine-tuning dahil her şey mümkün; ek izin gerekmiyor
  • Sparse MoE yapısıyla toplam 310B parametrenin yalnızca 15B'sini etkinleştirerek verimli çıkarım sağlıyor (Pro sürümü 1.02T/42B)
  • Hybrid Attention (SWA + GA 5:1 oranı, pencere 128) ile KV-cache depolama miktarını yaklaşık 6 kat azaltırken en fazla 1M token bağlam desteği sunuyor
  • Özel görüntü kodlayıcı (729M parametreli ViT, hibrit pencere attention) ve ses kodlayıcı (261M parametre, MiMo-Audio-Tokenizer tabanlı) içeriyor
  • 3 katmanlı Multi-Token Prediction(MTP) modülü ile speculative decoding tabanlı çıkarımı hızlandırıyor ve RL eğitim verimliliğini artırıyor
  • Toplam yaklaşık 48T token ile FP8 mixed precision eğitimi yapıldı; son işleme aşamasında SFT, büyük ölçekli ajan RL, Multi-Teacher On-Policy Distillation(MOPD) uygulanarak ajan ve multimodal benchmark performansı güçlendirildi
    • 5 aşamalı pipeline (metin ön eğitimi → projektör ısındırma → multimodal ön eğitim → SFT/ajan son işleme → RL/MOPD)
  • SGLang(FP8 kuantizasyon, dp/tp paralellik) ve vLLM resmi dağıtımı desteği sunuyor
  • Base(256K) ve Full(1M) olmak üzere iki sürüm sunuluyor

1 yorum

 

VentureBeat bunu test etmiş ve OpenClaw için oldukça uygun olduğunu söylüyor.
https://venturebeat.com/ai/…

  • ClawEval benchmark’ında Pro model, açık kaynak alanında lider olarak %63,8 başarı oranı kaydetti
  • Anthropic Claude Opus 4.6, Google Gemini 3.1 Pro, OpenAI GPT-5.4 ile karşılaştırıldığında %40–60 daha az token kullanarak eşdeğer sonuçlar elde etti
  • MiMo-V2.5("Omni"), görsel, işitsel ve metni entegre biçimde işleyen, doğal çok modlu uzman bir modeldir
  • MiMo-V2.5-Pro("Agent"), "uzun ufuklu tutarlılık(long-horizon coherence)" ve karmaşık yazılım mühendisliği görevlerine odaklanmıştır
  • Pro model, GDPVal-AA(Elo) benchmark’ında 1581 puan alarak Kimi K2.6 ve GLM 5.1’i geride bıraktı
  • Kısıtlayıcı "Acceptable Use" politikaları içeren birçok "açık" modelin aksine, MiMo-V2.5 MIT lisansı ile yayımlandı
    • Onay gerekmiyor: Xiaomi’nin açık izni olmadan ticari dağıtım mümkün
    • Sürekli eğitim özgürlüğü: Kendi verinizle fine-tuning yapıp türetilmiş ağırlıkları yayımlayabilirsiniz
    • Sınırsız ticari kullanım: Topluluk lisanslarında sık görülen gelir tavanı veya kullanıcı sayısı sınırı yok
  • Proje lideri Fuli Luo(eski DeepSeek kilit üyesi)

    "Bir modelin değeri, sıralamasıyla değil çözdüğü problemlerle ölçülür"