Moonshot AI, Kimi K2.7-Code’u piyasaya sürdü
(marktechpost.com)Moonshot AI, önceki modele kıyasla kodlama performansını büyük ölçüde artıran ve muhakeme token tüketimini %30 azaltan, ajan odaklı açık ağırlıklı kodlama modeli
Kimi K2.7-Codeu piyasaya sürdü.
Tam çeviri
Bu hafta Moonshot AI, Kimi K2.7-Codeu piyasaya sürdü. Bu, kodlamaya özel ajan odaklı bir modeldir. Model ağırlıkları, değiştirilmiş MIT lisansı kapsamında Hugging Face’te dağıtılıyor. Ayrıca Kimi API ve Kimi Code üzerinden de kullanılabiliyor. K2.7-Code, genel sohbetten ziyade uzun soluklu yazılım mühendisliği görevlerini hedefliyor. Model, birden fazla adım boyunca plan yapıyor, kodu düzenliyor, araçları çalıştırıyor ve hata ayıklama gerçekleştiriyor. Moonshot AI, bu modeli abonelik tabanlı kodlama platformuyla birlikte sunuyor.
Kimi K2.7-Code özellikleri
K2.7-Code, bir Mixture-of-Experts (MoE) modelidir. Toplam 1 trilyon (1T) parametreye sahip ve token başına 32 milyar (32B) parametre etkinleşiyor. Bu yapı, toplam 384 uzmandan token başına 8 uzmanın seçildiği ve 1 uzmanın paylaşıldığı bir yöntemi kullanıyor. 1 Dense katman dahil olmak üzere toplam 61 katmandan oluşuyor.
Attention mekanizmasında MLA kullanılmış, feedforward yolunda ise SwiGLU uygulanmıştır. MoonViT görsel kodlayıcısı, görüntü ve video girdileri için 400 milyon (400M) parametre ekliyor. Model, yerel INT4 quantization uygulanmış halde sunuluyor. Context window 256K token (262.144). İki kısıt bulunuyor. Thinking mode zorunlu ve devre dışı bırakılırsa API hatası döndürülüyor. Sampling parametreleri temperature 1.0, top_p 0.95, n 1 ve penalty 0.0 olarak sabitlenmiş. Varsayılan maksimum çıktı 32.768 token. vLLM, SGLang ve KTransformers kullanılarak self-host edilebiliyor. Hugging Face deposunun boyutu disk üzerinde yaklaşık 595GB ile oldukça büyük. Bu, dizüstü bilgisayarlar için değil, sunucu sınıfı dağıtımları hedefleyen bir model olduğunu gösteriyor.
Benchmark skorları
Moonshot ekibi 6 benchmark sonucunu paylaştı. Bunlarda K2.7-Code, K2.6, GPT-5.5 ve Claude Opus 4.8 ile karşılaştırıldı. K2.7-Code, tüm kalemlerde K2.6’yı geride bıraktı. Kodlama tarafındaki en büyük artış, Kimi Code Bench v2’de görüldü; skor önceki %50,9 seviyesinden %62,0’a yükseldi.
K2.7-Code, MCP Mark Verified benchmarkında %81,1 alarak Opus 4.8’in %76,4’ünü geçti. Ayrıca MLS Bench Lite’ta GPT-5.5’e yakın bir sonuç kaydetti. K2.7-Code, Kimi Code CLI üzerinde çalıştırılırken GPT-5.5 Codex xhigh, Opus 4.8 ise Claude Code xhigh ortamında test edildi.
1 yorum
Gerçekten harika.