Cursor Composer 2.5, Cursor içindeki en çok tercih edilen model oldu — 10x kullanım bonusu
(x.com/mntruell)- Cursor CEO’su Michael Truell, X’te “Composer 2.5’in Cursor’da en çok seçilen model haline geldiğini söyledi. Bir gün boyunca tüm kullanıcılara 10 kat kullanım sunuyoruz” diye duyurdu
- Bu, lansmanın hemen ardından benimsenme oranının hızla yükseldiğine işaret ediyor; Anthropic/OpenAI modelleri yerine şirketin kendi modelinin varsayılan olarak seçildiği bir akış oluşuyor
Composer 2.5 için temel özet
• 18 Mayıs’ta resmi olarak yayımlanan, Cursor’un 3. nesil kendi agentic coding modeli
• Composer 2 ile aynı şekilde Moonshot AI’nin açık kaynaklı Kimi K2.5 modelini temel alıyor; bu kez duyurunun ilk paragrafında bunu açıkça belirtiyorlar (Mart ayında Kimi tabanını net biçimde açıklamadıkları için eleştirilmiş olmalarını dikkate alan bir adım)
• Toplam hesaplama gücünün %85’i Cursor’un kendi reinforcement learning pipeline’ı ve post-training sürecine ayrıldı; Composer 2’ye kıyasla 25 kat daha fazla synthetic coding task kullanıldı
• Uzun ufuklu görevlerde güvenilirliği artırmak için “metin geri bildirimi tabanlı targeted RL” eklendi — uzun rollout sonunda tek bir reward vermek yerine, hatalı tool call’ın oluştuğu belirli noktaya doğrudan ipucu enjekte edilerek credit assignment daha hassas hale getiriliyor
Benchmark’lar (Composer 2.5 vs Opus 4.7 vs GPT-5.5 vs Composer 2)
• Terminal-Bench 2.0: %69.3 vs %69.4 vs %82.7 vs %61.7 — Opus 4.7 ile fiilen başa baş, GPT-5.5’in yaklaşık 13 puan gerisinde
• SWE-Bench Multilingual: %79.8 vs %80.5 vs %77.8 vs %73.7 — Opus 4.7’nin 0.7 puan gerisinde, GPT-5.5’in önünde
• CursorBench v3.1 (default setting): Composer 2.5 %63.2, Opus 4.7 xhigh default %61.6, GPT-5.5 medium default %59.2 — gerçek geliştiricilerin kullandığı varsayılan ayarlarda iki frontier modeli de geçiyor
Fiyat — en güçlü silahı
• Standard tier: input $0.50/M, output $2.50/M. Fast tier (etkileşimli varsayılan): input $3.00/M, output $15.00/M
• SWE-Bench Multilingual’de Opus 4.7 ile aynı seviyede performans verirken Anthropic fiyatının yaklaşık 1/10’u
• CursorBench’e göre %63 doğruluğa ulaşırken görev başına ortalama maliyet $1’in altında — benzer performanstaki Opus/GPT modelleri görev başına birkaç dolar daha pahalı
Birlikte açıklanan daha büyük resim
• Cursor, Composer 2.5’ten ayrı olarak xAI altyapısı (SpaceXAI) ile birlikte Colossus 2’nin yaklaşık 1 milyon H100 sınıfı GPU’sunu kullanarak 10 kat daha büyük bir modeli sıfırdan eğittiğini de açıkladı (çıkış tarihi belirsiz)
• CEO Michael Truell’e göre şu anda Cursor içinde merge edilen PR’lerin %35’i autonomous agent tarafından üretiliyor
• Claude Code’un ARR’de 2.5 milyar dolara ve 300 bin kurumsal müşteriye ulaşarak Cursor üzerinde baskı kurduğu bir ortamda, şirket kendi modeliyle karşı hamle yapıyor gibi görünüyor
Kullanım kısıtları / yorumlar
• Composer 2.5 yalnızca Cursor IDE, Cursor CLI ve Cursor web üzerinde kullanılabiliyor — harici API, HuggingFace mirror veya üçüncü taraf gateway yok
• Kimi K2.5 tabanlı olması, regülasyona tabi sektörler veya federal işlerle ilgili kullanımda hâlâ bir değerlendirme unsuru
• “IDE wrapper” olarak başlayan Cursor’un artık ciddi bir model lab’e dönüştüğünü gösteren bir sürüm. Aynı temel model üzerinde yalnızca post-training ile +6 puandan fazla artış sağlayan bir örnek olarak, “vertical RL, ham ölçeği ne kadar yenebilir?” sorusu için iyi bir veri noktası
• Kaynak: X (@mntruell), Cursor: Introducing Composer 2.5, OfficeChai
1 yorum
Yeni çıktı, deneyip kullanıyorum; Composer 2.5 oldukça işe yarar görünüyor.