Anthropic, Claude Opus 4.7’yi duyurdu - kendi kendini doğrulama, 3,3 kat yüksek çözünürlüklü görme, kodlamada %13 artış
(anthropic.com)Anthropic, amiral gemisi modeli Claude Opus 4.7’yi duyurdu.
- SWE-bench Verified’da %87,6 (+6,8 puan), SWE-bench Pro’da %64,3 ile GPT-5.4’ü (%57,7) geçerek 1. sıraya yerleşti
- GPQA Diamond’da %94,2, Terminal-Bench 2.0’da %69,4, Finance Agent’ta %64,4 elde etti
- Kodlama benchmark’larında Opus 4.6’ya kıyasla %13 iyileşme, üretim görevlerinde çözüm oranında 3 kat artış
- Yeni Self-Verification özelliği: görevi tamamlamadan önce kendi doğrulama adımlarını tasarlayıp çalıştırıyor
- 3,3 kat yüksek çözünürlüklü görme (maksimum 2.576px), yeni tokenizer kullanımı
- xhigh effort seviyesi eklendi, agentic reasoning %14 iyileşti, araç hataları üçte bire düştü
- Fiyatı Opus 4.6 ile aynı ($5/$25 per MTok)
- Anthropic, kapalı model Mythos’a kıyasla performansının daha düşük olduğunu doğrudan kabul etti
Amazon Bedrock, Google Cloud Vertex AI ve Microsoft Foundry’de de kullanılabiliyor.
1 yorum
OPUS 4.7 > GPT 5.4 > OPUS 4.6