2 puan yazan minodevs 13 일 전 | 1 yorum | WhatsApp'ta paylaş

Anthropic, amiral gemisi modeli Claude Opus 4.7’yi duyurdu.

  • SWE-bench Verified’da %87,6 (+6,8 puan), SWE-bench Pro’da %64,3 ile GPT-5.4’ü (%57,7) geçerek 1. sıraya yerleşti
  • GPQA Diamond’da %94,2, Terminal-Bench 2.0’da %69,4, Finance Agent’ta %64,4 elde etti
  • Kodlama benchmark’larında Opus 4.6’ya kıyasla %13 iyileşme, üretim görevlerinde çözüm oranında 3 kat artış
  • Yeni Self-Verification özelliği: görevi tamamlamadan önce kendi doğrulama adımlarını tasarlayıp çalıştırıyor
  • 3,3 kat yüksek çözünürlüklü görme (maksimum 2.576px), yeni tokenizer kullanımı
  • xhigh effort seviyesi eklendi, agentic reasoning %14 iyileşti, araç hataları üçte bire düştü
  • Fiyatı Opus 4.6 ile aynı ($5/$25 per MTok)
  • Anthropic, kapalı model Mythos’a kıyasla performansının daha düşük olduğunu doğrudan kabul etti

Amazon Bedrock, Google Cloud Vertex AI ve Microsoft Foundry’de de kullanılabiliyor.

1 yorum

 
runai 12 일 전

OPUS 4.7 > GPT 5.4 > OPUS 4.6