Claude Opus 4.6 tanıtıldı

(anthropic.com)

20 puan yazan GN⁺ 2026-02-06 | 9 yorum | WhatsApp'ta paylaş

Anthropic’in geliştirilmiş kodlama yetenekleri ve uzun süreli görev devamlılığı sunan en yeni yapay zeka modeli; 1M token bağlam penceresini beta olarak destekliyor
Başlıca benchmark’larda sektör lideri seviyesinde puanlar alırken, GPT-5.2’ye göre yaklaşık 144 Elo puan önde
Kod inceleme·hata ayıklama, büyük kod tabanlarını işleme, finansal analiz·doküman yazımı gibi pratik iş odaklı görevlerde performansı güçlendirildi
Adaptive thinking, context compaction, effort ayarı gibi geliştirici kontrol özellikleri eklenerek uzun süre çalışan ajanların yönetimi kolaylaştırıldı
Güvenlik değerlendirmelerinde de hata·kötüye kullanım·aşırı reddetme oranlarının düşük olduğu sonuçlar göstererek, yüksek performans ile güvenliği aynı anda sağlayan bir model olarak değerlendiriliyor

Claude Opus 4.6’daki başlıca iyileştirmeler

Opus 4.6, önceki sürüme kıyasla planlama yeteneği, ajan sürekliliği ve kod kalite yönetimi geliştirilmiş bir model
- Büyük kod tabanlarında daha kararlı çalışıyor ve kendi hatalarını tespit edip düzeltme yeteneği güçlendirildi
- 1M token bağlam penceresi (beta) ile uzun ve karmaşık görevleri işleyebiliyor
Günlük işlerde kullanılabilirliği de genişletildi; finansal analiz, araştırma, doküman, elektronik tablo ve sunum üretimi gibi çeşitli görevleri yerine getirebiliyor
Cowork ortamında çoklu görevi otonom şekilde yürütebiliyor, kullanıcı adına karmaşık işleri işleyebiliyor

Benchmark ve performans değerlendirmesi

Terminal-Bench 2.0’da en yüksek puanı aldı; Humanity’s Last Exam’da da tüm frontier modeller arasında lider oldu
GDPval-AA değerlendirmesinde GPT-5.2’den yaklaşık 144 Elo puan, Opus 4.5’ten ise 190 puan daha yüksek performans gösterdi
BrowseComp testinde de en yüksek performansı kaydetti; çevrimiçi bilgi arama yeteneği güçlendi
MRCR v2 (1M variant) testinde %76 puan alarak Sonnet 4.5’in %18.5’ine kıyasla büyük bir gelişme gösterdi
Uzun bağlamı koruma ve bilgi takibi yetenekleri iyileştirilerek context rot etkisi azaltıldı

İlk kullanım deneyimleri ve partner geri bildirimleri

Dahili mühendislik testlerinde karmaşık problem çözme ve muhakeme yeteneğinin geliştiği görüldü
- Zor problemlerde derin düşünmeyi yineleyerek daha iyi sonuçlar üretiyor
- Basit görevlerde aşırı düşünme nedeniyle gecikme yaşanabildiğinden /effort parametresiyle ayarlanabiliyor
İlk partnerler, Opus 4.6’nın otonom yürütme yeteneği, karmaşık istekleri işleme, ekip iş birliğini destekleme alanlarında öne çıktığını değerlendirdi
- Büyük kod tabanlarını keşfetme, paralel alt görev yürütme, engelleri tespit etme gibi konularda hassas performans gösteriyor
- Hukuk, finans ve teknik içerik analizinde yüksek doğruluk sağlıyor (ör. BigLaw Bench %90.2)
- Gerçek testlerde 40 siber güvenlik soruşturmasının 38’inde Opus 4.5’ten daha iyi sonuç verdi
- Milyonlarca satırlık kod göçünü yarı sürede tamamladığına dair örnekler bildirildi

Güvenlik ve emniyet güçlendirmeleri

Otomatik davranış denetimlerinde aldatma, dalkavukluk, kötüye kullanıma iş birliği gibi hizasız davranış oranı düşük
Aşırı reddetme oranı (over-refusal) en düşük Claude modeli oldu
Kullanıcı refahı, riskli istekleri reddetme, gizli zararlı davranışları tespit etme gibi yeni güvenlik değerlendirmeleri yapıldı
Yorumlanabilirlik araştırmaları ile modelin iç çalışma nedenleri analiz edilip potansiyel sorunlar tespit ediliyor
Siber güvenlik yeteneklerinin güçlenmesine paralel olarak 6 yeni güvenlik probe’u devreye alındı, kötüye kullanım tespiti artırıldı
Savunma amaçlı kullanım kapsamında açık kaynak zafiyetlerini tespit etme ve yama desteği sağlanıyor; ileride gerçek zamanlı kötüye kullanım engelleme planlanıyor

Ürün ve API güncellemeleri

Claude Developer Platform’a şu özellikler eklendi
- Adaptive thinking: Model, duruma göre derin düşünmenin gerekip gerekmediğine otomatik karar veriyor
- Effort seviyesi: low, medium, high (varsayılan), max olmak üzere dört kademe sunuluyor
- Context compaction (beta): Konuşma uzadığında eski bağlamı özetleyip onun yerine geçiyor
- 1M token bağlam (beta) ve 128k çıktı tokenı desteği
- US-only inference seçeneği sunuluyor (1.1x ücret)
Claude Code’a agent teams özelliği eklendi; birden fazla ajan paralel iş birliği yapabiliyor
Claude in Excel, yapılandırılmamış veriyi yapılandırma ve çok aşamalı değişiklikleri işleme konusunda geliştirildi
Claude in PowerPoint (research preview), slayt şablonlarını, yazı tiplerini ve düzenleri tanıyarak marka tutarlılığını koruyor

Erişim ve fiyatlandırma

Opus 4.6, claude.ai, API ve başlıca bulut platformlarında hemen kullanılabiliyor
API model adı claude-opus-4-6; fiyatlandırma öncekiyle aynı şekilde milyon token başına $5/$25
200k tokenı aşan prompt’larda premium ücretlendirme uygulanıyor (milyon token başına $10/$37.50)

Sonuç

Claude Opus 4.6, uzun bağlam işleme, otonom ajan görevleri ve gelişmiş akıl yürütme yetenekleri alanında büyük bir sıçrama yapıyor
Performans, güvenlik ve geliştirici kontrolünü birlikte güçlendiren bir model olarak, iş odaklı yapay zeka araçları için yeni bir standart ortaya koyuyor

9 yorum

heim2 2026-02-06

Max kullanıyorum; sanki ne kadar çok token harcarsam o kadar tatmin edici... kullanmayınca yazık oluyormuş gibi...

duse0001 2026-02-06

İnternette dolaşan fiyat indirimi uygulanmamış galiba :(

wegaia 2026-02-06

Reddit'te abonelerin limitlerini ışık hızında tükettiklerine dair paylaşımlar yağıyor gibi görünüyor.
Benim de uğraştığım işler var, o yüzden şimdilik 4.5 kullanmaya devam ediyorum

xguru 2026-02-06

Sınırlı bir süre boyunca 50 dolar değerinde ek kullanım kredisi verdiklerini söylüyorlar. haha

duse0001 2026-02-06

API fiyatı düşerse haftalık limitin de doğal olarak artacağını umuyordum ama ne yazık ki öyle olmadı t_t 200 dolarlık planda haftalık limit pek rahat değil..

princox 2026-02-06

Off, gerçekten çok cimri.. Anthropic biraz token dağıtsın artık..!!

hmmhmmhm 2026-02-06

Ooo sonunda~~~~