Anthropic, Claude 3.7 Sonnet’i piyasaya sürdü
(anthropic.com)Anthropic, şimdiye kadarki en akıllı modeli olan Claude 3.7 Sonnet’i piyasaya sürdü. Bu model, piyasadaki ilk hibrit akıl yürütme modeli olarak hem anında yanıtlar hem de kullanıcıya gösterilen adım adım düşünme süreci sunabiliyor.
Başlıca özellikler:
- Kodlama ve frontend web geliştirmede büyük performans artışı gösteriyor
- Yeni komut satırı aracı
Claude Codetanıtıldı - geliştiriciler terminalden doğrudan mühendislik işlerini Claude’a devredebiliyor - Tüm Claude planlarında (ücretsiz, Pro, Team, Enterprise) ve Anthropic API, AWS Bedrock, Google Cloud Vertex AI üzerinde kullanılabiliyor
- Genişletilmiş düşünme modu, ücretsiz katman hariç tüm platformlarda kullanılabiliyor
- Fiyatlandırma önceki modelle aynı: milyon giriş tokenı başına $3, milyon çıkış tokenı başına $15 (düşünme tokenları dahil)
Performans iyileştirmeleri:
- SWE-bench Verified ve TAU-bench’te en yüksek performansa ulaştı
- Cursor, Cognition, Vercel, Replit, Canva ve diğerlerinin erken testlerinde; karmaşık kod tabanlarını işleme, gelişmiş araç kullanımı, kod planlama ve değiştirme, tam yığın güncellemelerinde üstün yetenek sergiledi
- Prodüksiyon düzeyinde kod üretimi ve hata azaltma performansı gösterdi
- Matematik, fizik ve komut yerine getirme becerilerinde gelişme sağladı
Claude Code:
- Kod arama ve okuma, dosya düzenleme, test yazma ve çalıştırma, GitHub’a kod commit etme ve push etme, komut satırı araçlarını kullanma imkanı sunuyor
- Özellikle test güdümlü geliştirme, karmaşık problem ayıklama ve büyük ölçekli refaktör işlemlerinde faydalı
- Normalde 45 dakikadan uzun süren işleri tek seferde tamamlayarak geliştirme süresini ciddi ölçüde kısaltıyor
- Şu anda sınırlı bir araştırma önizlemesi olarak sunuluyor
GitHub entegrasyonu:
- Artık tüm Claude planlarında GitHub entegrasyonu kullanılabiliyor
- Kişisel, iş ve açık kaynak projelerini daha derinlemesine anlama temeline dayanıyor
- Hata düzeltme, özellik geliştirme, dokümantasyon yazımı gibi alanlarda güçlü bir ortak rolü üstleniyor
- Kullanıcının önemli GitHub projeleri genelinde destek sağlıyor
Güvenlik iyileştirmeleri kapsamında, önceki modele kıyasla gereksiz ret yanıtları %45 azaltıldı ve zararlı isteklerle zararsız istekler arasında daha incelikli ayrım yapılabilir hale geldi.
5 yorum
Anthropic CEO’su Dario Amodei: DeepSeek modeli o kadar da şaşırtıcı değil
Perplexity'ye de eklenmiş.
Ama görünüşe göre henüz muhakeme özelliği kullanılamıyor..
Claude Code'u kurup kullanmayı denedim; videodaki gibi iki projenin genel özetini sordum.
Total cost: $0.1151
Total cost: $0.0855
Yaklaşık 0.2 dolar tutuyor gibi..?
Videodaki örneğin 45 dakikadan uzun süren bir iş olduğunu varsayarsak, epey pahalı bir iş olmuş olurdu.
Aşırı pahalı, fiyat/performans vermiyor. Gerçek kullanımda o3-mini’nin daha iyi bir seçenek olduğu bile düşünülebilir ama kodlama için kullanacaksanız, çıkarım aşamasının kısa olması ve ara token sorununu çözmesi gerektiğinden, o amaç açısından bakıldığında en iyisi gibi görünüyor. Fiyatı da..
Genişletilmiş düşünme modu (Thinking Mode - Extended)
Bunun, OpenAI'nin o1'i ya da DeepSeek'in R1'i gibi ayrı akıl yürütme modellerinden farklı bir yaklaşım seçtiği görülüyor. Tek bir model içinde iki modu entegre etmiş gibi görünüyor.
Ek olarak, modele eğitim verisi kesim tarihini doğrudan sorduğumda 2024 Ekim sonu diye yanıt veriyor~!