Anthropic, Claude 3.7 Sonnet’i piyasaya sürdü

(anthropic.com)

18 puan yazan humblebee 2025-02-25 | 5 yorum | WhatsApp'ta paylaş

Anthropic, şimdiye kadarki en akıllı modeli olan Claude 3.7 Sonnet’i piyasaya sürdü. Bu model, piyasadaki ilk hibrit akıl yürütme modeli olarak hem anında yanıtlar hem de kullanıcıya gösterilen adım adım düşünme süreci sunabiliyor.

Başlıca özellikler:

Kodlama ve frontend web geliştirmede büyük performans artışı gösteriyor
Yeni komut satırı aracı Claude Code tanıtıldı - geliştiriciler terminalden doğrudan mühendislik işlerini Claude’a devredebiliyor
Tüm Claude planlarında (ücretsiz, Pro, Team, Enterprise) ve Anthropic API, AWS Bedrock, Google Cloud Vertex AI üzerinde kullanılabiliyor
Genişletilmiş düşünme modu, ücretsiz katman hariç tüm platformlarda kullanılabiliyor
Fiyatlandırma önceki modelle aynı: milyon giriş tokenı başına $3, milyon çıkış tokenı başına $15 (düşünme tokenları dahil)

Performans iyileştirmeleri:

SWE-bench Verified ve TAU-bench’te en yüksek performansa ulaştı
Cursor, Cognition, Vercel, Replit, Canva ve diğerlerinin erken testlerinde; karmaşık kod tabanlarını işleme, gelişmiş araç kullanımı, kod planlama ve değiştirme, tam yığın güncellemelerinde üstün yetenek sergiledi
Prodüksiyon düzeyinde kod üretimi ve hata azaltma performansı gösterdi
Matematik, fizik ve komut yerine getirme becerilerinde gelişme sağladı

Claude Code:

Kod arama ve okuma, dosya düzenleme, test yazma ve çalıştırma, GitHub’a kod commit etme ve push etme, komut satırı araçlarını kullanma imkanı sunuyor
Özellikle test güdümlü geliştirme, karmaşık problem ayıklama ve büyük ölçekli refaktör işlemlerinde faydalı
Normalde 45 dakikadan uzun süren işleri tek seferde tamamlayarak geliştirme süresini ciddi ölçüde kısaltıyor
Şu anda sınırlı bir araştırma önizlemesi olarak sunuluyor

GitHub entegrasyonu:

Artık tüm Claude planlarında GitHub entegrasyonu kullanılabiliyor
Kişisel, iş ve açık kaynak projelerini daha derinlemesine anlama temeline dayanıyor
Hata düzeltme, özellik geliştirme, dokümantasyon yazımı gibi alanlarda güçlü bir ortak rolü üstleniyor
Kullanıcının önemli GitHub projeleri genelinde destek sağlıyor

Güvenlik iyileştirmeleri kapsamında, önceki modele kıyasla gereksiz ret yanıtları %45 azaltıldı ve zararlı isteklerle zararsız istekler arasında daha incelikli ayrım yapılabilir hale geldi.

5 yorum

yeorinhieut 2025-02-25

Anthropic CEO’su Dario Amodei: DeepSeek modeli o kadar da şaşırtıcı değil

yeorinhieut 2025-02-25

Perplexity'ye de eklenmiş.
Ama görünüşe göre henüz muhakeme özelliği kullanılamıyor..

bearmett 2025-02-25

Claude Code'u kurup kullanmayı denedim; videodaki gibi iki projenin genel özetini sordum.

Total cost: $0.1151
Total cost: $0.0855

Yaklaşık 0.2 dolar tutuyor gibi..?

Videodaki örneğin 45 dakikadan uzun süren bir iş olduğunu varsayarsak, epey pahalı bir iş olmuş olurdu.

riskatcher 2025-02-25

Aşırı pahalı, fiyat/performans vermiyor. Gerçek kullanımda o3-mini’nin daha iyi bir seçenek olduğu bile düşünülebilir ama kodlama için kullanacaksanız, çıkarım aşamasının kısa olması ve ara token sorununu çözmesi gerektiğinden, o amaç açısından bakıldığında en iyisi gibi görünüyor. Fiyatı da..

humblebee 2025-02-25

Genişletilmiş düşünme modu (Thinking Mode - Extended)

Modelin, yanıt vermeden önce iç değerlendirme yoluyla daha derin düşünmesini sağlayan özellik
Matematik, fizik, komut takibi, kodlama gibi çeşitli görevlerde performans artışı
API kullanıcıları, modelin düşünme süresini en fazla 128K tokena kadar kontrol edebiliyor
Hız (maliyet) ile yanıt kalitesi arasındaki dengeyi ayarlamaya olanak tanıyan esneklik sunuyor
İnsanların hızlı tepki ile derin düşünmeyi aynı beyinle yürütmesi gibi, ayrı bir model olmadan tek bir modelde iki mod sunuyor

Bunun, OpenAI'nin o1'i ya da DeepSeek'in R1'i gibi ayrı akıl yürütme modellerinden farklı bir yaklaşım seçtiği görülüyor. Tek bir model içinde iki modu entegre etmiş gibi görünüyor.

Ek olarak, modele eğitim verisi kesim tarihini doğrudan sorduğumda 2024 Ekim sonu diye yanıt veriyor~!

Anthropic, Claude 3.7 Sonnet’i piyasaya sürdü

İlgili okumalar

5 yorum