Claude 3.5 Sonnet yayınlandı: GPT-4o’yu geride bırakan performans

(anthropic.com)

15 puan yazan brainer 2024-06-21 | 1 yorum | WhatsApp'ta paylaş

Anthropic bugün Claude 3.5 Sonnet’i duyurdu. Bu, yakında çıkacak Claude 3.5 model ailesinin ilk sürümü ve mevcut Claude 3 Opus ile rakip modellere kıyasla daha yüksek performans sunuyor. Claude 3.5 Sonnet, orta seviye model olan Claude 3 Sonnet ile aynı hız ve maliyetle sunuluyor.

Sunum şekli

Claude 3.5 Sonnet, Claude.ai ve Claude iOS uygulamasında ücretsiz olarak kullanılabiliyor; Claude Pro ve Team planı aboneleri ise daha yüksek istek limitleriyle erişebiliyor. Ayrıca Anthropic API, Amazon Bedrock ve Google Cloud’un Vertex AI hizmeti üzerinden de kullanılabiliyor. Fiyatlandırma, milyon giriş tokenı başına 3 dolar ve milyon çıkış tokenı başına 15 dolar; ayrıca 200K token bağlam penceresi sunuyor.

Performans artışı

Claude 3.5 Sonnet, lisansüstü düzey muhakeme (GPQA), lisans düzeyi bilgi (MMLU) ve kodlama yeteneği (HumanEval) alanlarında yeni bir ölçüt belirledi. Mizahı ve karmaşık yönergeleri anlama becerisi önemli ölçüde gelişti; doğal ve empatik bir tonla yüksek kaliteli içerik üretebiliyor.

İç değerlendirme sonuçları

İç kodlama değerlendirmesinde Claude 3.5 Sonnet, sorunların %64’ünü çözerek Claude 3 Opus’un %38’lik sonucunu geride bıraktı. Bu değerlendirme, doğal dil açıklamalarına dayanarak açık kaynak kod tabanlarındaki hataları düzeltme veya yeni özellik ekleme becerisini test etti. Claude 3.5 Sonnet, kod çevirisini kolaylıkla işleyerek özellikle legacy uygulamaları güncelleme ve kod tabanı migrasyonu süreçlerinde etkili oluyor.

Görsel yetenekler

Claude 3.5 Sonnet, standart görsel benchmark’larda Claude 3 Opus’u geride bırakıyor ve görsel muhakeme gerektiren görevlerde öne çıkan performans sergiliyor. Eksik veya kusurlu görüntülerden metni doğru biçimde aktarma becerisi; perakende, lojistik ve finansal hizmetler alanlarında oldukça faydalı.

Artifacts özelliğinin tanıtımı

Bugün Claude.ai’ye eklenen Artifacts, kullanıcı tarafından üretilen kod parçacıkları, metin belgeleri ve web sitesi tasarımları gibi içeriklerin gerçek zamanlı olarak düzenlenip projelere ve iş akışlarına entegre edilebildiği dinamik bir çalışma alanı sunuyor.

Güvenlik ve gizlilik

Claude 3.5 Sonnet, ASL-2 seviyesinde sıkı testlerden geçti ve Birleşik Krallık Yapay Zeka Güvenlik Enstitüsü (UK AISI) ile iş birliği içinde dağıtım öncesi güvenlik değerlendirmesini tamamladı. Kullanıcı verileri, açık izin olmadan eğitim için kullanılmıyor.

Gelecek planları

Claude 3.5 model ailesini tamamlamak için bu yılın ilerleyen dönemlerinde Claude 3.5 Haiku ve Claude 3.5 Opus’un da yayınlanması planlanıyor. Şirket, kurumsal uygulama entegrasyonunu desteklemek için yeni özellikler ve modaliteler geliştiriyor; ayrıca kullanıcı tercihlerini ve etkileşim geçmişini hatırlayan bir “Memory” özelliğini de araştırıyor.

Claude’u sürekli geliştirmeye ve kullanıcı geri bildirimlerini yansıtarak daha iyi bir deneyim sunmaya devam ediyoruz. Claude 3.5 Sonnet hakkındaki geri bildirimler doğrudan ürün içinden gönderilerek geliştirme yol haritasına yansıtılabiliyor.

1 yorum

wedding 2024-06-21

Test ettim, hızı inanılmaz derecede yüksek.
gpt4o gibi belirli sayıda ücretsiz kullanılabilmesi de güzel.