Anthropic, Claude 2.1'i yayınladı

(anthropic.com)

2 puan yazan GN⁺ 2023-11-22 | 1 yorum | WhatsApp'ta paylaş

Claude 2.1 API üzerinden kullanılabiliyor ve claude.ai sohbet deneyimini sunuyor.
200K token bağlam penceresi, model halüsinasyonlarında azalma, sistem prompt'ları ve yeni beta özellik olan araç kullanımı öne çıkan özellikler arasında yer alıyor.
Müşterilerin maliyet verimliliğini artırmak için fiyatlandırma politikasında güncelleme planlanıyor.

200K bağlam penceresi

Claude kullanıcıları, daha büyük bir bağlam penceresi ve uzun belgelerle çalışırken daha doğru çıktılar talep ediyor.
200.000 token ile Claude'a yaklaşık 150.000 kelime veya 500 sayfadan fazla materyal verilebiliyor.
Claude, büyük ölçekli içerik veya verilerle etkileşime girerek özetleme, Soru-Cevap, trend tahmini ve çoklu belge karşılaştırması gibi çeşitli görevleri yerine getirebiliyor.

Halüsinasyon oranı 2 kat azaldı

Claude 2.1, dürüstlüğü artırmak için yanlış ifade üretme oranını 2 kat azaltıyor.
Şirketler, daha fazla güven ve güvenilirlikle yapay zeka uygulamaları geliştirip bunları operasyonlarına dağıtabiliyor.
Claude 2.1, anlama ve özetleme yeteneklerinde iyileşme gösteriyor; özellikle doğruluğun kritik olduğu uzun ve karmaşık belgelerde performansı artıyor.

API Tool Use

Kullanıcının mevcut süreçleri, ürünleri ve API'leriyle entegre olabilen yeni beta özellik "Tool Use" ekleniyor.
Claude, geliştiricinin tanımladığı fonksiyonları veya API'leri koordine edebiliyor, web kaynaklarında arama yapabiliyor ve özel bilgi tabanlarından bilgi çekebiliyor.
Tool Use erken geliştirme aşamasında ve geliştirici özellikleriyle prompt yönergeleri oluşturuluyor.

Geliştirici deneyimi

Claude API kullanıcıları için geliştirici konsolu deneyimi sadeleştiriliyor ve yeni prompt'ları test etmek kolaylaştırılıyor.
Yeni Workbench ürünü sayesinde geliştiriciler prompt'ları yineleyebiliyor ve Claude'un davranışını optimize etmek için model ayarlarına erişebiliyor.
Sistem prompt'ları sunularak kullanıcıların Claude'a özelleştirilmiş talimatlar verebilmesi sağlanıyor.

GN⁺ görüşü

Claude 2.1'in en önemli özellikleri 200K token bağlam penceresi ve halüsinasyon oranındaki azalma; bu da kullanıcıların daha büyük belge ve verileri işleyip daha güvenilir sonuçlar almasını sağlıyor.
Bu özellikler yapay zeka teknolojisindeki ilerlemeyi gösteriyor ve şirketler ile geliştiricilere daha verimli ve daha doğru araçlar sunarak çalışma biçimlerini dönüştürme potansiyeli taşıyor.
Bu yazı, yapay zeka teknolojisindeki son eğilimler ve geliştiricilerin kullanabileceği yeni araçlar hakkında ilgi çekici bilgiler sunarak teknolojiye ilgi duyanlar için cazip bir içerik oluşturuyor.

1 yorum

GN⁺ 2023-11-22

Hacker News görüşleri

200k bağlamın tatlı-acı yanı: 70k'dan 195k'ya çıkıldığında hata oranının keskin biçimde artması hayal kırıklığı yaratıyor. Ancak orta kısımlardaki hataların azalması övgüyü hak ediyor.
Modelin sınırlı kullanımına dair memnuniyetsizlik: Claude'un başlıkta iddia ettiği kadar az reddetmediği görülüyor. Anthropic modeli aşırı sansürlediği için kullanması zor. Aracı kullanıcı belirlemeli; araç kullanıcıyı belirlememeli.
Başlık ile içerik arasındaki uyumsuzluk eleştirisi: Duyuruda sözü edilen "retlerde azalma" ifadesi, gerçek içerikle örtüşmüyor. Claude 2.1'in yanlış bilgi vermektense daha çok reddetmeye meyilli hale geldiğini düşündürüyor.
Kodlama tarafındaki verimsizlik: GPT-4'e kıyasla 10 kat daha kötü. Basit bir veritabanı senkronizasyon fonksiyonu istendiğinde, gerçek kod yerine çoğunlukla sözde kod veriyor.
Modele dair olumsuz izlenim: Anthropic'in modeli, çoğu isteği reddedecek şekilde aşırı eğitilmiş görünüyor; bu yüzden Claude ile konuşmak keyifli değil.
İdeolojik bakış açısından ret örneği: Etkili bir altruist gibi konuşmak için kelime listesi istemenin reddedilmesi, mizahi bir durum yaratmış.
Claude 2'ye dair hayal kırıklığı: Başta umut vericiydi, ancak GPT-4'ün çok gerisinde kaldığı düşünülüyor; bağlam penceresi büyük olsa bile yanıt kalitesi düşükse bunun pek anlamı yok.
API kullanımında erişilebilirlik sorunu: API'yi kullanmakla ilgileniliyor, ancak yanıt alınamadığı için hayal kırıklığı yaşanmış. Geliştirici platformu olarak ilginin düşük olduğu hissediliyor.
API erişiminin zorluğu: Anthropic'in web sitesi ya da Bedrock üzerinden yapılan başvurulara yanıt alınamadığı için, bir işletme olarak API erişimi mümkün değilmiş gibi görünüyor.
Sistem prompt'u eklenmesine ilgi: Kullanıcının Claude'a özelleştirilmiş talimatlar vererek performansı artırabilmesini sağlayan sistem prompt'u özelliği dikkat çekiyor. Kullanımının ve kötüye kullanımının ne kadar kolay olacağı merak ediliyor.
Claude'un test amaçlı kullanımı ve OpenAI tercihi: Henüz prodüksiyonda kullanılmasa da, LLM ile yeni özellikler geliştirirken düzenli olarak testlere dahil ediliyor. OpenAI daha hızlı onay alıp pazara çıktı; API'si daha iyi, daha güvenilir ve daha ucuz. Ancak Claude'un AWS Bedrock'a dahil edilmesi, daha önce mümkün olmayan şeyleri mümkün kılıyor.

Anthropic, Claude 2.1'i yayınladı

200K bağlam penceresi

Halüsinasyon oranı 2 kat azaldı

API Tool Use

Geliştirici deneyimi

GN⁺ görüşü

İlgili okumalar

1 yorum

Hacker News görüşleri