2 puan yazan GN⁺ 2023-11-22 | 1 yorum | WhatsApp'ta paylaş
  • Claude 2.1 API üzerinden kullanılabiliyor ve claude.ai sohbet deneyimini sunuyor.
  • 200K token bağlam penceresi, model halüsinasyonlarında azalma, sistem prompt'ları ve yeni beta özellik olan araç kullanımı öne çıkan özellikler arasında yer alıyor.
  • Müşterilerin maliyet verimliliğini artırmak için fiyatlandırma politikasında güncelleme planlanıyor.

200K bağlam penceresi

  • Claude kullanıcıları, daha büyük bir bağlam penceresi ve uzun belgelerle çalışırken daha doğru çıktılar talep ediyor.
  • 200.000 token ile Claude'a yaklaşık 150.000 kelime veya 500 sayfadan fazla materyal verilebiliyor.
  • Claude, büyük ölçekli içerik veya verilerle etkileşime girerek özetleme, Soru-Cevap, trend tahmini ve çoklu belge karşılaştırması gibi çeşitli görevleri yerine getirebiliyor.

Halüsinasyon oranı 2 kat azaldı

  • Claude 2.1, dürüstlüğü artırmak için yanlış ifade üretme oranını 2 kat azaltıyor.
  • Şirketler, daha fazla güven ve güvenilirlikle yapay zeka uygulamaları geliştirip bunları operasyonlarına dağıtabiliyor.
  • Claude 2.1, anlama ve özetleme yeteneklerinde iyileşme gösteriyor; özellikle doğruluğun kritik olduğu uzun ve karmaşık belgelerde performansı artıyor.

API Tool Use

  • Kullanıcının mevcut süreçleri, ürünleri ve API'leriyle entegre olabilen yeni beta özellik "Tool Use" ekleniyor.
  • Claude, geliştiricinin tanımladığı fonksiyonları veya API'leri koordine edebiliyor, web kaynaklarında arama yapabiliyor ve özel bilgi tabanlarından bilgi çekebiliyor.
  • Tool Use erken geliştirme aşamasında ve geliştirici özellikleriyle prompt yönergeleri oluşturuluyor.

Geliştirici deneyimi

  • Claude API kullanıcıları için geliştirici konsolu deneyimi sadeleştiriliyor ve yeni prompt'ları test etmek kolaylaştırılıyor.
  • Yeni Workbench ürünü sayesinde geliştiriciler prompt'ları yineleyebiliyor ve Claude'un davranışını optimize etmek için model ayarlarına erişebiliyor.
  • Sistem prompt'ları sunularak kullanıcıların Claude'a özelleştirilmiş talimatlar verebilmesi sağlanıyor.

GN⁺ görüşü

  • Claude 2.1'in en önemli özellikleri 200K token bağlam penceresi ve halüsinasyon oranındaki azalma; bu da kullanıcıların daha büyük belge ve verileri işleyip daha güvenilir sonuçlar almasını sağlıyor.
  • Bu özellikler yapay zeka teknolojisindeki ilerlemeyi gösteriyor ve şirketler ile geliştiricilere daha verimli ve daha doğru araçlar sunarak çalışma biçimlerini dönüştürme potansiyeli taşıyor.
  • Bu yazı, yapay zeka teknolojisindeki son eğilimler ve geliştiricilerin kullanabileceği yeni araçlar hakkında ilgi çekici bilgiler sunarak teknolojiye ilgi duyanlar için cazip bir içerik oluşturuyor.

1 yorum

 
GN⁺ 2023-11-22
Hacker News görüşleri
  • 200k bağlamın tatlı-acı yanı: 70k'dan 195k'ya çıkıldığında hata oranının keskin biçimde artması hayal kırıklığı yaratıyor. Ancak orta kısımlardaki hataların azalması övgüyü hak ediyor.
  • Modelin sınırlı kullanımına dair memnuniyetsizlik: Claude'un başlıkta iddia ettiği kadar az reddetmediği görülüyor. Anthropic modeli aşırı sansürlediği için kullanması zor. Aracı kullanıcı belirlemeli; araç kullanıcıyı belirlememeli.
  • Başlık ile içerik arasındaki uyumsuzluk eleştirisi: Duyuruda sözü edilen "retlerde azalma" ifadesi, gerçek içerikle örtüşmüyor. Claude 2.1'in yanlış bilgi vermektense daha çok reddetmeye meyilli hale geldiğini düşündürüyor.
  • Kodlama tarafındaki verimsizlik: GPT-4'e kıyasla 10 kat daha kötü. Basit bir veritabanı senkronizasyon fonksiyonu istendiğinde, gerçek kod yerine çoğunlukla sözde kod veriyor.
  • Modele dair olumsuz izlenim: Anthropic'in modeli, çoğu isteği reddedecek şekilde aşırı eğitilmiş görünüyor; bu yüzden Claude ile konuşmak keyifli değil.
  • İdeolojik bakış açısından ret örneği: Etkili bir altruist gibi konuşmak için kelime listesi istemenin reddedilmesi, mizahi bir durum yaratmış.
  • Claude 2'ye dair hayal kırıklığı: Başta umut vericiydi, ancak GPT-4'ün çok gerisinde kaldığı düşünülüyor; bağlam penceresi büyük olsa bile yanıt kalitesi düşükse bunun pek anlamı yok.
  • API kullanımında erişilebilirlik sorunu: API'yi kullanmakla ilgileniliyor, ancak yanıt alınamadığı için hayal kırıklığı yaşanmış. Geliştirici platformu olarak ilginin düşük olduğu hissediliyor.
  • API erişiminin zorluğu: Anthropic'in web sitesi ya da Bedrock üzerinden yapılan başvurulara yanıt alınamadığı için, bir işletme olarak API erişimi mümkün değilmiş gibi görünüyor.
  • Sistem prompt'u eklenmesine ilgi: Kullanıcının Claude'a özelleştirilmiş talimatlar vererek performansı artırabilmesini sağlayan sistem prompt'u özelliği dikkat çekiyor. Kullanımının ve kötüye kullanımının ne kadar kolay olacağı merak ediliyor.
  • Claude'un test amaçlı kullanımı ve OpenAI tercihi: Henüz prodüksiyonda kullanılmasa da, LLM ile yeni özellikler geliştirirken düzenli olarak testlere dahil ediliyor. OpenAI daha hızlı onay alıp pazara çıktı; API'si daha iyi, daha güvenilir ve daha ucuz. Ancak Claude'un AWS Bedrock'a dahil edilmesi, daha önce mümkün olmayan şeyleri mümkün kılıyor.