1 puan yazan GN⁺ 4 시간 전 | 4 yorum | WhatsApp'ta paylaş
  • Anthropic, ABD hükümetiyle yapılan görüşmelerin ardından Fable 5 siber güvenlik korumalarını güncelledi; çoğu kodlama görevi ise olduğu gibi kullanılabiliyor
  • Yeni korumalar kısa vadede önceki Fable korumalarına kıyasla zararsız istekleri daha sık işaretleyebilir; Anthropic bunu önümüzdeki birkaç hafta içinde ayarlamayı planlıyor
  • Bir istek işaretlenirse kullanıcıya bildirim gösteriliyor ve ilgili yanıt bunun yerine Opus 4.8 ile sağlanıyor
  • Biyoloji·kimya sınıflandırıcısı ilk sürümdekiyle aynı olduğundan, temel biyolojiye yakın sorular bile Opus 4.8 fallback ile sonuçlanabiliyor
  • Kullanım hakkı içeren ücretli planlar 7 Temmuz'a kadar Fable 5'i haftalık kullanım limitinin %50'sine kadar kullanabilecek; sonrasında diğer modellere veya kullanım kredilerine (usage credits) başvurmak gerekecek

Fable 5 erişiminin yeniden açılması ve korumaların ayarlanması

  • Anthropic, ABD hükümetiyle yapılan görüşmelerin ardından siber güvenlik korumalarını güncelledi
  • Çoğu kodlama görevi bu değişiklikten etkilenmiyor
  • Kısa vadede yeni korumalar, önceki Fable korumalarına göre zararsız istekleri biraz daha fazla işaretleyebilir
    • Anthropic önümüzdeki birkaç hafta boyunca sınıflandırıcıyı iyileştirmeyi planlıyor
    • İşaretlenen istekler kullanıcıya açıkça bildiriliyor
    • İlgili yanıtlar Opus 4.8 üzerinden veriliyor

Biyoloji·kimya sınıflandırıcısının mevcut sınırlamaları

  • Biyoloji ve kimya sınıflandırıcısı ilk sürümdekiyle aynı
    • Mevcut sınıflandırıcı istenenden daha geniş kapsamda çalışıyor
    • Temel biyolojiye yakın sorularda bile Opus 4.8 fallback yaşanabiliyor
    • Bu sınıflandırıcıya yönelik iyileştirmelerin yakında uygulanması planlanıyor

Ücretli plan kullanım koşulları ve geri bildirim kanalları

  • Kullanım hakkı içeren tüm ücretli planlar 7 Temmuz'a kadar Fable 5'e erişebiliyor
  • Fable 5, haftalık kullanım limitinin en fazla %50'sine kadar kullanılabiliyor
    • Sonrasında kalan kullanım için diğer modellere geçiş yapılabiliyor
    • Kullanım kredileriyle Fable kullanılmaya devam edilebiliyor
  • Promosyon erişim duyurusu: Claude Fable 5 promotional access
  • Claude Code'da bir istek yanlış şekilde işaretlenirse /feedback ile bildirilebiliyor
  • Claude.ai ve Cowork'te thumbs düğmesi ile geri bildirim paylaşılabiliyor
    • Bu geri bildirimler sınıflandırıcının ayarlanması ve yanlış pozitiflerin azaltılması için kullanılıyor
  • Fable 5 blog yazısı: Claude Fable 5 Mythos 5

4 yorum

 
seoseonyu 1 시간 전

7 Temmuz... galiba sadece 5.6 Sol için sabırla beklemem gerekecek

 
treestae 17 분 전

Ben de Sol’u bekliyorum.
Galaxy ya da Cosmos da çıkar herhâlde...

 
GN⁺ 4 시간 전
Hacker News yorumları
  • Fable/Mythos ağırlıklarının, kötü niyetli olsun ya da olmasın, tek bir hatayla düşman güçlerin eline geçebileceğini veya rastgele bir torrente yüklenebileceğini düşünüyorum.
    Fable ağırlıklarının yüzlerce veri merkezine dağıtılması ve binlerce kişinin doğrudan ya da dolaylı olarak bunların bir kısmına veya tamamına erişim hakkı olması muhtemel. Gerçekten dünya sonu düzeyinde bir model olsaydı böyle ele alınacağını sanmıyorum; Mythos içinse yalnızca devlet düzenlemelerine uyumlu veri merkezlerinde çalıştırıldığına inanabilirim. Ama o kadar değerli bir modelse, devlet destekli hackerlar onu ele geçirmek için çok daha büyük çaba harcayacaktır. Gerçek durum ne olursa olsun, Anthropic’in söylediği kadar çığır açıcı olduğunu düşünmek zor.

    • GPT-2’den beri modellerin çok tehlikeli olduğu söylenip duruyor.
      Bir noktadan sonra insan, çobanın “kurt geliyor” diye bağırmayı bırakmasını istemenin ötesine geçip, keşke kurt tarafından yenilse diye düşünmeye başlıyor.
    • Mythos’un bir şekilde sızıp tüm insanlığın self-host olarak kullanabilmesi uzun vadede en iyi sonuç bile olabilir.
    • Düşündüğümüzden daha karmaşık olabilir. Bildiğim kadarıyla Nvidia pahalı ürün serilerinde TEE sunuyor; bu yüzden ağırlıkların şifreli halde kullanılması muhtemel.
      Bu, sızdırmanın imkânsız olduğu anlamına gelmez ama işi epey büyütür. Anthropic’in Elon tarafında modelin servis edilmesinden çok endişe etmemesinin nedeni de bu olabilir. Kabaca akış, Nvidia TEE ile el sıkışmak, anahtarı enjekte etmek ve ardından şifreli ağırlıkları yüklemek şeklinde olur. Çalınmış ağırlıklarla Nvidia ekipmanının sürekli çalıştırılmasını engellemek için, heartbeat sinyali olmazsa süresi dolan bir zamanlayıcı da bulunması muhtemel.
    • Anthropic’in gerçekten dünya sonu düzeyinde olduğunu iddia ettiğini sanmıyorum. Daha çok ofansif siber güvenlik kabiliyetleri olduğu için riskli olabileceği yönünde görünüyor.
    • Bence hepsi pazarlama. Devlet sürekli olarak içeriden işlem yapan biri gibi davrandığını gösterdi.
  • İnsan bilinciyle ilgili bir kitap taslağı yükledim, engellendi. Bu model gülünç derecede kötü ve Anthropic onu kötü niyetli hissettirecek kadar etkisizleştirmiş.
    Fiilen işe yaramayan bir şeye para ödemeyi düşünmüyorum.

    • Bugün Sonnet’ten tarayıcı MCP’sini kullanarak üzerinde çalıştığım projenin kullanıcı adı ve şifresini girmesini istedim; bunun güvenlik protokolü ihlali olduğu için yapamayacağını söyledi.
      Eskiden sorunsuz yapıyordu. Claude’u sevdiğim için Codex’in daha iyi olduğu söylense de kullanmaya devam ettim ama bu gerçekten son sınırıma çok yaklaştı. Ayda 200 dolardan fazla ödüyorum, sözleşmeli işlerimde de öne çıkarıyorum; buna rağmen temel saygısı olan bir hizmet bile sunamamaları tamamen saçma. 6 ay sonra yalnızca Easy-Bake tariflerinden bahsetmeye izin verecekler, biri ampule değip yanarsa konuyu kır çiçekleri çayırlarına indirgerler herhalde.
    • Aynı sorun. Dil ve termodinamik üzerine yazdığım kitap da engellendi. Sınıflandırıcı sanki sadece regex gibi.
    • Zamanlama özellikle garip. Çünkü bu modelin güçlü yanı olarak uzun görev kapsamı, sebatı ve büyük işleri otonom biçimde ileri götürme yeteneği pazarlanmıştı.
      Ama yolun ortasında Opus 4.8’e geri dönebiliyorsa ya da her an kesilebiliyorsa bu yeteneğe güvenmek zor. Bu tür uzun süreçleri çalıştırınca epey sağlam ilerliyor; sonra bir şey başarısızlık olarak sınıflandırıldığı anda “uzun görev” ölüyor ve bir insanın onu kurtarması ya da zorla geri alıp yeniden denemesi gerekiyor.
    • Daha ilk isteğim engellendi. Partnerim web sitesinin frontend’inde gördüğü hata notlarını, ürün metni düzeltmelerini, CSS hatalarını ve ifade sorunlarını okumasını istemişti; hemen engellendi. İşe yaramaz.
    • Bu kez böyle yapmak zorunda kalmış gibi görünüyor. Dün sınıflandırıcı için güvenlik marjını genişletme yazısına bakın.
  • Fable yokken yalnızca Opus’un da yeterli olduğunu hissettim. Şimdi geri döndü ama hiç özlemedim.

  • Bu gece kullanacağım ama içimden gelmiyor. Çünkü 7 Temmuz’dan sonra, şu ana kadar abonelikle çok daha büyük değer elde ederken birden API fiyatı ödemek istemiyorum.
    Belki de bu, bu yıl herkesin başına gelen “token ekonomisi”dir. Her hâlükârda kullanabiliyorken olabildiğince suyunu çıkarıp, sonrasında güvenilir ortaklarım Opus 4.6 ve Sonnet 4.6’ya dönmeyi düşünüyorum. Ne zamana kadar sunulurlar bilmiyorum ama.

    • Böyle kullanırsan kotayı hemen tüketip sonunda yine API fiyatı ödemek zorunda kalmayacak mısın?
    • 7 Temmuz’dan sonra Max 350 planının geleceğinden neredeyse eminim.
    • Performans düşüşü başlamaya yakın varsayılan modeli Opus 4.6’ya sabitledim. 4.7 ve üzerindekilerden çok daha iyi sonuç veriyor.
      Hizmetin kötüleşmesi denen şey bu olsa gerek.
  • ABD merkezli modellere yönelik güven kaybının toparlanması zor görünüyor.
    Anthropic’in abartılı kıyamet mesajları ve bundan etkilenen yönetim yüzünden güven büyük ölçüde aşındı; hatta bir tür silahlanma yarışını bile tetikledi.

    • Tersine, “ürünümüz yasaklanacak kadar iyiydi” mümkün olan en iyi reklamdır. OpenAI böyle bir durumu elde etmek için ortalığı birbirine katardı.
      Sonnet 5’i hemen denemek istemiyorum ama Fable ilgimi epey çekiyor.
    • OpenAI ve Çinli şirketlerin gereken rekabeti getirmesini umuyorum.
    • Yapay zeka tabanlı bir ürün geliştirdiyseniz tedarikçileri çeşitlendirmeli ya da bir soyutlama katmanı kurarak modele bağımlı olmamalısınız. Herhangi bir modeli takıp kullanabilmelisiniz.
      Son kullanıcı olan bir yazılım mühendisiyseniz Gemini veya ChatGPT gibi başka modelleri kullanabilirsiniz. Zaten var olmayan bir güven hakkında şikâyet etmektense bu daha üretken. Anthropic yalnızca hizmet sağlayan bir şirket ve ihracat yasağı olsun olmasın, hizmeti istediği an durdurabilir. Her ülkedeki her yapay zeka şirketi için de aynı şey geçerli. Gerçekten güvenilir bir LLM istiyorsanız açık ağırlıklı modeli kendiniz çalıştırmalısınız.
    • Tersine Anthropic şimdi olduğu gibi iletişim kurmasaydı ve Fable Pentagon’u hacklemek için kullanılsaydı ne olurdu? Dario’yu ağaca asarlardı.
    • Kullanıcıların büyük çoğunluğu böyle bir şey yaşandığından tamamen habersiz olabilir. Burada, HN içinde yaşayan bizlerin bir balonun içinde olduğunu unutuyoruz. Şirket bunu başarı olarak paketleyip yoluna devam edecek.
  • Bazı projelerde tüm kodu ürettirmek yerine, planı ve test/biçim doğrulama döngüsünü ürettirmek daha faydalı olabilir
    Bu çıktılar tüm projeye kıyasla çok daha az token kullanır; sonraki döngü de eski modellerle çalıştırılabilir

    • Bugün iki depo üzerinde yürüyen bir projede bunu denedim. Zaten ana kullanım senaryolarından biri için tasarımı belirlemiştim; Claude’un bundan çok da farklı olmayan bir üst küme oluşturması gereken bir işti
      Planı oluşturduktan sonra Fable 5’in 5 saatlik bağlamının yalnızca yaklaşık %10’u kalmıştı; bugün yaptığım işin tamamı da buydu. Elbette genellemek zor
    • Doğru. Opus’a planı yazdırıp uygulamayı yapması için birkaç Sonnet alt ajanı çalıştırıyorum. Daha ucuz ve hızlı
    • Devin Fusion’ın hedefi tam da bu; şu ana kadarki sonuçlar oldukça iyi görünüyor
      https://cognition.com/blog/devin-fusion
    • Toplu işlemeyi deneyen var mı merak ediyorum. https://claude.com/pricing#api sayfasına göre Batch Processing kullanınca fiyat %50 düşüyor
      OpenCode/Pi gibi yürütme araçlarının bunu planlama gibi işler için kullanmasını sağlayabilir miyiz merak ediyorum
    • opusplan’in fikri bu
      https://code.claude.com/docs/en/model-config#opusplan-model-...
  • Claude Pro’yu ara sıra kullanıyorum, ama mesaj kafa karıştırıcı. Belki de çok bariz bir şeyi kaçırıyorum
    “7 Temmuz’a kadar planınızın haftalık kullanım limitinin en fazla %50’sini Fable 5’te kullanabilirsiniz” ifadesi, aboneliğimde Fable’ı kullanabilmemin süreli bir promosyon olduğu anlamına mı geliyor? Aboneysem modeli neden doğrudan kullanamıyorum? Bundan sonra abonelikler yalnızca eski modelleri mi sunacak, yeni modeller için ek ödeme mi gerekecek?

    • Evet
      Şöyle yazıyor: “7 Temmuz 2026’dan sonra Claude Fable 5 artık planınızın haftalık kullanım limitine dahil olmayacaktır. Claude Fable 5, kullanım kredileriyle kullanılmaya devam edebilir; planınıza dahil kullanımın ötesinde ödeme yapabilirsiniz.” Uzun vadede bunun ne anlama geldiğini bilmiyorum. Daha güçlü bir model çıkarsa ya da Anthropic’in hesaplama kapasitesi artarsa Fable 5 tekrar aboneliğe dahil edilebilir; ya da bu aboneliğin kaldırılmasının başlangıcı olabilir. Diğer sağlayıcılar sürekli daha iyi modeller çıkarırken Opus 4.8’e bağlı kalan bir aboneliğe para ödemek pek mantıklı değil
    • Uzun da sürmedi
      Dynamic workflow “Multi-lens review of docs/membership-and-friends-model.md with adversarial verification” completed · 25m 59s
      Fable 5 limitine ulaştım
      Bu hafta dahil olan Fable 5 kullanımının tamamını kullandığımı, Fable 5’i kullanmaya devam etmek için kullanım kredileri gerektiğini söylüyor
    • İlk çıkışta, sınırlı bir süre için Fable 5’in aboneliğin bir parçası olarak kullanılabileceği, sonrasında kullanım kredileri gerekeceği söylenmişti
      O zaman, bir gün tekrar abonelik planlarının parçası yapmak istediklerini de söylemişlerdi. Bu dönüşte kullanım süresini 7 Temmuz’a kadar uzattılar ama kullanım limitinin %50’siyle sınırladılar; bir gün kalıcı olarak abonelik planına koymak istediklerini tekrar söylemediler. Hâlâ umut var, ama kesinlikle iyi yöne gidiyor gibi görünmüyor
    • Abonelikte de yeni modellere erişim devam edecektir. Sonnet 5’e erişebilecek olmalısınız; o yeni bir model. Sadece Mythos seviyesindeki modeller yalnızca API’ye özel
      Şimdilik durum bu; bu şirketlerin ne zaman değişeceği belli olmaz
    • Fable’ın çalıştırma maliyeti daha yüksek ve henüz pazara giriş stratejilerini netleştirmemiş gibiler
      İnsanların gerçekten ne kadar kullandığını görüp Max/Pro planlarında bunu sübvanse etmeye devam etmeye değer mi, yoksa bunun üstüne ek bir kademe mi oluşturmak gerekir, onu anlamaya çalışıyorlar gibi
  • “Claude Fable 5 bir isteği reddederse Messages API hata değil, başarılı bir HTTP 200 yanıtıyla stop_reason: "refusal" döndürür”
    “Başarı” deyince aklıma gelen şey tam olarak bu

    • HTTP 451 durum kodunu kullanma fırsatını kaçırmışlar
      https://en.wikipedia.org/wiki/HTTP_451
    • Reddin akış sırasında, durum kodu ve başlıklar zaten alındıktan sonra da gerçekleşip gerçekleşemeyeceğini merak ediyorum. API’ye bakmadım
  • Claude Code terminalinde “7 Temmuz’a kadar planınızın haftalık kullanım limitinin en fazla %50’sini Fable 5’te kullanabilirsiniz; limite ulaşırsanız kullanım kredileriyle devam edebilirsiniz; Fable 5, Opus 4.8’e göre kullanımı daha hızlı tüketir” yazıyor
    Bu %50 kuralı eskiden yoktu sanki?

    • Opus 4.8, GPT 5.5’e kıyasla o kadar yavaş ki biraz daha iyi olsa bile günlük mühendislik işleri için anlamlı değil
      Yakında GPT 5.6 çıkacak; Codex’in aylık 249 dolarlık planı şimdiye kadar çok cömertti. Fable 5’in yeni maliyeti olduğu tahmin edilen tutarı ödemem için, daha önce denediğimi hatırladığımdan çok daha iyi olması gerekir
    • Kullanımı da sıfırlamamışlar. İyi şanslar
    • 7 Temmuz’dan sonra yalnızca kullanıma dayalı model kalıyor. Artık abonelik kademelerine dahil olmayacak
      Keşke tekrar eklemeselerdi bile diyebilirim. Eskisi gibi yoğun kullanırsanız maliyet fiilen 20x abonelik fiyatından bile 10–20 kat daha pahalı oluyor
    • Eskiden yoktu
  • Fable erişimini abonelik planlarına tekrar koymayı yeniden değerlendirmelerini isterim. En azından 20x planına dahil edilmesi gerektiğini düşünüyorum
    İlk yaklaşık 14 günlük dönem duyurulduğunda asıl niyetin bu olduğunu ve abonelik planlarında tutmak için çalıştıklarını sanıyordum. Ama artık bunun hâlâ tartışılıp tartışılmadığı bile söylenmiyor

    • Piyasa sonunda tekrar eklemelerini sağlayacaktır. Şu anda kapasite kısıtları olabilir ya da aboneliğe uydurmak için başka bir fiyat kademesi gerekip gerekmediğini değerlendiriyor olabilirler
      İstenmeyen senaryo, birinin haftada 4 gün kod yazıp her hafta limiti sonuna kadar doldurması gibi görünüyor
    • Yalnızca gelecek haftaya kadar dahil
      “Fable 5, 7 Temmuz’a kadar haftalık kullanım limitinin en fazla %50’sine kadar dahildir; sonrasında kullanım kredileriyle kullanılabilir” deniyor
 
runai 2 시간 전

Krediyle bunu kim kullanabilir ki? Ayda birkaç milyon wonu aşabilir, değil mi? Onun yerine GPT'nin sonraki 5.6 sürümünü kullanırım daha iyi.