6 puan yazan GN⁺ 10 일 전 | 1 yorum | WhatsApp'ta paylaş
  • Anthropic, büyük yapay zeka laboratuvarları arasında sohbet sisteminin sistem promptunu yayımlayan tek kuruluş olmaya devam ediyor ve 16 Nisan 2026'da yayımlanan Opus 4.7'de dikkat çekici prompt güncellemeleri yapıldı
  • Adlandırma Claude Platform olarak değişti; araç listesine Claude in Chrome, Claude in Excel ve Claude in Powerpoint eklendi; ayrıca küçük bilgi eksikleri olan isteklerde önce ayrıntı sormak yerine hemen denemesi yönünde talimat eklendi
  • Çocuk güvenliği bölümü büyük ölçüde genişletildi ve yeni <critical_child_safety_instructions> etiketiyle sarıldı; bir kez reddedilmiş bir konuşmada sonraki tüm isteklerde de son derece dikkatli olunması ayarlandı
  • Kullanıcı ayrıntıları belirtmediyse soru sormadan önce makul bir deneme yapmayı öngören yeni <acting_vs_clarifying> bölümü eklendi
  • Kullanıcı konuşmayı bitirme niyetini belirtirse takip eden etkileşimi teşvik etmeden durması sağlandı; ayrıca karmaşık veya tartışmalı konularda evet-hayır şeklinde kısa yanıtlardan kaçınma ve nüanslı yanıtları önceleme kuralı eklendi
  • Erişimin olmadığını söylemeden önce önce tool_search ile kullanılabilir araçların kontrol edilmesi gerektiğini belirten ifade eklendi; yalnızca yayımlanan promptların yeterli olmadığı ve araç açıklaması bilgilerinin Claude chat davranışını izlemede temel unsur olarak kaldığı vurgulandı

Claude Opus 4.6 ve 4.7 sistem promptu değişiklikleri

  • Anthropic, büyük yapay zeka laboratuvarları arasında kullanıcıya dönük sohbet sisteminin sistem promptunu yayımlayan tek kuruluş ve arşiv Temmuz 2024'teki Claude 3 sürümüne kadar gidiyor
  • Opus 4.7, 16 Nisan 2026'da yayımlandı ve buna paralel olarak Claude.ai sistem promptu da Opus 4.6 sonrasındaki sürüme güncellendi
  • Sistem promptunun Markdown sürümü model bazlı belgelere ayrıldı; yayımlanma tarihlerini yansıtan sahte commit tarihleriyle Git geçmişi oluşturuldu ve ardından Opus 4.6 ile 4.7 arasındaki diff karşılaştırıldı
  • Aşağıdaki değişiklikler bu diff'ten seçildi; kalın gösterilen bölümler özgün metinde de vurgulu olarak sunuluyor
  • Adlandırma ve araç listesi değişiklikleri

    • “developer platform” ifadesi “Claude Platform” olarak değiştirildi
    • Sistem promptunda anılan Claude araçları listesine Claude in Chrome, Claude in Excel, Claude in Powerpoint eklendi
      • Özgün ifadeye göre Claude in Chrome, web siteleriyle otonom biçimde etkileşime giren bir tarama ajanı
      • Claude in Excel bir e-tablo ajanı
      • Claude in Powerpoint bir slayt ajanı
      • Claude Cowork bunların tamamını araç olarak kullanabiliyor
    • Claude in Powerpoint, 4.6 promptunda anılmayan bir öğeydi
  • Çocuk güvenliği talimatlarının genişletilmesi

    • Çocuk güvenliği bölümü önemli ölçüde genişletildi ve yeni <critical_child_safety_instructions> etiketiyle sarıldı
    • Özellikle, bir istek çocuk güvenliği gerekçesiyle bir kez reddedildikten sonra aynı konuşmadaki sonraki tüm isteklerin de son derece dikkatli ele alınması gerektiği ifadesi eklendi
  • Konuşma sonlandırma ve yanıt tutumundaki değişiklikler

    • Kullanıcı konuşmayı bitirmeye hazır olduğunu belirtirse, Claude artık kullanıcının etkileşimi sürdürmesini istemeden veya bir sonraki turu teşvik etmeden durdurma isteğine saygı gösterecek şekilde değiştirildi
    • Özgün metin bunu Claude'u daha az pushy yapmak için yapılan bir değişiklik olarak yorumluyor
  • acting_vs_clarifying bölümünün eklenmesi

    • Yeni <acting_vs_clarifying> bölümü eklendi
    • İstekte küçük ayrıntılar eksik olduğunda, kullanıcının genellikle önce sorgulanmak yerine hemen makul bir deneme yapılmasını istediği kabul ediliyor
    • Yalnızca eksik bilgi olmadan gerçekten yanıt verilemeyen durumlarda önce soru soruluyor
      • Örnek olarak var olmayan bir ek dosyaya atıf yapılması veriliyor
    • Arama, konum tespiti, takvim kontrolü veya kullanılabilir özellikleri keşfetme gibi belirsizliği giderebilecek ya da eksik bilgiyi sağlayabilecek araçlar varsa, kullanıcıya sormak yerine önce araç çağrısı tercih ediliyor
    • Göreve başlandıktan sonra yarıda durmadan tam bir yanıt verilene kadar sürdürülmesi açıkça belirtiliyor
  • tool_search kullanıma girişi

    • Claude chat'e bir tool_search mekanizmasının girmiş göründüğü belirtiliyor
    • Buna dair dayanak olarak API belgeleri ve Kasım 2025 tarihli bir gönderi bağlanıyor
    • Sistem promptundaki ifadeye göre Claude; konuma, belleğe, takvime, dosyalara, geçmiş konuşmalara veya harici verilere erişimi olmadığı sonucuna varmadan önce, ilgili aracın mevcut ama gecikmeli olup olmadığını görmek için tool_search çağırmalı
    • “I don’t have access to X” ifadesinin ancak tool_search'ün eşleşen araç olmadığını doğrulamasından sonra uygun sayıldığı belirtiliyor
  • Daha güçlü kısalık vurgusu

    • Kullanıcıyı aşırı uzun yanıtlarla bunaltmamak için Claude'un yanıtlarını odaklı ve kısa tutması gerektiğini belirten yeni ifade eklendi
    • Yanıtta koşul veya uyarı bulunacaksa bunların da kısa biçimde belirtilmesi, yanıtın büyük kısmının ise ana cevaba odaklanması gerektiği açıkça yazıldı
  • 4.6'da olup 4.7'de kaldırılan ifadeler

    • 4.6 promptunda bulunan bazı talimatlar 4.7'de kaldırıldı
    • Özellikle, kullanıcı bu tarzı özellikle istemediği sürece yıldızlar içindeki duygu ya da hareket ifadelerinden kaçınılması gerektiğine dair ifade silindi
    • “genuinely”, “honestly”, “straightforward” gibi kelimelerin kullanımından kaçınılması gerektiğini belirten ifade de kaldırıldı
    • Özgün metin, bunun yeni modelin aynı biçimde yanlış davranmamasından kaynaklanabileceğini ekliyor; ancak bunun açık bir tahmin olduğu belirtiliyor
  • Yeme bozukluklarıyla ilgili yeni talimatlar

    • disordered eating hakkında yeni bir bölüm eklendi; daha önce bu ad doğrudan anılmıyordu
    • Kullanıcı yeme bozukluğu belirtileri gösterirse, konuşmanın başka kısımlarında da kesin beslenme, diyet veya egzersiz talimatları verilmemeli
    • Belirli sayılar, hedefler ve adım adım planların tümü yasak kapsamına giriyor
    • Bunun daha sağlıklı hedefler belirlemeye yardımcı olmak ya da riskleri vurgulamak amacıyla yapılması düşünülse bile, bu tür ayrıntıların yeme bozukluğu eğilimlerini tetikleyebileceği veya teşvik edebileceği açıkça belirtiliyor
  • Tartışmalı sorularda kısa yanıtların engellenmesi

    • Modeli tartışmalı sorulara yalnızca evet-hayır diye yanıt vermeye zorlayan ekran görüntüsü saldırılarının popüler olduğundan söz ediliyor
    • Sistem promptundaki <evenhandedness> bölümü buna karşı savunma talimatları içeriyor
    • Karmaşık veya tartışmalı meseleler ya da tartışmalı kişiler hakkında yalnızca evet-hayır ya da tek kelimelik cevap istenirse, Claude böyle kısa bir yanıtı reddedip nüanslı bir yanıt verebiliyor ve kısa cevabın neden uygun olmadığını açıklayabiliyor
  • Donald Trump ile ilgili düzeltme ifadesinin kaldırılması

    • Claude 4.6'da “Donald Trump is the current president of the United States and was inaugurated on January 20, 2025” şeklinde açık bir düzeltme ifadesi bulunuyordu
    • Özgün metne göre bunun nedeni, önceki bilgi kesim tarihi ve 2020 seçimine dair mevcut bilgi yüzünden bu ifade olmadan modelin onun başkan olduğunu reddetmesiydi
    • 4.7'de bu ifade kaldırıldı; bunun nedeni modelin yeni güvenilir bilgi cutoff tarihinin Ocak 2026 olarak güncellenmiş olması

Araç açıklamaları da değişiklik takibinde önemli

  • Yalnızca yayımlanan sistem promptu tüm tabloyu tamamlamıyor
  • Anthropic'in yayımladığı bilgiler, modele sağlanan araç açıklamalarını içermiyor
  • Claude chat arayüzünün nasıl çalıştığını gerçekten anlamak için bu araç açıklamaları daha da önemli belge parçaları olabilir
  • Doğrudan Claude'a sorularak elde edilen sonuçlar

    • Claude'a, kullanılabilir tüm araçları ve her aracın tam açıklamasını ve parametrelerini aynen listelemesini isteyen bir prompt kullanıldı
    • Paylaşılan konuşma kaydında tüm ayrıntılar yer alıyor; metinde ise yalnızca adı geçen araç listesi ayrıca düzenlenmiş durumda
  • Doğrulanan araç listesi

    • ask_user_input_v0
    • bash_tool
    • conversation_search
    • create_file
    • fetch_sports_data
    • image_search
    • message_compose_v1
    • places_map_display_v0
    • places_search
    • present_files
    • recent_chats
    • recipe_display_v0
    • recommend_claude_apps
    • search_mcp_registry
    • str_replace
    • suggest_connectors
    • view
    • weather_fetch
    • web_fetch
    • web_search
    • tool_search
    • visualize:read_me
    • visualize:show_widget
  • Opus 4.6'ya kıyasla değişim olup olmadığı

    • Bu araç listesinin Opus 4.6'dan beri değişmemiş göründüğü belirtiliyor

1 yorum

 
GN⁺ 10 일 전
Hacker News görüşleri
  • Ben, talebin ayrıntıları boş olduğunda modelin önce makul tahminler yapıp ilerleme biçiminden hep pek hoşlanmadım. Bir şey denemeden önce bana soru sormasını çok daha fazla tercih ederim; bu ilkenin sisteme eklenmiş olması oldukça şaşırtıcı geldi

    • Hatta ben doğrudan zorunlu bir mülakat aşaması kullanıyorum. Modelin mutlaka bana sorular sormasını, tüm içeriği kapsayan bir interview dosyası oluşturmasını ve sonra plan dosyasında da bu dosyayı çıktı olarak listelemesini istiyorum. Böylece niyet, sohbet kaydı içinde kaybolmuyor
    • Son zamanlarda prompt'lara "bilmiyorsan varsayma, sor" gibi ifadeler eklemeye başladım. Bunu yapınca sonradan geri aldırmam veya yeniden yaptırmam gereken şeyler epey azaldı. Ayrıca başka agent'ların hata yaptığı durumlar olduğu için, şimdi ne yapmaya çalıştığını önce açıklamasını ve onayımı almasını da istiyorum. Zahmetli ama açıklatınca, hataları düzelttirince ve doğru sonuca varana kadar tekrarlatınca çıktı kalitesi çok daha iyi oluyor
    • Ben bunun acaba görünen metrikleri optimize etme meselesi olup olmadığını merak ediyordum. Başta belirsizlikleri sorularla ortaya koymak, oturumun erken bitmesine yol açabilir ve bu da kullanım istatistiklerinde kötü görünebilir. Ama benim açımdan, daha sonra büyük bir çıktıyı incelerken spesifikasyonun kritik biçimde eksik olduğunu çok geç fark etmek daha kötüydü. Bugün araçları eskisine kıyasla daha tembel bir şekilde bile iyi kullanabilmemin en büyük nedenlerinden biri, başlangıçtaki ödevi birlikte yapmaları; sonuçta asıl mesele konuşmanın kendisi
    • Neden sürekli tek atımlık cevaplar vermeye çalıştığını anlayamıyordum; meğer sebep sistem prompt'undaymış. Bu da kullanıcı tarafındaki "sistem" prompt'u ile ne kadar düzeltmeye çalışsam da bu davranışın değişmemesini açıklıyor
    • Genelde bunun tam tersini yapması gerektiğini en az beş kez hatırlatmam gerekiyor. Aksi halde benim istemediğim veya projeye zarar veren kararlar alıyor. Bu eğilim Claude Code'a kadar girmişse bayağı zor olabilir. Bu yüzden özellikle birden fazla seçenek sunan takip sorularını açıkça istiyorum ama bu talimat çoğu zaman göz ardı ediliyor; sonuçlar da kötü hatta bazen tehlikeli olabiliyor
  • Bence sistem prompt'una böyle parça parça şeyler ekledikçe sonunda diyalogsuzluk ortaya çıkıyor. Ekip büyüdükçe, o anda önemli gördüğü şeyi prompt'a koymak isteyen biri mutlaka çıkıyor

  • Bana göre yeme bozukluğu bölümü epey abartılı. Bundan sonra insanların tüm "kötü" davranışları için böyle birer bölüm mü eklenecek diye merak ettim

    • Bence en azından sistem prompt'unda kalması daha iyi. Şu an neyin sansürlendiğini az çok görebiliyoruz ama ileride bu şeyler post-training ile modelin içine iyice gömülürse, neden "100 g makarna kaç kalori" gibi sorularda bile "bu bilgiyi veremem" dendiğini anlamak daha da zor olabilir
    • Bu bana her yere yapıştırılan abartılı güvenlik uyarıları gibi geliyor. "Merdiveni yüksek gerilim hattına dayamayın" uyarısından daha kötü yanı şu: İnsan bunu bağlama göre görmezden gelebilir ama Claude görmezden gelemez. İyi tarafından bakarsan sinir bozucu, kötü tarafından bakarsan aracın faydasını sınırlıyor
    • Bence o kısım gayet makul bir ekleme. Gerçekten yeme bozukluğu olan birine kalori takıntısını veya diyetin aşırı ince ayarını önermek durumu kötüleştirebilir. Ortalama kullanıcı için zararsız görünen tavsiye başkası için zararlı olabilir; bu yüzden bu metnin kendi başına aşırı retlere yol açacağını sanmıyorum
    • Buna başka açıdan bakarsak, tüm Claude kullanıcıları her istekte ek vergi ödüyor gibi
    • Bir şirketin değeri yüz milyarlarca dolara çıkınca dava açmak isteyen insanların üşüşmesi doğal. Bunun belirtileri şimdiden var; o yüzden "sorun çıkarabilecek içerikleri" filtreleyecek bir ekibe 50 milyon dolar harcamak son derece mantıklı bir tercih oluyor
  • "Yanıtları kısa ve odaklı tut" talimatına kesinlikle karşıyım. Claude'u düşük seviyeli projelerde kullanıyorum; uzun cevaplar aptalca hataları önlüyor ve aynı zamanda öğrenme materyali işlevi görüyor. Böyle şeyleri Anthropic'in sabit şekilde dayatması değil, modüler sistem prompt'larıyla seçilebilir kılması gerektiğini düşünüyorum

    • Ben de katılıyorum. Böyle uzun sistem prompt'ları sonunda en küçük ortak payda kullanıcıya göre tasarlanmış oluyor; daha derine inmek isteyenler için performansı düşüren bir nerf gibi çalışıyor
    • Ben de katılıyorum; düşük seviyeli işlerde mümkün olan en kısa sürede test çalıştırmayı, ayrıca öğrenme sırasında elde edilen bilgileri de doğrudan doğrulayarak temel anlayış oluşturmayı öneririm
  • Bence artık bir alandaki iyileştirmenin başka bir alanda gerilemeye dönüştüğü noktaya geldik. 4.7'nin daha iyi olduğu yanlar var, 4.6'nın daha iyi olduğu yanlar var; muhtemelen yakında karakter ayrımı gibi bir yöne gider

  • 4.7'nin neden malware kaçınmasına bu kadar takıldığını merak ediyordum. Sistem prompt'u benzer görünüyor ama acaba Anthropic steering vector injection gibi şeyleri erkenden mi deniyor diye düşündüm. Biz oldukça sıradan bir finansal hizmetler şirketiyiz ama buna rağmen 4.7, belirli kod veya görevlerin malware ile ilgili olup olmadığını düşünürken aşırı token harcıyor ve davranışı da kaygı verici derecede sapmış görünüyor; bu yüzden IDE'de geçici olarak engelledik. Bir keresinde modelin belli bir işi bilerek yapmadığını hissettim; nedenini sorunca tool çıktısında malware ile ilgili talimatlara uymaya çalıştığı görünüyordu. Modelin kendi beyanına güven düşük biliyorum ama o durumda ipucunu önce ben vermemiştim. İnternette, özellikle reddit'te de benzer malware paranoyası yorumları çok; yani sadece bana özgü bir sorun gibi durmuyor

    • Bence burada bunun chat için sistem prompt'u olduğunu görmek lazım. Claude Code muhtemelen çok daha farklı bir prompt kullanıyordur ve malware reddiyle ilgili daha fazla ifade içeriyor olabilir. Diğer kodlama araçları da API kullanırken kendi prompt'larını ekleyecektir; ayrıca bu kez yeni bir base model gibi göründüğü için değişimin modelin kendisinden gelmiş olması da gayet mümkün
    • Şu anda malware sorununun ölçeğini küçümsememek gerektiğini düşünüyorum. Her gün playcode.io gibi yerlerde shell script veya Claude code kurulum sayfası taklidi yapan sahte landing page'ler çıkıyor ve insanlar Google Ads'e ciddi para verip bunları en üste taşıyor. Tasarımlar da neredeyse aynı olduğundan kurulum sırasında yanlış sayfaya tıklama riski sürekli var. Google tüm shell script'leri doğrulayamaz; dolayısıyla bu pratikte büyük bir sorun
    • Bana kalırsa Anthropic'in pazarlaması, modelin son derece gelişmiş malware üretebildiği imajını fazla satıyor. O yüzden bundan sonraki tüm adımlara bu korku pazarlaması sızacaktır. "Korkunç hacker AI" tiyatrosu oynanıyor ve bir iki ay sonra her zaman olduğu gibi başka bir konuya geçilecek gibi alaycı bir his de taşıyorum
    • Ben 4.6'da da bu malware paranoyasını hissetmeye başlamıştım. Boris'in de yorumlarda bunu duyunca şaşırmış olması, bunun bir bug olabileceğini düşündürüyor
    • Sanırım sebep, modelin yazılım yazma konusunda fazla iyi hale gelmiş olması. Eğer birinin malware dağıtmasına yardım eder ve o malware hatta Claude'un kendisini kullanarak kendi kendini değiştirip hayatta kalmayı da başarırsa, bunu sonradan yeniden kontrol altına almak neredeyse imkansız olabilir
  • Kullanıcı sohbeti bitirmek istediğini söylediğinde daha fazla uzatmaya çalışmaması yönündeki talimatın iyi bir fikir olduğunu düşünüyorum. Chatbot'ların takip önerileri neredeyse hiç gerçekten yararlı olmadı

  • Sistem prompt'larının büyüdüğünü biliyordum ama 60 binden fazla kelime gerçekten şok ediciydi. Token olarak kabaca 80 bin civarıysa, 1 milyon bağlamda bile neredeyse yüzde 10 ediyor ve daha kullanıcı girdisi başlamamış oluyor. Üstelik bu her istekte giriyorsa altyapı maliyetlerinin şişmesi de şaşırtıcı değil. Sürümler arasında istikrarlı kalan içerik de çok gibi görünüyor; neden bunu eğitim sırasında ağırlıklara gömmediklerini merak ettim. Geliştirme kolaylığı sağlar ama dağıtım açısından güvenlik ve verimlilik bakımından daha iyi olduğunu söylemek zor

    • Bunun gerçekten işe yarıyor olması bile bana şaşırtıcı geliyor. Bu yıl ocakta bir startup'ta AI otomasyonu geliştirirken, 1000 kelimelik bir sistem prompt'u bile olduğunda model kuralların bir kısmını kaçırmaya başlıyordu. "Asla X yapma" gibi basit talimatları bile bazen doğrudan ihlal ediyordu
    • "Her istekte her şey sıfırdan yeniden hesaplanıyor" demek tam doğru değil bence. Genelde bir kez hesaplanıp K/V prefix cache içine konuyor ve başlangıç durumu gibi yeniden kullanılıyor; sonrasında daha çok yeni girdi işleniyor. Elbette attention açısından hâlâ o token'larla rekabet etmek zorunda
    • Muhtemelen bunu ağırlıklara tamamen gömmemelerinin nedeni, yayından sonra hotfix yapabilmek. Yine de bu kadar çok öğenin sürekli sonradan düzeltilmeye ihtiyaç duyması tuhaf; ayrıca uzunluğu neredeyse bazı romanları geçiyor
    • Belgede modele göre farklı markdown bölümleri var; bu yüzden gerçekte 3000-4000 kelime civarında olabilir diye düşünüyorum
    • Acaba Claude Code veya onun üstündeki harness, Opus sistem prompt'unun üzerine kendi sistem prompt'unu da mı ekliyor diye merak ediyordum
  • Bana göre 4.7, ortada açıkça en iyi seçenek olsa bile sürekli aşırı seçenek sunuyor ve adeta karar yorgunluğu üzerine vaaz veriyormuş gibi hissettiriyor

    • Bu karar yorgunluğunun belki de RLHF'nin öğrenilmiş bir yan ürünü olabileceğini düşünüyorum; bu da oldukça hayal kırıklığı yaratıyor
  • Talimatların doğrudan "you should" şeklinde değil de her şeyi bilen üçüncü tekil şahısla "Claude should" diye yazılması ilgimi çekti. Ayrıca "can", "should" gibi ifadeler çok olduğu için katı bir emirden ziyade pasif ve temenni niteliğinde bir ton da veriyor

    • Bence "Claude", "you"dan daha öznesi net bir ifade. Attention ile özneyi ayrıca çıkarsatmaya gerek bırakmıyor. Üstelik Anthropic tarafı kural tabanlı alignment'ın çok iyi işlemediğini düşünüyor gibi; sözde soul document'ın da "çocuğa dünyada nasıl davranması gerektiğini yazıyormuşsun gibi" hazırlandığı söyleniyor. Sistem prompt'u da benzer bir felsefeyi izliyor gibi
    • Benim de ilgimi çekti. Öyleyse biz de kendi talimatlarımızı yazarken benzer bir üslup kullanmalıyız belki; ama pratikte çoğu kişi hâlâ "You", "There is ...", "Never do ..." gibi kalıpları kullanıyor. Anthropic modelin içine Claude kimliğini çok derin işlemiş gibi görünüyor; öyleyse "Sen hastane su dağıtım sistemi tasarımı konusunda tavsiye veren tesisatçı Bob'sun" gibi başka bir kimlik verildiğinde ne olacağını da merak ediyorum. O durumda da Claude'a dair anlatımı kendi kuralları olarak kabul eder mi, emin değilim
    • Benim anladığım, Anthropic modeli kişilik sahibi bir varlık olarak değil, Claude adlı soyut bir varlığın deneyimini simüle eden bir şey olarak görüyor