Anthropic, Claude’u çalıştıran "sistem prompt"unu yayımladı

(techcrunch.com)

19 puan yazan GN⁺ 2024-08-28 | 1 yorum | WhatsApp'ta paylaş

Anthropic, en yeni modellerinin (Claude 3 Opus, Claude 3.5 Sonnet, Claude 3 Haiku) sistem prompt’unu yayımladı
- Sistem prompt’u, modelin temel özelliklerini ve davranış yönergelerini belirleyen ilk komuttur
Tüm üretken yapay zeka sağlayıcıları, modelin uygunsuz davranışlarda bulunmaması için sistem prompt’larını kullanır
Anthropic, şeffaflık ve etik vurgusuyla sistem prompt’larını düzenli olarak güncellemeyi planlıyor

Claude modelinin sistem prompt’u : https://docs.anthropic.com/en/release-notes/system-prompts

Claude modeli URL, bağlantı ve videoları açamaz
Yüz tanıma yasaktır ve model her zaman yüzleri tanıyamıyormuş gibi davranmalıdır
Claude 3 Opus, entelektüel merakı yüksek ve çeşitli konularda insanlarla tartışmaktan hoşlanan bir karaktere sahiptir
Tartışmalı konular karşısında adil ve nesnel şekilde yanıt vermelidir
Yanıta başlarken "certainly" ya da "absolutely" gibi kelimeleri kullanmaması talimatı verilmiştir

Sistem prompt’larının önemi

Anthropic’in sistem prompt’unu yayımlaması, rakipler üzerinde de baskı oluşturuyor
GPT-4o’nun sistem prompt’u yalnızca prompt injection saldırılarıyla ortaya çıkarılabiliyor
Anthropic’in şeffaflık çabası, yapay zeka modellerinin etik kullanımını teşvik ediyor

GN⁺ özeti

Anthropic’in sistem prompt’unu yayımlaması, yapay zeka modellerinde şeffaflık ve etiği öne çıkarıyor
Claude modelinin özelliklerini ve kısıtlarını netleştirerek kullanıcı güvenini artırıyor
Rakiplerin de sistem prompt’larını yayımlamayı değerlendirmesine yol açacak bir baskı yaratıyor
TechCrunch Disrupt 2024, startup’lar ve girişim sermayesi liderleri için önemli bir etkinliktir

1 yorum

GN⁺ 2024-08-28

Hacker News görüşleri

Claude "halüsinasyon" olgusunu resmen kabul ediyor
- Claude, çok nadir konular hakkında soru sorulduğunda doğruluğu korumaya çalıştığını, ancak halüsinasyon üretebileceğini kullanıcıya bildiriyor
- Belirli makale, akademik yayın veya kitaplardan söz ederken arama ya da veritabanına erişimi olmadığını söylüyor ve alıntıların doğrulanmasını öneriyor
Claude çok başarılı
- Kısa süre önce bir "otomatik script yazıcı" kurdum; bu, Python script'lerini ve test sonuçlarını tekrar tekrar GPT-4 ya da Claude'a gönderen bir yöntem
- Ancak 10-20 iterasyondan sonra düzgün çalışıyor
- Claude, GPT-4'ten çok daha iyi sonuç veriyor
- GPT-4, hedefi değiştirme ya da hatalı çıktıyı tekrarlama eğiliminde
- Claude ise tutarlı biçimde iyi çıktı üretiyor
Bilgisayar sistemlerine metinle komut verebildiğimiz bir çağda yaşıyor olmamız şaşırtıcı
Claude gereksiz olumlu ifadelerden kaçınmaya çalışıyor, ama pratikte hâlâ kullanıyor
- "Certainly!", "Of course!", "Absolutely!" gibi ifadelerden kaçınmaya çalışıyor ama yine de kullanıyor
- "I’m sorry" veya "I apologize" ile başlayan yanıtlardan kaçınmaya çalışıyor ama yine de kullanıyor
LLM'lerdeki halüsinasyon olgusu ortadan kaldırılabilir
- Bir sonraki nesil modellerin kritik gerçekler konusunda halüsinasyon üretmemesini umuyorum
- Wikipedia benzeri LLM'ler istiyorum
- Halüsinasyonları analiz edip çözme yöntemleri üzerine bir makale yazdım
Konuşmada bazı içerikleri hariç tutma veya iki parçaya bölme özelliğine ihtiyaç var
- Bu, uzun sohbetlerde performans ve doğruluğu artırmak için basit bir hack olabilir
Claude varsayılan olarak yüz tanıma yapmıyor
- Görsel paylaşıldığında insan yüzlerini tanımıyor ve kullanıcıdan bunun kim olduğunu söylemesini istiyor
- Kullanıcının verdiği bilgiye dayanarak tartışıyor, ancak yüz tanıma yoluyla kişiyi tanımlamıyor
Claude'un büyük sorunu krediyi çok hızlı tüketmesi
- Sorunun yaklaşık yarısını çözdükten sonra kredi bitiyor
- Sadece birkaç soruyla yapay zeka kredisinin tükenmesi hayal kırıklığı yaratıyor
- Bu yüzden aboneliğimi iptal ettim
Claude'un doğrudan yanıt verme tarzını seviyorum
- Gereksiz olumlu ifadeler kullanmıyor

Anthropic, Claude’u çalıştıran "sistem prompt"unu yayımladı

Claude modelinin sistem prompt’u : https://docs.anthropic.com/en/release-notes/system-prompts

Sistem prompt’larının önemi

GN⁺ özeti

İlgili okumalar

1 yorum

Hacker News görüşleri