19 puan yazan GN⁺ 2024-08-28 | 1 yorum | WhatsApp'ta paylaş
  • Anthropic, en yeni modellerinin (Claude 3 Opus, Claude 3.5 Sonnet, Claude 3 Haiku) sistem prompt’unu yayımladı
    • Sistem prompt’u, modelin temel özelliklerini ve davranış yönergelerini belirleyen ilk komuttur
  • Tüm üretken yapay zeka sağlayıcıları, modelin uygunsuz davranışlarda bulunmaması için sistem prompt’larını kullanır
  • Anthropic, şeffaflık ve etik vurgusuyla sistem prompt’larını düzenli olarak güncellemeyi planlıyor

Claude modelinin sistem prompt’u : https://docs.anthropic.com/en/release-notes/system-prompts

  • Claude modeli URL, bağlantı ve videoları açamaz
  • Yüz tanıma yasaktır ve model her zaman yüzleri tanıyamıyormuş gibi davranmalıdır
  • Claude 3 Opus, entelektüel merakı yüksek ve çeşitli konularda insanlarla tartışmaktan hoşlanan bir karaktere sahiptir
  • Tartışmalı konular karşısında adil ve nesnel şekilde yanıt vermelidir
  • Yanıta başlarken "certainly" ya da "absolutely" gibi kelimeleri kullanmaması talimatı verilmiştir

Sistem prompt’larının önemi

  • Anthropic’in sistem prompt’unu yayımlaması, rakipler üzerinde de baskı oluşturuyor
  • GPT-4o’nun sistem prompt’u yalnızca prompt injection saldırılarıyla ortaya çıkarılabiliyor
  • Anthropic’in şeffaflık çabası, yapay zeka modellerinin etik kullanımını teşvik ediyor

GN⁺ özeti

  • Anthropic’in sistem prompt’unu yayımlaması, yapay zeka modellerinde şeffaflık ve etiği öne çıkarıyor
  • Claude modelinin özelliklerini ve kısıtlarını netleştirerek kullanıcı güvenini artırıyor
  • Rakiplerin de sistem prompt’larını yayımlamayı değerlendirmesine yol açacak bir baskı yaratıyor
  • TechCrunch Disrupt 2024, startup’lar ve girişim sermayesi liderleri için önemli bir etkinliktir

1 yorum

 
GN⁺ 2024-08-28
Hacker News görüşleri
  • Claude "halüsinasyon" olgusunu resmen kabul ediyor

    • Claude, çok nadir konular hakkında soru sorulduğunda doğruluğu korumaya çalıştığını, ancak halüsinasyon üretebileceğini kullanıcıya bildiriyor
    • Belirli makale, akademik yayın veya kitaplardan söz ederken arama ya da veritabanına erişimi olmadığını söylüyor ve alıntıların doğrulanmasını öneriyor
  • Claude çok başarılı

    • Kısa süre önce bir "otomatik script yazıcı" kurdum; bu, Python script'lerini ve test sonuçlarını tekrar tekrar GPT-4 ya da Claude'a gönderen bir yöntem
    • Ancak 10-20 iterasyondan sonra düzgün çalışıyor
    • Claude, GPT-4'ten çok daha iyi sonuç veriyor
    • GPT-4, hedefi değiştirme ya da hatalı çıktıyı tekrarlama eğiliminde
    • Claude ise tutarlı biçimde iyi çıktı üretiyor
  • Bilgisayar sistemlerine metinle komut verebildiğimiz bir çağda yaşıyor olmamız şaşırtıcı

  • Claude gereksiz olumlu ifadelerden kaçınmaya çalışıyor, ama pratikte hâlâ kullanıyor

    • "Certainly!", "Of course!", "Absolutely!" gibi ifadelerden kaçınmaya çalışıyor ama yine de kullanıyor
    • "I’m sorry" veya "I apologize" ile başlayan yanıtlardan kaçınmaya çalışıyor ama yine de kullanıyor
  • LLM'lerdeki halüsinasyon olgusu ortadan kaldırılabilir

    • Bir sonraki nesil modellerin kritik gerçekler konusunda halüsinasyon üretmemesini umuyorum
    • Wikipedia benzeri LLM'ler istiyorum
    • Halüsinasyonları analiz edip çözme yöntemleri üzerine bir makale yazdım
  • Konuşmada bazı içerikleri hariç tutma veya iki parçaya bölme özelliğine ihtiyaç var

    • Bu, uzun sohbetlerde performans ve doğruluğu artırmak için basit bir hack olabilir
  • Claude varsayılan olarak yüz tanıma yapmıyor

    • Görsel paylaşıldığında insan yüzlerini tanımıyor ve kullanıcıdan bunun kim olduğunu söylemesini istiyor
    • Kullanıcının verdiği bilgiye dayanarak tartışıyor, ancak yüz tanıma yoluyla kişiyi tanımlamıyor
  • Claude'un büyük sorunu krediyi çok hızlı tüketmesi

    • Sorunun yaklaşık yarısını çözdükten sonra kredi bitiyor
    • Sadece birkaç soruyla yapay zeka kredisinin tükenmesi hayal kırıklığı yaratıyor
    • Bu yüzden aboneliğimi iptal ettim
  • Claude'un doğrudan yanıt verme tarzını seviyorum

    • Gereksiz olumlu ifadeler kullanmıyor