2 puan yazan GN⁺ 2024-02-22 | 1 yorum | WhatsApp'ta paylaş
  • Doom geliştiricisi ve Oculus'un eski CTO'su olan John Carmack'in tweet'i

    "Prompt mühendisliği ve filtreleme ile belirlenmiş AI davranış kılavuzları (guardrail), kamuya açık olmalı ve geliştirici, toplum için en iyisinin ne olduğuna dair vizyonunu bu vizyonu komutlarla ve kodla nasıl hayata geçirdiğini gururla açıklamalıdır.
    Aslında, birçok kişinin bunu itiraf etmekten utanıp geri durduğunu düşünüyorum.
    Elbette, insan geri bildirimi yoluyla pekiştirmeli öğrenmeyle kodlanmış binlerce küçük nudge, çok daha ikna edici bir inkâr edilebilirlik sağlar."

1 yorum

 
GN⁺ 2024-02-22
Hacker News yorumları
  • Google, görüntü tanıma modelinde siyahları goril olarak yanlış tanıması gibi eleştiriler almasının ardından, görüntü üretim sistemlerinde çeşitliliği gereğinden fazla yansıtma çabasında görünüyor.
  • Büyük ölçekte içerik yönetimi veya moderasyona doğrudan dahil olmadım ama otomatik kuralların genelde gizli tutulması güvenlik için bir tür "şifreleme" gerekliliği olduğu için sanırım mantıklı. Örneğin yasaklı kelime listesi açığa çıkarsa, insanlar listede olmayan sözcükleri kullanarak sorunlu içeriği ifade etmenin yollarını kolayca bulabilir. Ancak şu an için daha iyi bir yaklaşım görünmüyor.
  • Gemini'de beyaz karakter üretiminde bir sorun var ve bu, daha da ırkçı bir soruna yol açabilir. Çeşitlilik, eşitlik ve kapsayıcılık (DEI) için çaba, aksine başarısızlığa neden olabilir.
  • Gemini'nin güvenlik önlemleri çok sinir bozucu; zararsız istemlere bile birçok kez takılıyorlar. ChatGPT de benzer şekilde davranıyor ama Gemini kadar kötü değil. Geri bildirimle güvenlik filtresinin biraz gevşetilmesini umuyorum, fakat yakın gelecekte bu durumun böyle süreceğini düşünüyorum.
  • LLM'leri (büyük dil modelleri) ve Stable Diffusion'ı yerelde rahatça çalıştırabilirsiniz; kullanıcı isteğine göre çalışır. Güçlü bir bilgisayarınız varsa OpenAI veya Gemini'den daha hızlı çalıştırılabilir. LM Studio ve AUTOMATIC1111, yerelde hem LLM'leri hem de Stable Diffusion'ı kolayca çalıştırmayı sağlar.
  • Sansür, sansürlenecek şeyin ne olduğunu bilmediğinde etkilidir. Sansürlenen içerik zaten mesajı iletir.
  • AI davranış güvenlik önlemlerinin daha şeffaf hale gelmesini görmek isterdim ama bunun hemen olacağına inanmıyorum. Şeffaflık, güvenlik önlemlerini atlatmayı çok daha kolaylaştırır.
  • İnsanlar siyah bir kadın istediğinde beyaz bir erkek oluşmasına öfkelenebileceklerini bilen Google güvenli yolu seçti ama şu andaki sonuçlar da kabul edilemez olduğunu göstermeli.
  • Bu güvenlik önlemlerini yazan ekibin coğrafi kökeni ve kullandığı dil konusunda merak ediyorum. Çıktılar çoğunlukla Güney Asyalı (özellikle Güney Asyalı kadın) ve siyahları üretme eğiliminde; Latinleri neredeyse hiç üretmiyor. Bu, ABD merkezli bir ekibin büyük bir eksikliği olabilir. Ancak stereotiplerdeki Yerli Kızılderili veya Doğu Asyalı bireyler bazen üretiliyor.
  • Bu sizi yaralayabilir. Bu, sizi korumak için var. Ancak sizi nasıl yaralayacağını ve sizi nasıl koruyacağınızı anlamak zor.