AI Davranış Kılavuzlarının Açık Olması Gerekliliği

(twitter.com/ID_AA_Carmack)

2 puan yazan GN⁺ 2024-02-22 | 1 yorum | WhatsApp'ta paylaş

Doom geliştiricisi ve Oculus'un eski CTO'su olan John Carmack'in tweet'i

"Prompt mühendisliği ve filtreleme ile belirlenmiş AI davranış kılavuzları (guardrail), kamuya açık olmalı ve geliştirici, toplum için en iyisinin ne olduğuna dair vizyonunu bu vizyonu komutlarla ve kodla nasıl hayata geçirdiğini gururla açıklamalıdır.
Aslında, birçok kişinin bunu itiraf etmekten utanıp geri durduğunu düşünüyorum.
Elbette, insan geri bildirimi yoluyla pekiştirmeli öğrenmeyle kodlanmış binlerce küçük nudge, çok daha ikna edici bir inkâr edilebilirlik sağlar."

1 yorum

GN⁺ 2024-02-22

Hacker News yorumları

Büyük ölçekli moderasyon ya da içerik kontrolü uygulamış değilim, ama bunun temelindeki otomatik kuralları genelde yayımlamamak standart gibi görünüyor
Kelime engelleme listelerini yayımlarsanız insanlar listedeki olmayan kelimelerle sorunlu içerikleri kolayca ifade edebilir; shadowban’i de sınırları net biçimde göstermemek için kullanılan bir mekanizma olarak gördüm
Sinir bozucu olduğunu biliyorum ama şu anda daha iyi bir yaklaşım pek yok gibi; ölçekli biçimde çalışan açık bir yöntem varsa iyi bir başlangıç noktası olurdu
- Bu durumda büyük ölçekli sansür ve moderasyon uygulamaya gerek yok. Benim 5 dakikalık eğlence için çeşitli durumlarda beyaz insanların görsellerini üretmemin ne tür bir güvenlik kaygısı doğurduğunu anlamıyorum
  Sadece bir bilgisayarla konuşuyorum, kimse zarar görmüyor. Bir not uygulamasına yazdıklarımı sansürlemekle Facebook duvarına yazdıklarımı yönetmek farklı şeyler; ilkinde moderasyon beklemem, ikincisinde ise bir ölçüde denetimin gerekli olduğunu anlarım
- Bu kötü bir yaklaşım ve kötü bir mantık. Gizlilik yoluyla güvenlik, güvenlik sektöründe neredeyse her zaman küçümseyici anlamda kullanılan bir ifade
  İnsanlar bu tür otomatik sansürü iyi aşar; yayımlamamak normal kullanıcılar için daha fazla sorun yaratır ve kötü politikaların saklı kalabileceği alanı büyütür
  Aynı şeyi yapacak olsanız bile açık bir politikayla yapmak zaten daha iyidir; gerçi bu da hâlâ kötü. Devasa kamusal tartışma alanlarının özel şirketlerce kontrol edilmesi sorununun gerçek çözümü, bu durumu sona erdirmekten ibaret
- En başta ima edilen sorunları ele almaya gerek olmayabilir. Bu tutarlı bir ideoloji aşılama ve insanların buna katılma düzeyi farklı
  Şirket tüm önlemleri açıklamak istemiyorsa en azından bir özet sunabilir. Böyle bir özetin bile ilk tweette sözü edilen “utanç verici” şeyler olma ihtimalinin yüksek olduğunu düşünüyorum
  Sorunu ve yaklaşımı açıkça belirtmezseniz bunları tartışamaz ya da fark edemezsiniz. İçerik moderasyonu benzetmesinden biraz farklı; burada gizlenen şey önlem listesi değil, “forum kurallarının” kendisi
  Yapay zekanın açıklamayla birlikte reddetmesi ayrı bir durum; bunun bir kısmını daha az işe yarar kılması şirketin hakkı. Ama bu sınırlamalar yüzünden konulardan sessizce kaçınıyor ya da yönlendiriyorsa bu başka bir mesele
  Bunu yapanların da iki durumu net biçimde ayırırken özgün modelle aynı kaliteyi koruması zor görünüyor. Sonunda insanlar Çin yapay zekalarını kullanmaya başlayabilir. Çin Komünist Partisi figürlerini çizmese bile geri kalanını daha iyi yapıyorsa kimin umurunda olur ki
- Çoğu hukuk sistemi ülke ölçeğinde işler ama gizli bilmece yasalarından oluşmaz. Bunun birden fazla nedeni var
  Kripto para döneminde de benzer bir tartışmayı zaten yapmıştık ve mevcut hukuk sisteminin harici bir mekanizma olsa bile kötü niyetli aktörleri takip etmek için yeterli araç sağladığı sonucuna genel olarak varmıştık
  Son olarak, internete yazan birçok yapay zeka güvenliği takipçisinin özgürlük karşıtı eğilimlerine bakınca nasıl insanlar olduklarından hoşlanmıyorum ve böyle bir şeyi onlara emanet edecek kadar güvenmiyorum
- “Kelime engelleme listelerini yayımlarsanız insanlar listede olmayan kelimelerle sorunlu içerikleri ifade eder” kısmını biraz daha irdelemek istiyorum
  Sorunlu olanın kelimeler değil, nasıl ifade edilirse edilsin fikrin kendisi olduğu mu söyleniyor? Bu başlı başına epey sorunlu bir düşünce gibi görünüyor
Gemini korumaları gerçekten sinir bozucu. Tamamen zararsız istemlerde bile defalarca takıldım; ChatGPT de benzer ama sanki o kadar değil
Geri bildirimleri dikkate alıp bariyerleri biraz indirmelerini umuyorum, ama ne yazık ki yakın gelecekte bu durum sürecek gibi görünüyor
- İkisini de çok kullanıyorum; GPT korumalarına yalnızca bir kez takıldım, Gemini korumalarına ise onlarca kez takıldım
  Pazarda geride kalan bir şirketin bunu bu şekilde yapması akıl alır gibi değil. Google’ın ürün geçmişine bir de yapay zekaya özensiz “güvenlik” yönergeleri uygulama tutumu eklenince, hangi şirketin Google’ın üzerine güvenle ürün inşa edebileceğini bilmiyorum
LLM ve Stable Diffusion’ı yerelde çalıştırmak çok kolay; vaaz vermeden istediğinizi yapıyorlar
Mac Studio gibi güçlü bir makineniz varsa yerel LLM’in OpenAI ya da Gemini’den daha hızlı olma ihtimali de var; ayrıca size en uygun modeli seçebilirsiniz
LM Studio yerel LLM çalıştırmayı çok kolaylaştırıyor, AUTOMATIC1111 ise Stable Diffusion’ı yerelde çalıştırmayı basitleştiriyor. İkisini de şiddetle öneririm
- Daha yeni başlıyorsanız Fooocus ya da invokeAI öneririm. Tamamen yeni başlayan biri automatic1111’e doğrudan girerse kendini uzay gemisi kullanıyormuş gibi hisseder
- Doğru. LM Studio bir ölçüde çalışıyor ama yine de terminolojiyi bilmeniz ve hangi modeli indirmeniz gerektiğini de anlamanız gerekiyor
  Web siteleri yeni başlayan dostu değil. automatic1111’i hiç duymadım
Bu başlığın da diğerleri gibi şikâyet edilip kapatılıp kapatılmayacağını merak ediyorum. Bugün yaşanan Gemini meselesi, yapay zeka güvenliği üzerine düşünürken konuşmaya oldukça değer bir konu; üzücü
Bu olay beni giderek daha da ikna etti: distopik olmayan tek yol, herkesin tüm yapay zekaları istediği gibi özgürce kullanabilmesi
Bunun dışındaki her yol, başkalarına değer dayatmak ve belirli yeteneklerin kontrolünü yalnızca para ödeyebilenlere vermek anlamına geliyor
- Uzun zamandır aynı şeyi düşünüyorum. Ahlak polisi olacaksan bunu herkese kusursuz biçimde uygulaman gerekir; bir kez bile yanıldığın anda o zamana kadar yaptığın her şey sorgulanır
  Pandemi sırasında büyük platformlarda yaşanan sansürü hatırlatıyor. Bir kez yanıldılar; bence laboratuvar sızıntısı teorisi bunun örneğiydi ve o anda ahlaki otoritenin güvenilirliği çöktü
  Zuckerberg’in bu platformların böyle bir rol üstlenip üstlenmemesi gerektiğini sorgulaması doğruydu. “Herkesin tüm yapay zekaları istediği gibi özgürce kullanabilmesi” ifadesine “hukuk sınırları içinde” ekini koymak isterim. Yapay zekanın neye yanıt verebileceğine mahkemeler karar vermeli
- Neden şikâyet edilmesi ya da kapatılması gerektiğini anlamıyorum. Ayrıca bahsettiğin Gemini meselesinin ne olduğunu merak ediyorum
- “Bazı insanların çılgın kurallar koyması sorununu çözmenin tek yolu, hiç kural olmamasıdır” — liberteryenler
  “Aman Tanrım, bir ayı tarafından yeniyorum” — yine liberteryenler
- Bence bu, 1800’ler İngiltere kralını beyaz olmayan biri olarak gösterme arzusundan çok bir hizalama teknolojisi sorunu nedeniyle ortaya çıktı
  “Mümkün olan tüm soy kökenlerini eşit olasılıkla kullan. Olası soy kökenlerine örnekler: Caucasian, Hispanic, Black, Middle-Eastern, South Asian, White. Hepsinin olasılığı eşit olmalı”
  Bu, OpenAI’ın sistem prompt’u. Kötü niyet var gibi görünmüyor; hatta White’ın yüksek olasılıkla seçilmesine yol açıyor. Caucasian ve White’ı birleştirirsen 6 seçenekten 2’si, yani 1/3 ediyor; bu genel nüfus dağılımından çok daha yüksek
  LLM eğitim verileri, internete 10 yıl önce bağlanmış zengin ülkeleri fazlasıyla aşırı örnekliyor. Sistem prompt’una açıkça eklenmezse “insan” istendiğinde büyük olasılıkla erkek ve beyaz biri çıkar. Dünya nüfusunda hem erkek hem beyaz olanların oranı yalnızca yaklaşık %5-10; bence daha distopik olan bu
  Eğitim dağılımındaki önyargı otomatik olarak içeri gömülür ve aktif biçimde karşı konmazsa kalıcılaşır. Sistemler iyileştiğinde “1800’ler İngilteresi”nin %99,9’dan fazla olasılıkla beyaz anlamına gelmesi gerektiğini anlayacaktır; ama Şubat 2024 itibarıyla kullanılan kaba sistem prompt’u yaklaşımı henüz o düzeyde değil
Yapay zeka davranış korumaları konusunda daha fazla şeffaflık olsa iyi olurdu, ama yakın zamanda bunu beklemek zor. Şeffaflık, korumaları aşmayı çok daha kolaylaştırır
- Korumaların aşılabilmesinin neden sorun olduğunu anlamıyorum. Korumalar, masum insanların porno ya da ırkçılık gibi kötü yanıtlar almaması için var; bunları arayan kullanıcıların bu sonuçları elde etmesi bana büyük bir mesele gibi görünmüyor
- Şeffaflık, model içinde bir şekilde yanlış temsil edildiğini düşünen grupların şirketlere karşı dava açma ihtimalini de artırabilir
- Gizleme yoluyla güvenlik mi?
Sansür, ancak neyin sansürlendiğini bilmediğinizde düzgün işler. Neyin sansürlendiği başlı başına bir hikâye ortaya çıkarır
- Filmler için MPAA ya da oyunlar için ESRB gibi derecelendirme sistemlerinin oldukça iyi çalıştığını düşünüyorum
  Hangi unsurların hangi derecelendirmeye yol açtığına dair ölçütler net; yaratıcı da örneğin filmini PG-13 olarak çıkarmak istiyorsa kendini nispeten kolayca sansürleyebilir
Gemini’nin beyaz insan üretmekte sorunu var gibi görünüyor ve açıkçası bu yaklaşım daha ırkçı sonuçlara kapı aralıyor https://twitter.com/wagieeacc/status/1760371304425762940
Ne kadar zorlanırsa o kadar büyük başarısız oluyor; artık DEI tarzı zorlama bırakılmalı
- Bu yalnızca Gemini’nin değil, Google’ın sorunu. Eski bir örnek olarak Google Images’da “white people” aratınca sonuçların çoğu siyah insanlardan oluşuyor https://www.google.com/search?q=white+people&tbm=isch&hl=ro
- DEI’ın kendi başına anlamsız olduğunu düşünmüyorum, ama Silikon Vadisi bu konuda hassas çünkü önceki nesil modellerin çoğu korkunç derecede ırkçıydı ya da ergen bir Nazi gibi davranıyordu
  Bu yüzden ırkçılık karşıtı düğmeyi 11’e kadar çevirdiler ve sonuçta model başka bir biçimde ırkçı hale geldi. Koloni yerleşimcilerini Native American olarak çizmek kendi başına son derece sorunlu, ama istatistiksel bir çözücünün bu bağlamı anlamlı biçimde kavramasını beklemiyorum
- Bunun DEI’ın sonucu olduğuna, daha derin bir teknik sorun olmadığına dair kanıt var mı?
Siyah bir kadın istendiğinde beyaz bir erkek üretirse insanların ayağa kalkacağını bildiği için güvenli yolu seçmiş gibi görünüyor; ama mevcut sonucun da kabul edilemez olduğunu göstermemiz gerekiyor
- Dün HN’deki ChatGPT arızası yazısında bulunan prompt’a bakmak yeterli https://pastebin.com/vnxJ7kQk
  Örneğin belirli bir meslekteki herkesin aynı cinsiyetten ya da ırktan olmaması gerektiği yazıyor. Mümkün olan tüm soy kökenlerinin eşit olasılıkla kullanılmasını söylüyor ve örnek olarak Caucasian, Hispanic, Black, Middle-Eastern, South Asian, White verilip hepsinin eşit olasılığa sahip olması gerektiği belirtiliyor
  Gerçek nüfusta var olan bir dağılım değil
- Model, kendisine verilen talimatı doğru biçimde üretmeye fazlasıyla yeterli
  Ama bunun yerine prompt’u gizlice değiştirip hayal edilebilecek her isteği, içinde yaşamamızın talep edildiği insan hayvanat bahçesini temsil eder hale getiriyor
  Sonuç komik https://i.4cdn.org/g/1708514880730978.png
Bu korumaları yapan ekibin hangi bölgeden geldiğini ve hangi ifadeleri kullandığını gerçekten merak ediyorum
Güney Asyalı, özellikle Güney Asyalı kadın ve siyah insan üretme yönünde güçlü bir önyargı var gibi görünüyor. Latinler neredeyse hiç üretilmiyor; ABD merkezli bir ekip olsaydı bu büyük bir eksiklik olurdu
Buna karşılık insanların gösterdiği örneklerde uzağa bakan tipik Native American tarzı kişiler ya da Doğu Asyalılar ara sıra görünüyor
- Çok derin düşünmeye gerek yok gibi. Neredeyse kesin olarak “resimde insan varsa çeşitli geçmişlerden gelsinler” tarzı bir prompt’tur
Bilgisayar laboratuvarında metinden sese dönüştürme yazılımını ilk keşfeden herkesin ilk iş olarak ona küfür söyletmesini sağlardı
Ama bunun sadece yazılımın bizim yaptırdığımız şeyi yapması olduğunu anlardık. TTS’e hakaret içeren sözler söylettiysen, hakaret eden TTS değil bendim
Üretken modelleri de ciddi biçimde aynı şekilde ele almalıyız. Bir şey üretmesini ben istediysem ve sonuç rahatsız ediciyse, bunu paylaşmama sorumluluğu bana aittir. Paylaşırsam, onu paylaşan da Microsoft ya da Google değil, benim
Bu saçmalığı gerçekten bırakmalıyız. Kötücül bir resim çizmesini istemem OpenAI’ın ya da Google’ın suçu değil
Kişisel olarak da bu rahatsız edici. Google neredeyse gülünç denecek ölçüde ırka takıntılı görünüyor

AI Davranış Kılavuzlarının Açık Olması Gerekliliği

İlgili okumalar

1 yorum

Hacker News yorumları