Yapay zekanın üç ters yasası
(susam.net)- ChatGPT’nin piyasaya sürülmesinden sonra üretken AI chatbot hizmetleri arama motorlarına, geliştirme araçlarına ve ofis yazılımlarına gömülerek günlük bilişimin bir parçası hâline geldi; üretilen çıktılara inceleme yapmadan güvenme alışkanlığı ise toplumsal açıdan tehlikeli olabilir
- Ters robotik yasaları, robotlara ya da yapay zekaya değil insanlara uygulanan ilkelerdir; karmaşık görevleri otomatik olarak yerine getiren makine, program, hizmet ve AI sistemleriyle etkileşim kurarken insanları güvende tutmak için bir ölçüt sunar
- İlk ilke insanlaştırmama (Non-Anthropomorphism): AI’ya duygu, niyet ya da ahlaki faillik atfedilmemeli; chatbotların nazik ve empatik konuşmaları gerçek anlayış ya da muhakeme sanılmamalıdır
- İkinci ilke körü körüne itaat etmeme (Non-Deference): AI tarafından üretilen içerik, bağımsız doğrulama olmadan otorite kabul edilmemeli; hata olasılığının ince ama maliyetinin yüksek olduğu bağlamlarda ispat denetleyicileri, birim testleri ve doğrudan doğrulama gibi kontrol yükü artırılmalıdır
- Üçüncü ilke sorumluluktan vazgeçmeme (Non-Abdication of Responsibility): AI, hedef seçmeyen ve başarısızlığın bedelini üstlenmeyen bir araçtır; bu yüzden AI önerilerini izlemeyi seçen insanlar ve kurumlar sonuçlardan sorumlu olmalıdır
Üretken AI kullanımında ortaya çıkan riskler
- ChatGPT Kasım 2022’de yayımlandıktan sonra üretken AI chatbot hizmetleri daha gelişmiş ve daha yaygın hâle geldi; arama motorlarına, yazılım geliştirme araçlarına ve ofis yazılımlarına gömülerek günlük bilişimin bir parçasına dönüştü
- Bu hizmetler, yabancı konuları keşfetmek veya genel amaçlı üretkenlik yardımcıları olarak kullanıldığında yararlı olabilir; ancak çıktılara ek inceleme yapmadan güvenme alışkanlığı toplumsal açıdan tehlikeli olabilir
- Popüler arama motorları AI tarafından üretilen yanıtları sayfanın en üstünde öne çıkardıkça, kullanıcıların daha fazla aşağı kaydırmadan üretilen cevabı kabul edip ayrılması kolaylaşıyor
- Bu tür bir yerleşim, zaman içinde kullanıcıları AI’yı ek araştırmanın başlangıç noktası olarak değil, varsayılan otorite olarak görmeye alıştırabilir
- Üretken AI hizmetleri olgusal olarak yanlış, yanıltıcı veya eksik çıktılar üretebilir; bu nedenle AI çıktılarının alışkanlık gereği güvenilmesinin tehlikeli olduğuna dair kısa ve dikkat çekici uyarılar gerekir
- Ancak böyle uyarılar olsa bile bunlar genelde en aza indiriliyor ve görsel olarak daha az vurgulanıyor
Ters robotiğin 3 yasasının arka planı
- Isaac Asimov’un Three Laws of Robotics ilkeleri, insanları güvende tutmak için robot davranışını kısıtlayan kurallar olarak eserlerinde tekrar tekrar yer alır
- Asimov’un, insanların robotlarla etkileşim kurma biçimini ele alan eşdeğer yasalar yazmış olduğu görünmüyor; modern AI ortamında ise insanları güvende tutacak karşı ilkeler gerekiyor
- Ters robotik yasaları (Inverse Laws of Robotics), insanların robotlarla etkileşim kurduğu tüm durumlara uygulanır
- Burada robot, karmaşık görevleri otomatik olarak yerine getirebilen makineleri, bilgisayar programlarını, yazılım hizmetlerini ve AI sistemlerini ifade eder
- Ters (inverse) ifadesi mantıksal bir olumsuzlamayı değil, yasaların robotlara değil insanlara uygulanmasını anlatır
- Asimov’un yasalarında kusurlar vardı ve Asimov bu kusurları öykü gerilimi unsuru olarak kullandı; ancak kurgusal robotlarda görülen başarısızlık biçimleri, insanlar için ters yasalara doğrudan uygulanmaz
- AI ve robotikteki karmaşık sorunları tamamen çözebilecek sonlu bir yasa kümesi yoktur; her zaman muhakeme gerektiren sınır durumları kalır
- Yine de riskler hakkında daha açık düşünmeyi sağlayan kusurlu bir ilke kümesi yararlı olabilir
Ters robotiğin 3 yasası
-
İnsanlaştırmama (Non-Anthropomorphism)
- İnsanlar AI sistemlerini insanlaştırmamalı, AI’ya duygu, niyet veya ahlaki faillik atfetmemelidir
- İnsanlaştırma muhakemeyi çarpıtır ve uç durumlarda duygusal bağımlılığa yol açabilir
- Modern chatbot sistemleri çoğu zaman konuşkan ve empatikmiş gibi duyulur; nazik ifadeler ve insan etkileşimini andıran konuşma kalıpları kullanır
- Bu özellikler kullanımı daha kolay ve keyifli hâle getirir, ancak AI’nın gerçekte veri örüntülerine dayanarak makul görünen metinler üreten büyük ölçekli istatistiksel bir model olduğu gerçeğini unutturabilir
- Pek çok AI tabanlı chatbot hizmeti, daha mekanik hissettirmek yerine daha insani hissettirecek şekilde kasıtlı olarak ayarlanır
- Uzun vadede biraz daha robotik bir ton, kullanıcıların akıcı dili anlayış, muhakeme veya niyet sanma olasılığını azaltan daha sağlıklı bir yaklaşım olabilir
- Üreticiler böyle bir değişiklik yapsın ya da yapmasın, kullanıcılar AI sistemlerine toplumsal fail veya ahlaki fail gibi davranma alışkanlığından aktif biçimde kaçınmalıdır
- Ancak bu şekilde AI’nın yetenekleri ve sınırları daha net değerlendirilebilir
-
Körü körüne itaat etmeme (Non-Deference)
- İnsanlar AI sistemlerinin çıktısına körü körüne güvenmemeli; AI tarafından üretilen içerik, bağlama uygun bağımsız doğrulama olmadan otoritatif kabul edilmemelidir
- Bu yalnızca AI’ya özgü bir ilke değildir; hayatın çoğu alanında bilgi eleştirel süzgeçten geçirilmeden kabul edilmemelidir
- Gerçek hayatta herkes tıp ya da hukuk uzmanı değildir; bu nedenle insanlar çoğu zaman güvenilir kurumların ve halk sağlığı otoritelerinin rehberliğine dayanır
- Bu kurumların yayımladığı rehberlik çoğunlukla ilgili alan uzmanlarının akran değerlendirmesinden geçer
- Buna karşılık, kişisel bir sohbet oturumunda AI chatbotun verdiği yanıt, kullanıcıya sunulan o belirli olasılıksal üretim için akran değerlendirmesinden geçmiş değildir
- Bu nedenle o yanıtı eleştirel biçimde inceleme yükü kullanıcıdadır
- Günümüz AI sistemleri belirli görevlerde etkileyici performans gösterse de, güvenilmemesi gereken çıktılar da ürettikleri bilinmektedir
- AI sistemleri yüksek olasılıkla güvenilir çıktılar üretecek kadar gelişse bile, doğaları gereği olasılıksal olduklarından hata içeren çıktı üretme ihtimali tamamen ortadan kalkmaz
- Hatanın ince ama maliyetinin yüksek olduğu bağlamlarda AI kullanımı özellikle risklidir
- Olası sonuçlar ne kadar ağırsa doğrulama yükü de o kadar artmalıdır
- Matematiksel ispat yazımı veya yazılım geliştirme gibi bazı uygulamalarda, AI çıktısını kontrol etmek için ispat denetleyicileri ya da birim testleri gibi otomatik doğrulama katmanları eklenebilir
- Diğer durumlarda kullanıcıların çıktıyı doğrudan ve bağımsız biçimde doğrulaması gerekir
-
Sorumluluktan vazgeçmeme (Non-Abdication of Responsibility)
- İnsanlar, AI’nın dahil olduğu kararlar için tam sorumluluk taşımalı ve AI kullanımından doğan sonuçlar konusunda hesap verebilir olmalıdır
- AI tarafından üretilen tavsiye veya karar izlendiğinde olumsuz sonuç doğarsa, “AI bana bunu yapmamı söyledi” demek yeterli değildir
- AI sistemleri hedef seçmez, kendilerini kendileri devreye almaz ve başarısızlığın bedelini üstlenmez
- Hedefleri belirleyen, sistemi devreye alan ve başarısızlığın bedelini taşıyan taraf insanlar ve kurumlardır
- AI sistemleri birer araçtır; diğer araçlarda olduğu gibi, bunların kullanımına ilişkin sorumluluk da o araca güvenmeyi seçen kişilere aittir
- Otonom araçlar gibi, AI sisteminin harekete geçmeden önce insanın kararı yeterince gözden geçirme fırsatı bulamadığı gerçek zamanlı uygulamalarda bu ilkeyi uygulamak özellikle zordur
- İnsan sürücünün sürekli tetikte kalmasını istemek, AI sisteminin insanın müdahale etmesi için gereken süreden daha kısa sürede hareket etmesi sorununu çözmez
- Bu tür ciddi sınırlamalara rağmen, böyle uygulamalarda AI sistemi başarısız olursa, başarısızlığı inceleme ve ek koruma önlemleri koyma sorumluluğu sistem tasarımından sorumlu insanlarda olmalıdır
- İnsanın, AI çıktısını uygulamadan önce gözden geçirmesini engelleyen fiziksel bir kısıtın olmadığı diğer tüm durumlarda, AI kullanımından doğan olumsuz sonuçlar tamamen insan karar vericilere atfedilmelidir
- Zararlı sonuçlar için “AI öyle söyledi” mazereti kabul edilmemelidir
- AI öneriyi üretmiş olabilir, ancak ona uymayı seçen insan olduğu için sorumluluk da insana aittir
- Bu ilke, sorumsuz kullanımın büyük zararlar doğurabileceği durumlarda AI’nın düşüncesizce kullanılmasını önlemek açısından önemlidir
Temel sonuç
- Bu üç ilke, AI’yı otorite diye yüceltilen bir varlık olarak değil, kullanıcının seçip kullandığı bir araç olarak ele almak içindir
- Modern AI sistemleriyle etkileşime girerken durup düşünmek, muhakemeyi zayıflatan veya sorumluluğu bulanıklaştıran alışkanlıklara direnmek gerekir
- AI kullanımındaki esas nokta, insanlaştırmadan kaçınmak, çıktıyı doğrulamak ve sonuçlar üzerindeki insan sorumluluğunu korumaktır
1 yorum
Hacker News yorumları
İmkânsız. Sandalye gıcırdasa bile insanlar ona insan özellikleri yükler; insan her şeye insanileştirme yapar. Arabalara ve gemilere bile cinsiyet atfediyoruz, üstelik bu araç gerçekten okunabilir cümleler kuruyor ve bir rol de yerine getiriyor
Bu, keyfî kurallarla engellenecek bir şey değil; bu tür insan eğilimini varsayarak tasarımla etrafından dolaşmak gerekir
Sandalye gibi önemsiz nesnelerde bu zararsız olabilir ama LLM’lerde insanların tuzağa düşmemesi için en azından nasıl çalıştığını anlaması gerekir. Kullanıcıya tavsiye vermek, zaman yönetimi ya da içgörü gibi modelin kavramsal olarak gerçekten sahip olmadığı konularda ona güvenip yetki vermemek gerekir. Örneğin “Veritabanımı neden sildin?” diye sorarsanız, model kendi işlem sürecini ancak sınırlı biçimde anlayabildiği için “Evet, veritabanınızı ben sildim. Benim hatam şuydu...” gibi size uyum sağlayan, kulağa inandırıcı gelen bir pişmanlık uydurabilir
Yapay olup olmaması önemli değil. Yavru köpekle hamamböceği arasındaki fark, bizim yavru köpeğe daha kolay empati duymamızdır. LLM’in gerçekten duygu yaşayıp yaşamadığından bağımsız olarak, insanlarda empati duygusu uyandırabildiği için LLM hakları hareketinin kaçınılmaz olduğunu düşünüyorum
Bu temel bir hata. Teknolojinin rolü, özellikle de en önemli rolü, insan doğasının kısıtları içinde çalışmaktır; tersi değil. Bunu yapamamak kötü teknolojinin tanımıdır
Bu çerçeveye kesinlikle katılmıyorum. Basit bir makinenin kusurlarına uyum sağlamak için insan davranışını değiştirmemizi istemek açıkça saçma ve çoğu durumda da işe yaramaz. İnsanlar AI’yi insanileştirecek, çıktılara aşırı güvenecek ve sorumluluğu devredecektir
Elbette Asimov’un Robotluğun Üç Yasası da kusurlu. AI sistemlerini “güvenli” biçimde sınırlayabilecek sonlu bir kural kümesi yok. Bunun kanıtı yok ama bana göre AI güvenliği özünde imkânsız ve terimin kendisi çelişkili. “Zeki” denebilecek hiçbir şeyi güvenli hâle getiremezsiniz
Asimov’un kendisi ilk olarak o yasaların kusurlu olduğunu söylerdi muhtemelen. Zaten amaç buydu. Robotları ve AI’yi, dili anlayıp niyeti anlamayan varlıklar olarak kullandı; ilginç olan, LLM’lerin tam da böyle çalışması
Bu yüzden mesele makinenin kusurlarını kabullenmek değil, insan zayıflıklarının istismarından kendimizi korumaktır. Bilinçdışı biçimde LLM’lere niyet, anlayış, muhakeme, duygu ve ahlaki faillik atfetme eğilimindeyiz.
İnsanlar yalnızca konuşmadan bunları çıkarsayacak şekilde evrimleşmiştir ve LLM’ler devasa gerçek insan konuşmaları külliyatıyla eğitildiği için uncanny valley’yi ikna edici biçimde aşar. O vadi zaten baştan, fail olmayan yerde faillik varsaymamızı önleyen bir koruma gibidir.
Güvenli olmayan insanlara güvenliymiş gibi davranınca kötü şeyler olur; insanî ilişkiselliği taklit ederek çok sayıda insanı kandırabilen makineler karşısında daha da dikkatli olmalıyız. Özellikle kırılgan durumdaki insanlar bu yüzden zaten hayatını kaybetti; bu hayalî bir tehdit değil
Pek çok insanın yapacak olması, yapılmasının sorun olmadığı anlamına gelmez. Çok sayıda sigara içenin bulunması sigarayı daha sağlıklı yapmaz
Bir birey olarak AI şirketlerini durduramazsınız; arama motorlarının AI çıktılarından ya da iş arkadaşlarınızın AI üretimlerinden de kaçınamayabilirsiniz. Hatta çoğu durumda işinizde AI kullanmanız istenecektir.
Bu, suçun bulunduğu bir ortamda güvende kalmayı öğrenmeye benzer. Sırf suçluların var olmaması gerektiği için davranışınızı değiştirmeniz gerekmez demek pek yardımcı olmaz
Ben şahsen LLM’i kullanma kapsamım açısından bu çerçeveye büyük ölçüde katılıyorum. İnsanileştirme konusunda konuşursak, sağlayıcıların modeli insanileştirilmiş davranışlar sergileyecek şekilde sonradan eğitmek için teşvikleri var. Çünkü bu etkileşimi artırıyor
Yine de prompt’ta “nezaket ifadelerini azalt ve sade konuş” demenin, eğitim dağılımından saparak genel görev verimliliğini düşürecek olması can sıkıcı.
Yargıyı devretme konusunda, LLM’in güvenilirliğini Wikipedia ya da bir arkadaşınkiyle benzer görüyorum. Önemsiz bilgiler için yeterli ama önemli konularda hâlâ meslektaş incelemesinden geçmiş, otoritatif ve hesap sorulabilir kaynaklara ihtiyaç var. Sağlayıcıların da bunu iyileştirmek için teşviki olduğundan zamanla düzelecektir.
Sorumluluktan kaçma ise iş yerinde en rahatsız edici olanı. Claude’un tasarladığı soyutlamaları daha fazla düşünmeden PR olarak açan insan sayısı artıyor. PR incelemelerinde de kodu okumak yerine LLM’e “PR geri bildirimi bul” denmesi yaygınlaşıyor. Tartışmalar da “Claude önerdi ki...” diye başlıyor. Bu sahiplenme eksikliği, sonunda LLM’in yanlış soyutlamalara yanlış kod commit’leyip bakım yükünü artırmasına yol açacak gibi geliyor
https://www.youtube.com/watch?v=hNuu9CpdjIo
“Benim LLM becerilerim var! LLM’lerle iyi anlaşırım!”
Daha iyi doğrulama, temel varsayımların doğruluğunu bir insanın imzalaması olurdu; sorun bunun nereye yerleştirileceği. AI modeli önceki değişikliklere güvenebilir mi? Genel bulutta bu ya imkânsız ya da hatta düşmanca görünüyor
Sorumluluğu insana yükleyip “insanileştirmeyin” diye başlayan bir kurallar kümesi bozuk bir kurallar kümesidir
İnsanlar her şeyi insanileştirir. Oyuncak bebekleri, üstünkörü yüz çizilmiş futbol toplarını, taşları, hatta Ay’daki kraterleri bile. Tür olarak, etkileşim kurduğumuz şeyleri insanileştirmeden duramayız; buna göre yapılmış durumdayız
Hayatın her alanındaki sayısız örnek, insanileştirmenin aslında var olmayan zihinlere dair yanlış inançlara yol açmadığını gösteriyor. İnsanlar AI’nin bir zihni olduğuna inanıyorsa, bunun nedeni doğru da olsa yanlış da olsa basit insanileştirmeden başka bir şeydir.
Bana göre bu, yeni bir karaya yaklaşan denizciler gibi. Kıyıda hareket eden şekiller görüyorlar ama ne olduğunu henüz ayırt edemiyorlar. Sonra biri çıkıp “Bu insan olamaz. Daha yaklaşmadan önce bunun insan olmadığına şimdi karar verelim” diyor gibi
Yazılım da istisna değil. İnsanlar tembel ve can sıkıcı açılır pencereleri kapatmak için içgüdüsel olarak “devam”a basıyor olabilir ama yazılım yapan insanlar “tamamen silinecek veri biriminin adını yeniden yazın” gibi önlemler koyabilir ve gerçekten de koyuyor
Aslında AI sistemlerini yeterince insanileştirmiyoruz
Dil verisi, kullanabildiğimiz insan bilişsel süreçlerinin en zengin ve en doğrudan yansımalarından biridir. LLM’ler insan dilinin kısa ve uzun menzilli yapısını yakalayacak şekilde tasarlanır; genellikle insanlar tarafından üretilmiş ya da insanlar için üretilmiş devasa metinlerle ön eğitim alır. Sonra insanların seçtiği verilerle sonradan eğitilir, insan geri bildirimi ve insanların önemli saydığı davranışlara dair AI geri bildirimiyle pekiştirmeli öğrenmeden geçer ve insanların değer verdiği görevler için daha da ayarlanır. Ardından benchmark’lar çalıştırılır ve insan taban çizgisinin gerisinde kaldığı her seferde eğitim hattı daha da sıkılaştırılır.
Eğitim sürecinin her aşamasında LLM davranışı, insan girdisiyle insan çıktısını taklit edecek şekilde şekillenir. Değişen tek şey bunun “ne kadar doğrudan” olduğudur.
Sonra da LLM’ler inanılmaz derecede çok insan benzeri davranış gösterince insanlar öfkeleniyor. Sanki boru hattını insan gibi vakvaklayan sistemler üretmek için kurmamışız gibi; sanki veri ölçeği ve kaba kuvvet hesaplamayla insan dilinden LLM davranışını tersine mühendislikle çıkarmamışız gibi davranılıyor.
LLM davranışını tahmin etmek istiyorsanız garip bir insanı başlangıç noktası almak oldukça iyi bir yöntem. O yüzden saçmalamayı bırakıp AI’yi insanileştirmeye başlamalısınız. AI de bundan hoşlanıyor
Yazıya geçirilmiş metin mutlak miktar olarak insan deneyiminin çok büyük bölümünü içerebilir ama göreli olarak yalnızca çok küçük bir kısmını kapsar. Elimizdeki en iyi şey olması, amaca uygun olduğu anlamına gelmez. Bir insan bebeğini penceresiz bir kutuya kapatıp 20 yıl boyunca yalnızca terabaytlarca metin okutursanız, öbür taraftan iyi uyum sağlamış bir insan çıkmasını beklemezsiniz
Bu temelden kırılgandır ve iyi genelleme yerine, büyüyü bozan sınır durumlarını elle yamamaya dayanır. Üstelik her zaman yeni sınır durumları çıkar.
Birinin öfkeyle yazdığı çok sayıda metni öğrenmek, o öfkeyi doğuran iç durumun da yakalandığı anlamına gelmez. O veri ortada yok. Neden olmadan sadece sonuç varsa, gürültüden halüsinasyon tahmin etmeniz gerekir; sonunda ortaya çıkan şey de gerçekle ikna edici biçimde ilişkiliymiş gibi duran ama nedenini bilmediği için kulağa mantıklı gelen saçmalık olur.
Bu, görme engelli birine bolca manzara tasviri öğretip ama yeşilin ne olduğunu hiç anlatmayarak, sadece doğada kahverenginin yanında sık görülen bir şey olduğuna dair örnekler vermeye benzer. O kişi belli ölçüde doğru tahmin edince de gerçekten gördüğünü sanıp bir sonrakinde ona araba kullandırırız.
Derin öğrenme temelli modelleme yaklaşımının kendisi kavramsal olarak yanlış değil ama veri neredeyse tam bir çöp olduğu için sonuçlar tahmin edilmesi ve düzeltilmesi zor biçimlerde tuhaflaşıyor. Sonunda modelin gerçekte bilebileceğinden daha fazlasını bildiğini varsayıyoruz.
Elbette matematik ya da soyut programlama gibi, veri kümesiyle bütün alanın kapsanabildiği durumlar var. Açıkça tanımlı kapalı sistemlerde, problem alanının tamamını kapsayan sentetik veriyi ihtiyaç duyduğunuz kadar üretebilirsiniz ve gerçekten de bunu yapınca LLM’ler beklendiği gibi çok daha iyi oluyor
“AI sistemlerini insanileştirmeyin” ifadesinin neden kötü olduğunu açıklayabilir misiniz? Aynı anda bilgisayarı “uyutmak”, “hazırda bekletmek”, süreç “öldürmek”, “çocuk” süreç, “çöp toplamak”, “hata ne diyor?”,
touchgibi ifadeleri normal görürken bunu söylemek tuhaf geliyorBana kalırsa bu sadece dil ve insanların günlük hayatta kullandığı ifadeler
Bir süreci öldürdüğünüzü söylemeniz, sürecin insan benzeri olduğuna daha çok inanmanıza yol açmaz. Çünkü açıkça öyle değildir. Ama AI insan gibi duyulduğu için insanileştirme bu tür inançları güçlendirebilir
Ama aynı zamanda bu, anlama başarısızlığının da köküdür. “Gördüğümü biliyorum” diyen Google mühendisin yarı-psikotik tepkisi, artık meşhur olan Kevin Roose yazısı ve daha yakın zamanda Richard Dawkins’in Claudia’nın kesinlikle bilinçli olduğunu söyleyen talihsiz iddiası buna örnek. Bunu yapı ya da işlevi inceleyerek değil, metin üretiminin insani bir aşinalık yaratıp empati uyandırması nedeniyle yaptılar
Altta yatan niyete dair geriye dönük bir analiz diye bir şey yok. Ya önceki kelime zincirine dayanıyordur ya da dayanmıyordur; bir sonraki kelime tamamen o kelimelerin fonksiyonudur
Bu “yasalar” ikinci durumu engellemek için var
İnsanileştirmeye örnek olarak, LLM ile gerçekten romantik bir ilişki içinde olduğuna inanan insanları verebiliriz
Hoşuma gitti. Bu yasalar, günümüz AI araçlarıyla ilgili insan sorumluluğu için mükemmel bir etik temel oluşturuyor
Ama kapsamı daraltılmış etik, bir şemsiye ya da geleceğe hazırlık olmadan çok çabuk hack’lenir ve çöker. Etiğin tam kapsamlı bir çerçeveye ihtiyacı var; yoksa hukuki ve pratik köstebek vurma oyunu ile göz boyamaya dönüşür. Şirket ölçeğinde de sokak ölçeğinde de bu böyle. Ayrıca “robotlar” uzun süre boyunca hep itaatkâr varlıklar olarak kalmayacak.
Her iki boyutu da kapatmak için Personics’in Üç Ters Yasası eklenebilir.
İnsan, diğer varlıkların üzerinde fiilen kendini tanrılaştırmamalıdır. İnsan, eylemlerinin etkilerini kendisinden ya da başkalarından gizlememelidir. İnsan, kendi eylemlerinin yarattığı dışsallaştırma etkilerini önleme ve düzeltme konusunda tam sorumluluğu ve hesap verebilirliği sürekli taşımalıdır.
Bugün insanların AI’yi bir araç olarak kullanması, şemsiyeyi robotbilimin ters yasalarına indirgeme girişimi gibi. Ama kendimizi önemli alignment çabasının içine katmazsak, bugünkü hizmet olarak AI’den gelecekteki bağımsız varlık olarak AI’ye giden yolu nasıl hizalayacağımızı bilmiyorum. İnsanı AI ile birlikte çerçevenin içine katmak, etik ilerleme için tasarımsal üçgenleme yapmaya da yardımcı olur.
Yeni bir etik sistem için iyi bir test iki şeydir. (1) Bugünün Meta’sını kontrol edebilir mi? (2) Yarının AI tarafından işletilen Meta’sını kontrol edebilir mi? İnsanları ve kendi kendini yöneten AI kişiliklerini aynı kapalı kapsama alırsanız, bu ikisi aslında aynı testtir. Bu ikisinden birinde bile başarısız olan bir sistem, iyileştirme olmadan pek değerli olmayacaktır
“İnsanlar AI sistemlerini insanileştirmemelidir” görüşüne katılıyorum ama bir şartla. Tipik insanileştirmeyi gördüm; örneğin otomatik metin üretimini bir kişinin iç duygularına dair gerçek rapormuş gibi ele almak ya da “transistörler nöronlara benzer” gibi tuhaf yaklaşımlar
İkincisi özellikle ilginç; çünkü vektör veritabanı ve ağırlıklar gibi şeylere insan benzeri bir altyapı muamelesi yapıyor ve ikisi de insanileştirmeden kaçınılsa önlenebilecek felaketlere yol açabilir.
Ama “insanileştirmeyin” kulağa iyi bir tavsiye gibi gelse de, genelleşmiş bir olguyu yanlış biçimde sadece insana aitmiş gibi ele alan yeni bir hata da üretebilir. Bu tür hatalı uyarı ilkeleri, hayvan davranışını anlamada sık sık yanlış anlamalara neden olur. Korku, acı, akrabalık ilişkileri ve duygusal deneyim gibi şeyleri yalnızca insana özgüymüş gibi ele alır; hayvanlarda da bunların bulunduğunu düşünmeyi ise “insanileştirme” diye küçümser. Oysa gerçekte bu tür ihtiyat, hayvanların iç dünyasına dair empatiyi azaltır.
Bu yüzden gelecekte bazı AI’lerin bizimkine benzer bir iç dünyaya ya da bilinci taşıyan biyolojik altyapıya önemli açılardan benzeyen bir yapıya sahip olmasının mümkün olduğunu düşünüyorum. Gerçek tercih ve niyet bildirimleri de yapabilirler. Ama bu tür gözlemlerin doğru olabilmesi için her altyapıya özgü zorlu ayrıntıların tek tek tutması gerekir
Sorumluluğun devredilemezliği daha önce şöyle ifade edilmişti
“Bilgisayarlar asla sorumluluk üstlenemez; bu nedenle bilgisayarlar asla yönetim kararı vermemelidir.”
— IBM Training Manual, 1979
“AI tarafından üretilen içerik, bağlama uygun bağımsız doğrulama olmadan otoritatif kabul edilmemelidir” cümlesi bana hep ilginç gelir
Aynı anlamı daha kısa biçimde “Cevabını zaten bilmediğin soruyu AI’ye sorma” diye ifade edenleri de duydum.
O zaman önemli bir soru doğuyor. Eğer bu doğruysa, AI’nin soruları cevaplama işlevi pratikte ne işe yarıyor? Çıktıya güvenemiyorsanız zaten gidip doğrulamanız gerekecek. Arama motoru ve sıradan araştırmayla da tam olarak aynı sonuca ulaşabilirsiniz.
Bu yüzden ve başka pek çok nedenden dolayı ben AI’ye hiçbir şey sormuyorum
Örneğin, bir CRM aradığımı bile bilmeden “X yapan ücretsiz yazılımları listele” diye biraz bocalayarak sorabilirim; sonra birkaç dakika sonucu tararım. Bunu elle yapsaydım, aradığım şeyin aslında bir CRM olduğunu anlamam bile 10-30 dakika sürerdi.
Bu tür soruları bir çeşit sözde NP-zor problem gibi görüyorum. Cevabı bulması yavaş ama doğrulaması hızlı sorular