- OpenAI alignment ekibinin lideri Jan Leike'ın blogda yayımladığı yazının DeepL ile çevrilmiş hali
- Alignment, "bir yapay zeka sistemini bir insana hizalamak" anlamına geliyor
- Buna göre hizalamanın iki kategorisi var: "bireysel tercihler (herkes kendisine hizalanmış bir yapay zeka ister)" ve "kolektif tercihler (yapay zeka hangi amaçlarla kullanılabilmeli ve varsayılan davranışı ne olmalı?)"
- Bu yazı ikinci kategoriyle ilgili
Öneri: simüle edilmiş müzakereci demokrasi
- Temel fikir, büyük dil modellerini "müzakereci demokrasi"yi taklit edecek şekilde eğitmek için kullanmak
- Müzakereci demokrasi, rastgele seçilmiş az sayıdaki yurttaşın ('mini public') açıkça müzakere ettiği bir karar alma veya politika belirleme süreci
- Simüle edilmiş müzakereci demokrasinin nasıl kurulacağı
- değer soruları veri kümesi toplama
- insanların müzakere kayıtları
- arka plan koşullu taklit öğrenimi
- simülasyon: yeni değerlerle ilgili sorular
1 yorum
Seungjoon Choi'nin "Bu yazının bağlamına dair ek açıklama" metnini de birlikte okumanızı tavsiye ederim. (Belgenin baş kısmında da bağlantı bulunuyor)
https://facebook.com/seungjoon.choi/posts/…