Toplumsal değerlerin benimsenmesi için bir öneri: dil modelleriyle tutarlı biçimde akıl yürütebilen irade inşa etmek [Çeviri]

xguru · 2023-03-13T10:56:01+09:00

OpenAI alignment ekibinin lideri Jan Leike'ın blogda yayımladığı yazının DeepL ile çevrilmiş hali Alignment, "bir yapay zeka sistemini bir insana hizalamak" anlamına geliyor Buna göre hizalamanın iki kategorisi var: "bireysel tercihler (herkes kendisine hizalanmış bir yapay zeka ister)" ve "kolektif tercihler (yapay zeka hangi amaçlarla kullanılabilmeli ve varsayılan davranışı ne olmalı?)" Bu yazı ikinci kategoriyle ilgili Öneri: simüle edilmiş müzakereci demokrasi Temel fikir, büyük dil modellerini "müzakereci demokrasi"yi taklit edecek şekilde eğitmek için kullanmak Müzakereci demokrasi, rastgele seçilmiş az sayıdaki yurttaşın ('mini public') açıkça müzakere ettiği bir karar alma veya politika belirleme süreci Simüle edilmiş müzakereci demokrasinin nasıl kurulacağı değer soruları veri kümesi toplama insanların müzakere kayıtları arka plan koşullu taklit öğrenimi simülasyon: yeni değerlerle ilgili sorular

(docs.google.com)

7 puan yazan xguru 2023-03-13 | 1 yorum | WhatsApp'ta paylaş

OpenAI alignment ekibinin lideri Jan Leike'ın blogda yayımladığı yazının DeepL ile çevrilmiş hali
Alignment, "bir yapay zeka sistemini bir insana hizalamak" anlamına geliyor
Buna göre hizalamanın iki kategorisi var: "bireysel tercihler (herkes kendisine hizalanmış bir yapay zeka ister)" ve "kolektif tercihler (yapay zeka hangi amaçlarla kullanılabilmeli ve varsayılan davranışı ne olmalı?)"
Bu yazı ikinci kategoriyle ilgili

Öneri: simüle edilmiş müzakereci demokrasi

Temel fikir, büyük dil modellerini "müzakereci demokrasi"yi taklit edecek şekilde eğitmek için kullanmak
- Müzakereci demokrasi, rastgele seçilmiş az sayıdaki yurttaşın ('mini public') açıkça müzakere ettiği bir karar alma veya politika belirleme süreci
Simüle edilmiş müzakereci demokrasinin nasıl kurulacağı
- değer soruları veri kümesi toplama
- insanların müzakere kayıtları
- arka plan koşullu taklit öğrenimi
- simülasyon: yeni değerlerle ilgili sorular

1 yorum

xguru 2023-03-13

Seungjoon Choi'nin "Bu yazının bağlamına dair ek açıklama" metnini de birlikte okumanızı tavsiye ederim. (Belgenin baş kısmında da bağlantı bulunuyor)
https://facebook.com/seungjoon.choi/posts/…

Toplumsal değerlerin benimsenmesi için bir öneri: dil modelleriyle tutarlı biçimde akıl yürütebilen irade inşa etmek [Çeviri]

Öneri: simüle edilmiş müzakereci demokrasi

İlgili okumalar

1 yorum