7 puan yazan xguru 2023-03-13 | 1 yorum | WhatsApp'ta paylaş
  • OpenAI alignment ekibinin lideri Jan Leike'ın blogda yayımladığı yazının DeepL ile çevrilmiş hali
  • Alignment, "bir yapay zeka sistemini bir insana hizalamak" anlamına geliyor
  • Buna göre hizalamanın iki kategorisi var: "bireysel tercihler (herkes kendisine hizalanmış bir yapay zeka ister)" ve "kolektif tercihler (yapay zeka hangi amaçlarla kullanılabilmeli ve varsayılan davranışı ne olmalı?)"
  • Bu yazı ikinci kategoriyle ilgili

Öneri: simüle edilmiş müzakereci demokrasi

  • Temel fikir, büyük dil modellerini "müzakereci demokrasi"yi taklit edecek şekilde eğitmek için kullanmak
    • Müzakereci demokrasi, rastgele seçilmiş az sayıdaki yurttaşın ('mini public') açıkça müzakere ettiği bir karar alma veya politika belirleme süreci
  • Simüle edilmiş müzakereci demokrasinin nasıl kurulacağı
    • değer soruları veri kümesi toplama
    • insanların müzakere kayıtları
    • arka plan koşullu taklit öğrenimi
    • simülasyon: yeni değerlerle ilgili sorular

1 yorum

 
xguru 2023-03-13

Seungjoon Choi'nin "Bu yazının bağlamına dair ek açıklama" metnini de birlikte okumanızı tavsiye ederim. (Belgenin baş kısmında da bağlantı bulunuyor)
https://facebook.com/seungjoon.choi/posts/…