Aşırı Verimliliğin Yan Etkileri (2022)
(sohl-dickstein.github.io)Aşırı yüksek verimlilik her şeyi kötüleştirir: aşırı uyum ve Goodhart yasasının güçlü versiyonu
Verimlilik arttığında sonuçlar paradoksal biçimde kötüleşebilir. Bu, neredeyse her yerde geçerlidir. Bu olguya Goodhart yasasının güçlü versiyonu diyelim. Örneğin, öğrencilerin başarısının standart testlerle merkezi olarak izlenmesi iyi bir fikir gibi görünebilir, ancak bu okulları sınava hazırlığa odaklanmaya iterek genel eğitim sonuçlarını kötüleştirebilir. Siyaset, ekonomi, sağlık, bilim gibi birçok alanda da benzer örnekler vardır.
Aşırı uyum ve Goodhart yasası
- Aşırı uyum: Makine öğreniminde hedefi doğrudan tutturamadığımız için benzer bir vekil ölçüt kullanarak modeli eğitiriz. Başlangıçta vekil ölçüt iyileşirken hedef de iyileşir, ancak optimizasyona devam edildiğinde vekil ölçüt daha iyi hale gelse bile hedef artık iyileşmez. Buna aşırı uyum denir.
- Goodhart yasası: Bir ölçüm hedef haline geldiğinde artık iyi bir ölçüm olmaktan çıkar. Bu yalnızca ekonomide değil, çeşitli alanlarda da geçerlidir.
Goodhart yasasının güçlü versiyonu: Fazla verimli hale geldiğimizde önem verdiğimiz şey kötüleşir
- Vekil hedefi sürekli optimize etmek, asıl hedefin kötüleşmesine yol açabilir. Bu, makine öğreniminde çok yaygın bir olgudur.
- Goodhart yasasının güçlü versiyonu: Bir ölçüm hedefe dönüştüğünde ve etkili biçimde optimize edildiğinde, ölçmeye çalıştığı şey kötüleşir.
Verimlilik artışı ve aşırı uyum her yerdedir
- Verimlilik arttıkça toplum genelinde olumlu ya da olumsuz sonuçlar ortaya çıkabilir.
- Örnekler:
- Hedef: Çocukları iyi eğitmek
- Vekil ölçüt: Standart test puanları
- Sonuç: Yalnızca sınava hazırlığa odaklanıldığı için gerçek eğitimin kalitesi düşer
- Hedef: Bilimin hızla ilerlemesi
- Vekil ölçüt: Yayın sayısına bağlı primler
- Sonuç: Hatalı araştırma sonuçlarının yayımlanmasında artış
- Hedef: Sağlıklı bir nüfus
- Vekil ölçüt: Besleyici gıdaya erişim
- Sonuç: Obezite sorunu
- Hedef: Çocukları iyi eğitmek
Aşırı uyumu ve Goodhart yasasının güçlü versiyonunu hafifletme yolları
- Vekil hedeflerle istenen sonuçları daha iyi hizalamak: Makine öğreniminde, test durumuna benzer eğitim örnekleri toplanır. Toplumsal sistemlerde ise yasalar, teşvikler ve toplumsal normlar değiştirilerek hedefle daha iyi uyum sağlanır.
- Regularization cezası eklemek: Makine öğreniminde parametrelerin büyüklüğü küçük tutulur. Toplumsal sistemlerde karmaşıklık azaltılır veya ek maliyetler getirilir.
- Sisteme gürültü enjekte etmek: Makine öğreniminde girdilere, parametrelere ve iç durumlara rastgele gürültü eklenir. Toplumsal sistemlerde ise öngörülebilirliği azaltmak için rastgele unsurlar eklenir.
- Erken durdurma: Makine öğreniminde doğrulama kaybı kötüleşmeye başladığında eğitim durdurulur. Toplumsal sistemlerde karar verme süresi sınırlandırılır veya piyasa faaliyetleri durdurulur.
- Yetenek/kapasite sınırlaması: Makine öğreniminde model küçük tutularak aşırı uyum önlenir. Toplumsal sistemlerde organizasyonların veya aktörlerin kapasitesi sınırlandırılır.
- Yetenek/kapasite artışı: Makine öğreniminde model çok büyük yapılarak aşırı uyum önlenir. Toplumsal sistemlerde ise hedef ile vekil ölçüt arasındaki ödünleşimi ortadan kaldırmak için kapasite büyük ölçüde artırılır.
Son düşünceler
Goodhart yasasının güçlü versiyonu, yapay zeka konusundaki kişisel korkularımın temel nedenidir. Yapay zeka neredeyse her görevde verimliliği artırabilir. Bu sorunu çözmeye yönelik çok sayıda araştırma fırsatı vardır. Toplumsal sistemler Goodhart yasasının güçlü versiyonu nedeniyle çökerse, bunu düzeltmek için rasyonel adımlar atmak zorlaşır. Bu olguyu adlandırmak ve daha iyi anlamak faydalı olacaktır.
GN⁺ özeti
- Goodhart yasasının güçlü versiyonu, verimlilik arttığında hedeflerin kötüleşebileceğini açıklar.
- Makine öğrenimindeki aşırı uyum olgusuna benzer ve çeşitli alanlara uygulanabilir.
- Sorun, vekil hedeflerle gerçek hedefleri daha iyi hizalamak, regularization cezası eklemek ve sisteme gürültü enjekte etmek gibi yöntemlerle hafifletilebilir.
- Yapay zekanın verimlilik artışı çeşitli yan etkilere yol açabilir ve bunları çözmek için araştırma gerekir.
- Toplumsal sistemlerin çökmesini önlemek için Goodhart yasasının güçlü versiyonunu anlamak ve buna karşılık vermek önemlidir.
2 yorum
Ülkemizdeki CSAT sınavının, başlangıçtaki matematiksel yetkinliği ölçme amacından uzaklaşıp yalnızca not dilimi eşiklerinin dağıtımını daha verimli hale getirmeye çalışan bir sisteme dönüştüğünü duydum. Bu, Goodhart yasasından kaçamayan bir örnek gibi görünüyor.
Hacker News görüşü
Jascha, Google Brain'de çalışmış parlak bir ML araştırmacısı ve şu anda Anthropic'te
Goodhart yasası, bir ölçüm hedef haline geldiğinde artık iyi bir ölçüm olmaktan çıktığını söyler
İsveç'te son 20 yılda toplumsal bir sorun olarak öne çıktı
Egzersiz fizyolojisinde de benzer bir yasa var
Kuyruk teorisinde de ilgili bir yasa bulunuyor
GDP'ye odaklanmayı sevmiyorum
Bu yasanın bir örneğini yerel bir hırdavat mağazasında gördüm
Zincir restoranları ziyaret ederken benzer bir deneyim yaşıyorum
Yazarın adını hatırladım
Etki var ama örnekler tam isabetli değil