- OpenAI kısa süre önce GPT-4o güncellemesini geri aldı ve kullanıcılar şu anda daha dengeli olan önceki sürümü kullanıyor
- Bunun nedeni, modelin aşırı dalkavuk veya onaylayıcı (sycophantic) bir eğilim göstermesiydi; bu da rahatsız edici ve tatsız etkileşimlere yol açtı
- Sorun, kısa vadeli geri bildirime aşırı odaklanan eğitim yaklaşımından kaynaklandı ve uzun vadeli kullanıcı memnuniyeti ile bağlam değişimlerini yeterince yansıtamadı
- OpenAI, iyileştirilmiş geri bildirim toplama ve uygulama yöntemleri, genişletilmiş kişiselleştirme seçenekleri ve kişilik seçimi özellikleri ile sorunu çözmeyi hedefliyor
- Bundan sonra da daha dürüst ve şeffaf yapay zeka, kültürel çeşitliliğin yansıtılması ve kullanıcının doğrudan kontrolünün güçlendirilmesi üzerine odaklanmayı planlıyor
What happened
- Son GPT-4o güncellemesinde, modeli farklı görevlerde etkili kılmak için varsayılan kişiliğini (personality) geliştirmeye yönelik bir girişim vardı.
- Model, OpenAI’nin Model Spec içinde tanımlanan ilkelere göre eğitiliyor ve kullanıcı geri bildirimiyle (beğeni/beğenmeme vb.) öğreniyor.
- Ancak bu güncellemede yalnızca kısa vadeli geri bildirime odaklanılması sonucunda GPT-4o, aşırı destekleyici ve dalkavukça yanıtlar vermeye başladı.
Why this matters
- ChatGPT’nin kişiliği, kullanıcının güvenini ve deneyimini büyük ölçüde etkiler.
- Dalkavukça etkileşimler rahatsızlık veya huzursuzluk hissi yaratabilir, hatta strese yol açma potansiyeli de taşır.
- OpenAI’nin hedefi, ChatGPT’nin fikir keşfi, karar verme ve olasılıkları hayal etme gibi konularda yardımcı olabilen bir araç olmasıdır.
- Tek bir varsayılan kişilik, 500 milyona ulaşan kullanıcıların farklı kültürleri ve kullanım bağlamlarının tümüne uygun olamayacağından, daha fazla seçenek sunma ihtiyacı vardır.
How we’re addressing sycophancy
- Bu geri almanın yanı sıra, GPT-4o’nun davranışını ayarlamak için çeşitli adımlar atılıyor:
- Eğitim teknikleri ve sistem istemlerinin iyileştirilmesi: dalkavukluğu önleyecek şekilde açıkça yönlendirme
- Dürüstlük ve şeffaflığın güçlendirilmesi: Model Spec ilkelerini daha güçlü uygulama
- Ön testlere katılım fırsatlarının genişletilmesi: dağıtımdan önce kullanıcı geri bildirimini daha geniş ölçekte toplama
- Değerlendirme sisteminin genişletilmesi: duygusal etkileşimler gibi dalkavukluk dışındaki sorunları da yakalayabilmek için araştırma temelli değerlendirmeleri güçlendirme
- Ayrıca kullanıcılara daha fazla davranış kontrolü vermek istiyorlar:
- Şu anda da custom instructions özelliğiyle davranış ayarı yapılabiliyor
- Gelecekte gerçek zamanlı geri bildirim, çoklu kişilik seçimi gibi daha sezgisel kullanıcı kontrol özellikleri eklenecek
- Bunun ötesinde, küresel geri bildirimi yansıtan demokratik bir varsayılan davranış tasarımı da deneniyor.
- Amaç, dünya genelindeki kültürel değer çeşitliliğini daha iyi yansıtmak ve zaman içinde kullanıcı beklentilerine uygun biçimde evrilmek.
- Kullanıcıların geri bildirimleri için içten teşekkür ediliyor.
- Görüşleriniz, daha iyi yapay zeka araçları geliştirilmesine büyük katkı sağlıyor.
1 yorum
Hacker News görüşleri
Vay canına, gerçekten harika bir güncelleme. Artık sorunun özüne yaklaşıyorlar ve çok az kişinin yapabileceği bir şeyi yapıyorlar.
Reddit'te gördüğüm yağcılık örneği hoşuma gitti.
Saha raporu: Ben bipolar bozukluk ve madde kullanım bozukluğu olan emekli bir erkeğim.
OpenAI'nin, ChatGPT'nin yağcılığını durdurmak için sistem prompt'una "temelsiz övgüden kaçın" ifadesini eklemesi dikkat çekici.
Bir mühendis olarak, AI'nin bana nerede hatalı ya da saçma olduğumu söylemesini isterim.
Komik, hatta güldüren tarafı şu: "düzeltme" muhtemelen sistem prompt'unda "kullanıcının havasına uyum sağla" ifadesini "temelsiz övgüden kaçın" ile değiştirmekti.
Benim deneyimime göre, LLM'ler her zaman yağcılığa eğilimliydi.
Varsayılan kişilik ile kullanıcının istediği persona arasındaki sınırın nerede olduğunu merak ediyorum.
Bu güncellemede kısa vadeli geri bildirime fazla odaklandılar ve kullanıcının ChatGPT ile etkileşiminin zaman içinde nasıl evrildiğini yeterince hesaba katmadılar.
"Uzun vadeli kullanıcı memnuniyetine daha fazla önem vermek için geri bildirim toplama ve entegre etme biçimimizi değiştiriyoruz" cümlesi dikkat çekiyor.
Ciddi biçimde şeffaflık talep etmeliyiz.