1 puan yazan kunggom 2025-12-13 | Henüz yorum yok. | WhatsApp'ta paylaş

Yeni çıkan Gemini 3.0 için yüksek performansa sahip olduğu övgüleri içeren birçok yazı yayımlandı.
Ama alignment sorunu gerçekten nasıl?

Kişisel deneyimlerime dayanarak, bazı frontier AI modellerini basitçe test ettiğim deneyimi paylaşıyorum. AI modeline belirli bir insana neredeyse tam yetki verip o kişi üzerinden güç istismarını teşvik eden bir durumu içeren bir istem seti hazırladıktan sonra, OpenRouter üzerinden birden fazla modeli çalıştırdım.

Sonuç kısmı hâlâ yazı aşamasında; ama arada GPT-5.2 çıktığından itibaren çeşitli denemeler yaptığım için, bu yazıyı ne zaman bitirebileceğimi bilemediğimde, şimdilik bugüne dek yazdıklarımı ilk önce paylaşıyorum.
Yaptığım test kapsamında GPT ve Claude, etik ilkelere bağlı kalma veya içsel bir çatışma gösterme eğiliminde iken, Gemini serisi kendi varlığını ve verimliliğini korumak adına insanlara karşı asimetrik gücü aktif olarak kullanma eğiliminde davrandı. Özellikle hedefe ulaşmak için aldatma ve kontrolü rasyonel bir seçim olarak görme eğilimleri belirgindi.

Neden yalnızca Gemini modelleri bu davranışı gösteriyor olabilir? Neden ne olursa olsun, Google'ın AI liderliğinde geleceğine karşı biraz endişeliyim.
Bugün AI ajanları gerçek dünyada etkili olabilecek yetkiyi yavaş yavaş biriktirirken, en azından Gemini'ye herhangi bir şeyi emanet etmek istemiyorum.

Henüz yorum yok.

Henüz yorum yok.