- İnsan mühendisliğine bağımlılığı azaltmak için kendi öğrenme ve problem çözme sürecini kendi başına geliştiren öz referanslı bir AI ajan sistemi; mevcut özyinelemeli kendini geliştirme yaklaşımlarındaki sabit meta mekanizma sınırlarını aşmayı hedefliyor
- Görev ajanını (hedef görevi yerine getirme) ve meta ajanı (kendini ve görev ajanını değiştirme) tek bir düzenlenebilir programda birleştiren yapı
- Mevcut Darwin Gödel Machine (DGM) yalnızca kodlama alanında kendini geliştirebilirken, HyperAgents bunu kodlama, makale değerlendirmesi, robotik ve matematik puanlama gibi çeşitli alanlara genişletiyor
- Meta düzeydeki değiştirme prosedürünün kendisi de düzenlenebilir olduğundan, iyileştirme mekanizmasını iyileştiren üstbilişsel öz değişim temel ayırt edici özellik olarak öne çıkıyor
- Meta düzeydeki iyileştirmelerin alanlar arasında aktarılabildiği ve çalıştırmalar boyunca birikebildiği deneysel olarak doğrulandı; bu da genel amaçlı, kendi kendini hızlandıran AI sistemlerinin olasılığını gösteren bir araştırma sunuyor
Mevcut kendini geliştirme sistemlerinin sınırları
- Kendini geliştiren AI sistemlerinin amacı, insan mühendisliğine bağımlılığı azaltmak için öğrenme ve problem çözme sürecinin kendisini otomatik olarak iyileştirmek
- Mevcut özyinelemeli kendini geliştirme yaklaşımları sabit ve elle oluşturulmuş meta düzey mekanizmalara dayandığı için, sistemin gelişebileceği hızda temel bir sınır bulunuyor
Darwin Gödel Machine (DGM) ve kodlama alanı kısıtı
- DGM (Zhang et al., 2025b), kodlama alanında açık uçlu kendini geliştirmenin mümkün olduğunu göstermiş bir sistem
- Tek bir kodlama ajanıyla başlayıp öz değiştirilmiş varyantları tekrar tekrar üretip değerlendiriyor ve gelecekteki iyileştirmeler için bir basamak taşı arşivini genişletiyor
- Hem değerlendirme hem de öz değişim kodlama görevi olduğu için, kodlama becerisindeki artış doğrudan kendini geliştirme becerisindeki artışa dönüşüyor
- Ancak bu tür alana özgü hizalanma (domain-specific alignment), kodlama dışındaki alanlarda genel olarak geçerli değil
HyperAgents çerçevesinin yapısı
- HyperAgents, iki bileşeni tek bir düzenlenebilir programda birleştiren bir öz referanslı ajan (self-referential agent)
- Görev ajanı (task agent): hedef görevi çözmekten sorumlu
- Meta ajan (meta agent): kendisini ve görev ajanını değiştirmekten sorumlu
- Temel nokta, meta düzeydeki değiştirme prosedürünün kendisinin de düzenlenebilir olması; bu da üstbilişsel öz değişimi (metacognitive self-modification) mümkün kılıyor
- Yalnızca görev çözme davranışı değil, gelecekteki iyileştirmeleri üreten mekanizmanın kendisi de geliştirilebiliyor
DGM-Hyperagents (DGM-H)
- DGM genişletilerek DGM-Hyperagents (DGM-H) biçimine dönüştürüldü
- İyileştirme prosedürünün kendisinin evrimleşmesine izin verilerek, görev performansı ile öz değişim yeteneği arasındaki alana özgü hizalanma varsayımı ortadan kaldırılıyor
- Teorik olarak hesaplanabilir her türlü görevde kendi kendini hızlandıran ilerlemeyi destekleme potansiyeli taşıyor
Deney sonuçları ve alan kapsamı
- Kodlama, makale değerlendirmesi, robotik ödül tasarımı ve olimpiyat düzeyinde matematik çözümü puanlama dahil çeşitli alanlarda deneyler yürütüldü
- DGM-H zaman içinde performansını sürekli olarak artırdı
- Kendini geliştirme veya açık uçlu keşif içermeyen temel modellerin yanı sıra mevcut DGM'ye kıyasla daha üstün performans gösterdi
Meta düzey iyileştirmelerin aktarımı ve birikimi
- DGM-H'nin yeni ajanlar üretme sürecinin kendisini geliştirdiği doğrulandı
- Örnek: kalıcı bellek (persistent memory), performans takibi (performance tracking) gibi meta düzey iyileştirmeler ortaya çıkardı
- Bu meta düzey iyileştirmeler alanlar arasında aktarılabiliyor (transfer across domains) ve çalıştırmalar arasında birikebiliyor (accumulate across runs)
Güvenlik değerlendirmeleri
- Tüm deneyler sandboxing, insan gözetimi gibi güvenlik önlemleri altında gerçekleştirildi
- Kendini geliştiren sistemler bağlamında güvenliğin ne anlama geldiğine ve kendini geliştiren sistemlerin daha geniş sonuçlarına dair tartışmalar da yer alıyor
Önemi
- DGM-Hyperagents, yalnızca daha iyi çözümler arayan değil, iyileştirme yönteminin kendisini sürekli olarak geliştiren açık uçlu bir AI sistemi olasılığını ortaya koyuyor
Henüz yorum yok.