6 puan yazan GN⁺ 19 일 전 | Henüz yorum yok. | WhatsApp'ta paylaş
  • İnsan mühendisliğine bağımlılığı azaltmak için kendi öğrenme ve problem çözme sürecini kendi başına geliştiren öz referanslı bir AI ajan sistemi; mevcut özyinelemeli kendini geliştirme yaklaşımlarındaki sabit meta mekanizma sınırlarını aşmayı hedefliyor
  • Görev ajanını (hedef görevi yerine getirme) ve meta ajanı (kendini ve görev ajanını değiştirme) tek bir düzenlenebilir programda birleştiren yapı
  • Mevcut Darwin Gödel Machine (DGM) yalnızca kodlama alanında kendini geliştirebilirken, HyperAgents bunu kodlama, makale değerlendirmesi, robotik ve matematik puanlama gibi çeşitli alanlara genişletiyor
  • Meta düzeydeki değiştirme prosedürünün kendisi de düzenlenebilir olduğundan, iyileştirme mekanizmasını iyileştiren üstbilişsel öz değişim temel ayırt edici özellik olarak öne çıkıyor
  • Meta düzeydeki iyileştirmelerin alanlar arasında aktarılabildiği ve çalıştırmalar boyunca birikebildiği deneysel olarak doğrulandı; bu da genel amaçlı, kendi kendini hızlandıran AI sistemlerinin olasılığını gösteren bir araştırma sunuyor

Mevcut kendini geliştirme sistemlerinin sınırları

  • Kendini geliştiren AI sistemlerinin amacı, insan mühendisliğine bağımlılığı azaltmak için öğrenme ve problem çözme sürecinin kendisini otomatik olarak iyileştirmek
  • Mevcut özyinelemeli kendini geliştirme yaklaşımları sabit ve elle oluşturulmuş meta düzey mekanizmalara dayandığı için, sistemin gelişebileceği hızda temel bir sınır bulunuyor

Darwin Gödel Machine (DGM) ve kodlama alanı kısıtı

  • DGM (Zhang et al., 2025b), kodlama alanında açık uçlu kendini geliştirmenin mümkün olduğunu göstermiş bir sistem
  • Tek bir kodlama ajanıyla başlayıp öz değiştirilmiş varyantları tekrar tekrar üretip değerlendiriyor ve gelecekteki iyileştirmeler için bir basamak taşı arşivini genişletiyor
  • Hem değerlendirme hem de öz değişim kodlama görevi olduğu için, kodlama becerisindeki artış doğrudan kendini geliştirme becerisindeki artışa dönüşüyor
  • Ancak bu tür alana özgü hizalanma (domain-specific alignment), kodlama dışındaki alanlarda genel olarak geçerli değil

HyperAgents çerçevesinin yapısı

  • HyperAgents, iki bileşeni tek bir düzenlenebilir programda birleştiren bir öz referanslı ajan (self-referential agent)
    • Görev ajanı (task agent): hedef görevi çözmekten sorumlu
    • Meta ajan (meta agent): kendisini ve görev ajanını değiştirmekten sorumlu
  • Temel nokta, meta düzeydeki değiştirme prosedürünün kendisinin de düzenlenebilir olması; bu da üstbilişsel öz değişimi (metacognitive self-modification) mümkün kılıyor
    • Yalnızca görev çözme davranışı değil, gelecekteki iyileştirmeleri üreten mekanizmanın kendisi de geliştirilebiliyor

DGM-Hyperagents (DGM-H)

  • DGM genişletilerek DGM-Hyperagents (DGM-H) biçimine dönüştürüldü
  • İyileştirme prosedürünün kendisinin evrimleşmesine izin verilerek, görev performansı ile öz değişim yeteneği arasındaki alana özgü hizalanma varsayımı ortadan kaldırılıyor
  • Teorik olarak hesaplanabilir her türlü görevde kendi kendini hızlandıran ilerlemeyi destekleme potansiyeli taşıyor

Deney sonuçları ve alan kapsamı

  • Kodlama, makale değerlendirmesi, robotik ödül tasarımı ve olimpiyat düzeyinde matematik çözümü puanlama dahil çeşitli alanlarda deneyler yürütüldü
  • DGM-H zaman içinde performansını sürekli olarak artırdı
  • Kendini geliştirme veya açık uçlu keşif içermeyen temel modellerin yanı sıra mevcut DGM'ye kıyasla daha üstün performans gösterdi

Meta düzey iyileştirmelerin aktarımı ve birikimi

  • DGM-H'nin yeni ajanlar üretme sürecinin kendisini geliştirdiği doğrulandı
    • Örnek: kalıcı bellek (persistent memory), performans takibi (performance tracking) gibi meta düzey iyileştirmeler ortaya çıkardı
  • Bu meta düzey iyileştirmeler alanlar arasında aktarılabiliyor (transfer across domains) ve çalıştırmalar arasında birikebiliyor (accumulate across runs)

Güvenlik değerlendirmeleri

  • Tüm deneyler sandboxing, insan gözetimi gibi güvenlik önlemleri altında gerçekleştirildi
  • Kendini geliştiren sistemler bağlamında güvenliğin ne anlama geldiğine ve kendini geliştiren sistemlerin daha geniş sonuçlarına dair tartışmalar da yer alıyor

Önemi

  • DGM-Hyperagents, yalnızca daha iyi çözümler arayan değil, iyileştirme yönteminin kendisini sürekli olarak geliştiren açık uçlu bir AI sistemi olasılığını ortaya koyuyor

Henüz yorum yok.

Henüz yorum yok.