Paperclip ve Gastown’dan ilham alan, “perpetual engine” konseptli açık kaynak AI ajan çerçevesi
(github.com/greatsk55)Merhaba,
Paperclip ve Gastown’dan ilham alarak, yalnızca token olduğu sürece yapay zekanın işi kendi kendine sürdürüp ürünü büyüttüğü “perpetual engine” konseptine sahip açık kaynak bir ajan çerçevesi geliştirdim.
Temel fikir basit:
Yapay zekaya tek seferlik bir çağrı olarak değil, sürekli çalışan bir sistem olarak bakmak.
Bu çerçeve:
Görevleri kendi kendine üretir
Öncelikleri ayarlar
Sonuçları değerlendirir
Bir sonraki aksiyonu sürdürür
Yani, insanın her seferinde müdahale etmesine gerek kalmadan “işin sürekli akıp gittiği bir yapı” kurmaya odaklandım.
Ek olarak, bu projede önemli gördüğüm bir diğer nokta da “görünürlük”.
Yapay zekanın ürettiklerini sadece metin logları olarak bırakmak yerine:
Oluşturduğu UI taslaklarını veya çıktıları görsel olarak inceleyebiliyor
Yazdığı dokümanları ya da araştırma sonuçlarını da yapısal biçimde görebiliyorsunuz
Bu yüzden mesele sadece “çalışıyor” demek değil;
Yapay zekanın şu anda hangi yönde çalıştığını ve ne ürettiğini tek bakışta anlayabiliyorsunuz.
Özellikle startup bağlamında:
Araştırma → uygulama → test → iyileştirme döngüsünü otomatikleştiriyor
Sınırlı kaynaklar (token’lar) içinde en yüksek çıktıyı verecek şekilde tasarlandı
Henüz tamamlanmış bir ürün olmaktan çok, bir deneye daha yakın.
Bunu, “Yapay zeka gerçekten bir ürünü sürekli büyütebilir mi?” sorusuna yönelik bir araştırma olarak da görebilirsiniz.
Şu anda düşündüğüm başlıca konular:
Uzun süreli çalıştırmada maliyet optimizasyonu
Yanlış yöne yakınsama problemi (alignment drift)
İnsan müdahalesi olmadan da anlamlı sonuçları korumanın yolu
Benzer denemeler yaptıysanız ya da fikirleriniz varsa, geri bildiriminizi gerçekten memnuniyetle karşılarım.
Repo: https://github.com/greatsk55/perpetual-engine
Teşekkürler.
2 yorum
Bu tür harness’lerin açıklamaları çok cazip oluyor ama sonuçta gerçekten iyi çalışıyor mu,
ve iyi sonuç veriyorsa bu yapının tek tek bileşenleri gerçekten anlamlı bileşenler mi, yoksa sadece token tüketen, kulağa hoş gelen bileşenler mi,
bence önce bunlara dair kanıtlar yerleşik haldeyken yayımlanması gerekiyor. Günde onlarcası çıktığı için her birini tek tek denemek bile zor geliyor.
Yazarın bu harness ile neler yaptığı ve ne tür breakthrough’lar yaşadığı da merak ediyorum.
Merhaba, ilk geri bildiriminiz için gerçekten çok teşekkür ederim. Bu proje şu anda yalnızca iki hafta sonuna yayılmış şekilde yapılmış bir PoC aşamasında. Bu yüzden ben de henüz tatmin edici bir sonuç ortaya koyabilmiş değilim.
Söylediğiniz gibi PaperClip veya Gastown gibi benzer birçok açık kaynak proje zaten varken, yine de yeni bir proje yapmaya karar vermemin nedeni daha kolay kurulabilen ve daha görünür bir framework oluşturmaya çalışmamdı.
Kullandığınızda fark edeceğiniz gibi, sadece durmadan token tüketiyormuş hissini azaltmak için hangi işleri yaptığını ve hangi çıktıları ürettiğini görsel olarak doğrulayabiliyorsunuz.
Hâlâ eksikleri ve hataları var, ancak buna rağmen bu projeyi yayımlamamın nedeni, doğrulama aşamasında başkalarına göstererek eksik noktaları hızlıca iyileştirmek istemem. Lütfen bir kez deneyin; geri bildirim ya da iyileştirme için PR rica ediyorum!