SongRyeon Core - LLM’in yazdığı sözlerle kodun doğruladığı bilgiyi ayıran yerel ajan runtime deneyi
(github.com/Junghoo-developer)Merhaba. Kodlama öğrenirken aynı zamanda AI ajan runtime’larını bizzat deneyen Junghoo benim.
SongRyeon Core, “LLM’in söylediği değerlendirme” ile “kodun gerçekten doğruladığı olgu”yu ayırarak ele alan, küçük ve yerel öncelikli bir ajan runtime deneyidir.
Bugünlerde LLM tabanlı ajanlar geliştirirken şu sorunların sık ortaya çıktığını hissettim.
- LLM’in tahmin ettiği içerik, sistem gerçeğiymiş gibi gösteriliyor
- Kodun ürettiği fallback veya heuristikler, LLM değerlendirmesiyle karışıyor
- Kaç belge okunduğu ve hangi çalıştırmaların gerçekten gerçekleştiği her ekranda farklı görünüyor
- Nihai yanıt, iç runtime durumuyla uyuşmuyor
Bu yüzden bu projede bilgiyi büyük ölçüde üçe ayırarak ele alıyorum.
- mutlak bilgi: code/trace/schema/tool result ile doğrulanabilen değerler
- göreli bilgi: tek bir mutlak bilgiye karşılık gelen LLM değerlendirmesi
- karma bilgi: birden fazla source bundle’a dayanan LLM değerlendirmesi
Şu an hâlâ küçük bir pratik sürümü olsa da, aşağıdaki gibi bir yapıyı deniyorum.
- node_0 memory supplier
- node_1 router
- L loop
- node_3 reporter
- node_4 verifier
- smoke-test tabanlı regresyon doğrulaması
- runtime terminal/final renderer dürüstlük denetimi
Amaç, “şık bir demo”dan ziyade, AI ajanın hangi gerekçeyle ne söylediğini mümkün olduğunca gizlemeyen küçük bir runtime oluşturmaktır.
Hâlâ kodlama öğrenme sürecinde olduğum için epey pürüzlü kısım var.
Yapı, README, testler, terim tanımları ve agent runtime tasarımı hakkında geri bildirim verirseniz gerçekten çok memnun olurum.
1 yorum
Ek bilgi.
Şu anda SongRyeon Core, bir web hizmeti biçiminden ziyade yerel CLI / smoke-test odaklı bir çalışma zamanı deneyi.
Hemen kontrol edebileceğiniz şeyler README'deki çalıştırma yöntemi ve şunlar:
Bunlardır.
Özellikle geri bildirim almak istediğim noktalar şunlar:
Hâlâ öğrenme aşamasında olan bir proje olduğu için pürüzlü tarafları çok. Rahatça eleştirirseniz memnun olurum.