Döngü Mühendisliği Sanatı (The Art of Loop Engineering)

(langchain.com)

5 puan yazan GN⁺ 4 시간 전 | Henüz yorum yok. | WhatsApp'ta paylaş

Ajanları güvenilir biçimde faydalı işlerde kullanmak için iyi bir model tek başına yeterli değildir; iş kümesine göre tasarlanmış bir harness gerekir
En temel ajan döngüsü, LLM’e bağlam verip iş bitene kadar araçları tekrar tekrar çağıran bir yapıdır
Bunun üzerine doğrulama döngüsü, olay tabanlı döngü ve hill climbing döngüsünü üst üste koyarak (stacking) daha etkili ajanlar oluşturulur
Her döngü katmanı LangChain primitives ile enstrümante edilebilir; örnek olarak iç dokümantasyon yazma ajanı anlatılır
Asıl potansiyel modelin kendisinde değil, ajanın etrafında kurduğunuz döngülerde yatar

Loop 1: Ajan döngüsü

Ajan, özünde iş tamamlanana kadar araçları tekrar tekrar çağıran bir modeldir
LangChain’in create_agent’ı bu döngüyü sağlar; modeli seçip araçları (tools) bağladığınızda çalışan bir ajan döngüsü hazır olur
- Araçlar, ajanın gerçek dünyada eylem almasını sağlayan unsurlardır
İç dokümantasyon ajanı örneğinde ilk döngü adımı, doküman iyileştirme isteğini alır; model değişiklikleri planlar ve taslaklar, repo klonlama, dosya okuma, doküman yazma, pull request açma gibi işlemler için araçları kullanır

Level 2: Doğrulama döngüsü

Ajan döngüsü işi yürütür, ancak ilk denemede her zaman doğru veya tutarlı sonuç üretmez; tutarlılık önemli olduğunda, çıktıyı kontrol eden ve yetersizse geri bildirimi modele döndüren bir doğrulama döngüsü ile sarılır
Doğrulama döngüsü bir grader ekleyerek ajan çıktısını bir rubric’e göre karşılaştırır; başarısız olursa sonucu geri bildirimle birlikte geri gönderir
- Grader deterministik ya da ajan türünde olabilir; LLM as a judge tipik bir örnektir
- RubricMiddleware bu paterni yönetir veya create_agent içindeki after_agent hook’u ile bağlanabilir
Doküman yazma örneğinde grader, her denemeden sonra testleri çalıştırır; tüm linklerin düzgün çalıştığını, tüm CI kontrollerinin geçtiğini ve diff’in istenen kapsamla sınırlı olduğunu kontrol ederek manuel inceleme olmadan hata türlerini yakalar
Doğrulama eklemek, her çalıştırma için gecikme ve maliyeti artırır; ancak hızdan çok kalitenin önemli olduğu çoğu production kullanımında buna değer

Level 3: Olay tabanlı döngü

Ajan geliştirmedeki en önemli parçalardan biri entegrasyon katmanıdır (integrations layer); ajanı ekosisteme bağlar ve arka planda çalışmasını sağlar
Olay tabanlı döngü, yeni bir dokümanın gelmesi, zamanlayıcının tetiklenmesi veya webhook’un ulaşması gibi olaylar meydana geldiğinde ajanı çalıştırır
- Ajan, elle çağrılan bir hedef değil; daha büyük bir sistem içinde sürekli çalışan bir bileşendir
LangSmith Deployment tetikleyici altyapısını destekler; cron zamanlamalarını ve webhook’ları destekler
- Cron kullanımının popüler bir örneği openclaw’un heartbeats özelliğidir; ajanı her zaman açık, proaktif bir asistana dönüştürür
Dokümantasyon ajanı, no-code ajan oluşturucu Fleet ile çalıştırılır; Fleet’in channels ve schedules özellikleri olay tabanlı ve cron tetikleyicilerini yönetir
- #docs-plz Slack kanalına bir mesaj geldiğinde, kanal üzerinden dokümantasyon ajanı çalıştırılır

Level 4: Hill climbing döngüsü

Önceki üç döngü işi otomatikleştiriyorsa, dördüncü döngü iyileştirmenin (improvement) kendisini otomatikleştirir
Her ajan çalıştırması, modelin davranışını, çağırdığı araçları, grader geri bildirimlerini vb. kaydeden bir trace üretir; bu trace, neyin işe yarayıp neyin yaramadığına dair yüksek değerli sinyaller içerir
Hill climbing döngüsü, trace’ler üzerinde analiz ajanı çalıştırır ve bunun sonucunda harness yapılandırmasını daha iyi ayarlarla yeniden yazar
- Buna prompt/araç ayarlamaları veya grader ayarlamaları dahildir
- LangSmith’te bu dördüncü döngü, trace analiz ajanı Engine ile enstrümante edilir
Dokümantasyon ajanı örneğinde engine trace’ler üzerinde çalıştırılarak sorunlar tespit edilir; birden fazla trace potansiyel bir soruna işaret ederse, sorunlu prompt veya araçta değişiklik istemek için bir issue açılır
Kritik nokta, geri dönüş okunun yalnızca en üste dönmemesi, içeri girip ajan döngüsünü doğrudan güncellemesidir; dış döngünün her çevrimi iç döngüyü daha etkili hale getirir
Gelecek görünümü
- Prompt ve araç yapılandırmaları iyileştirmesi en kolay alanlardır, ancak tek seçenek değildir; açık ağırlıklı model işleten ekipler, hill climbing döngüsünü RL fine-tuning’e bağlayarak trace’leri veya değerlendirme sonuçlarını öğrenme sinyali olarak kullanıp modelin kendisini iyileştirebilir
- Bellek ve getirilen beceriler gibi yardımcı bağlamlar da aynı şekilde iyileştirilebilir; döngü bir paterndir ve neyin optimize edileceği kullanıcıya bağlıdır

İnsan gözetimi ve uzmanlık

Otomasyon, insanı döngünün dışına çıkarmak anlamına gelmez; her katmanda insan gözetiminin değer kattığı noktalar vardır
- Otomatik grader linklerin düzgün çalıştığını kontrol edebilir; ancak çerçevelemenin hedef kitle için yanlış olduğunu fark etmek insana düşer. Bağlam, deneyim ve sezgiden gelen yargı, insan incelemesinin gerekli olduğu noktadır
Uzmanlığın bir kısmı prompt’lara/araçların kendisine kodlanmalıdır; ancak finansal işlemler veya DB operasyonları gibi hassas eylemler için gerçek zamanlı insan incelemesi şarttır
LangChain, tüm döngülerde bu temas noktalarını enstrümante etmeyi kolaylaştırır
- Ajan döngüsü: Hassas eylem/araç çağrısından önce insan girdisi istemek
- Doğrulama döngüsü: Hassas workflow’larda insanın grader rolünü üstlenmesi
- Uygulama döngüsü: Son kullanıcıya dönmeden önce çıktının insan tarafından onaylanması
- Hill climbing döngüsü: Yayına almadan önce harness iyileştirmelerinin insan incelemesinden geçmesi
Tüm LangChain açık kaynak framework’leri human in the loop’u birinci sınıf primitive olarak sunar

Genel özet

Dört döngünün üst üste nasıl konduğunun özeti
- Ajan döngüsü: Model iş tamamlanana kadar araçları tekrar tekrar çağırır → iş otomasyonu; primitive’ler create_agent ve LangChain destekli modellerdir
- Doğrulama döngüsü: Çıktıyı rubric’e göre puanlar ve başarısız olursa geri bildirimle yeniden dener → iş kalitesi ve doğruluğu güvence altına alınır; primitive RubricMiddleware’dir
- Olay tabanlı döngü: Olaylar, gerçek sistemleri güncelleyen ajan çalıştırmalarını tetikler → büyük ölçekli iş otomasyonu; primitive’ler cron tetikleyicileri/webhook tabanlı LangSmith Deployment veya Fleet channels’dır
- Hill climbing döngüsü: Production çalıştırma trace’leri, analiz ajanı aracılığıyla harness yapılandırmasını iyileştirir → harness iyileştirme; primitive LangSmith Engine’dir
Bu, swyx’in loopcraft dediği şeydir; yani gerçek döngü mühendisliğinin görünümü. Steipete, Boris ve Andrej gibi liderler de ajanın potansiyelinin onu çevreleyen döngülerde olduğu sonucuna varmıştır
Döngü 1 ve 2 uzun süredir ele alınıyordu; artık odak, ajanları ekosisteme yerleştirip ölçütlere göre sürekli iyileşen ve değerin bileşik biçimde biriktiği Döngü 3 ve 4’e kaymalıdır
Satya, organizasyon düzeyindeki çıkarları vurgulayarak insan yargısı ile token sermayesinin birlikte bileşik biçimde biriktiği öğrenme döngülerini erken kuran şirketlerin kopyalanması zor bir avantaj elde edeceğini belirtiyor

Döngü Mühendisliği Sanatı (The Art of Loop Engineering)

Loop 1: Ajan döngüsü

Level 2: Doğrulama döngüsü

Level 3: Olay tabanlı döngü

Level 4: Hill climbing döngüsü

Gelecek görünümü

İnsan gözetimi ve uzmanlık

Genel özet

İlgili okumalar

Henüz yorum yok.