5 puan yazan GN⁺ 4 시간 전 | Henüz yorum yok. | WhatsApp'ta paylaş
  • Ajanları güvenilir biçimde faydalı işlerde kullanmak için iyi bir model tek başına yeterli değildir; iş kümesine göre tasarlanmış bir harness gerekir
  • En temel ajan döngüsü, LLM’e bağlam verip iş bitene kadar araçları tekrar tekrar çağıran bir yapıdır
  • Bunun üzerine doğrulama döngüsü, olay tabanlı döngü ve hill climbing döngüsünü üst üste koyarak (stacking) daha etkili ajanlar oluşturulur
  • Her döngü katmanı LangChain primitives ile enstrümante edilebilir; örnek olarak iç dokümantasyon yazma ajanı anlatılır
  • Asıl potansiyel modelin kendisinde değil, ajanın etrafında kurduğunuz döngülerde yatar

Loop 1: Ajan döngüsü

  • Ajan, özünde iş tamamlanana kadar araçları tekrar tekrar çağıran bir modeldir
  • LangChain’in create_agent’ı bu döngüyü sağlar; modeli seçip araçları (tools) bağladığınızda çalışan bir ajan döngüsü hazır olur
    • Araçlar, ajanın gerçek dünyada eylem almasını sağlayan unsurlardır
  • İç dokümantasyon ajanı örneğinde ilk döngü adımı, doküman iyileştirme isteğini alır; model değişiklikleri planlar ve taslaklar, repo klonlama, dosya okuma, doküman yazma, pull request açma gibi işlemler için araçları kullanır

Level 2: Doğrulama döngüsü

  • Ajan döngüsü işi yürütür, ancak ilk denemede her zaman doğru veya tutarlı sonuç üretmez; tutarlılık önemli olduğunda, çıktıyı kontrol eden ve yetersizse geri bildirimi modele döndüren bir doğrulama döngüsü ile sarılır
  • Doğrulama döngüsü bir grader ekleyerek ajan çıktısını bir rubric’e göre karşılaştırır; başarısız olursa sonucu geri bildirimle birlikte geri gönderir
    • Grader deterministik ya da ajan türünde olabilir; LLM as a judge tipik bir örnektir
    • RubricMiddleware bu paterni yönetir veya create_agent içindeki after_agent hook’u ile bağlanabilir
  • Doküman yazma örneğinde grader, her denemeden sonra testleri çalıştırır; tüm linklerin düzgün çalıştığını, tüm CI kontrollerinin geçtiğini ve diff’in istenen kapsamla sınırlı olduğunu kontrol ederek manuel inceleme olmadan hata türlerini yakalar
  • Doğrulama eklemek, her çalıştırma için gecikme ve maliyeti artırır; ancak hızdan çok kalitenin önemli olduğu çoğu production kullanımında buna değer

Level 3: Olay tabanlı döngü

  • Ajan geliştirmedeki en önemli parçalardan biri entegrasyon katmanıdır (integrations layer); ajanı ekosisteme bağlar ve arka planda çalışmasını sağlar
  • Olay tabanlı döngü, yeni bir dokümanın gelmesi, zamanlayıcının tetiklenmesi veya webhook’un ulaşması gibi olaylar meydana geldiğinde ajanı çalıştırır
    • Ajan, elle çağrılan bir hedef değil; daha büyük bir sistem içinde sürekli çalışan bir bileşendir
  • LangSmith Deployment tetikleyici altyapısını destekler; cron zamanlamalarını ve webhook’ları destekler
    • Cron kullanımının popüler bir örneği openclaw’un heartbeats özelliğidir; ajanı her zaman açık, proaktif bir asistana dönüştürür
  • Dokümantasyon ajanı, no-code ajan oluşturucu Fleet ile çalıştırılır; Fleet’in channels ve schedules özellikleri olay tabanlı ve cron tetikleyicilerini yönetir
    • #docs-plz Slack kanalına bir mesaj geldiğinde, kanal üzerinden dokümantasyon ajanı çalıştırılır

Level 4: Hill climbing döngüsü

  • Önceki üç döngü işi otomatikleştiriyorsa, dördüncü döngü iyileştirmenin (improvement) kendisini otomatikleştirir
  • Her ajan çalıştırması, modelin davranışını, çağırdığı araçları, grader geri bildirimlerini vb. kaydeden bir trace üretir; bu trace, neyin işe yarayıp neyin yaramadığına dair yüksek değerli sinyaller içerir
  • Hill climbing döngüsü, trace’ler üzerinde analiz ajanı çalıştırır ve bunun sonucunda harness yapılandırmasını daha iyi ayarlarla yeniden yazar
    • Buna prompt/araç ayarlamaları veya grader ayarlamaları dahildir
    • LangSmith’te bu dördüncü döngü, trace analiz ajanı Engine ile enstrümante edilir
  • Dokümantasyon ajanı örneğinde engine trace’ler üzerinde çalıştırılarak sorunlar tespit edilir; birden fazla trace potansiyel bir soruna işaret ederse, sorunlu prompt veya araçta değişiklik istemek için bir issue açılır
  • Kritik nokta, geri dönüş okunun yalnızca en üste dönmemesi, içeri girip ajan döngüsünü doğrudan güncellemesidir; dış döngünün her çevrimi iç döngüyü daha etkili hale getirir
  • Gelecek görünümü

    • Prompt ve araç yapılandırmaları iyileştirmesi en kolay alanlardır, ancak tek seçenek değildir; açık ağırlıklı model işleten ekipler, hill climbing döngüsünü RL fine-tuning’e bağlayarak trace’leri veya değerlendirme sonuçlarını öğrenme sinyali olarak kullanıp modelin kendisini iyileştirebilir
    • Bellek ve getirilen beceriler gibi yardımcı bağlamlar da aynı şekilde iyileştirilebilir; döngü bir paterndir ve neyin optimize edileceği kullanıcıya bağlıdır

İnsan gözetimi ve uzmanlık

  • Otomasyon, insanı döngünün dışına çıkarmak anlamına gelmez; her katmanda insan gözetiminin değer kattığı noktalar vardır
    • Otomatik grader linklerin düzgün çalıştığını kontrol edebilir; ancak çerçevelemenin hedef kitle için yanlış olduğunu fark etmek insana düşer. Bağlam, deneyim ve sezgiden gelen yargı, insan incelemesinin gerekli olduğu noktadır
  • Uzmanlığın bir kısmı prompt’lara/araçların kendisine kodlanmalıdır; ancak finansal işlemler veya DB operasyonları gibi hassas eylemler için gerçek zamanlı insan incelemesi şarttır
  • LangChain, tüm döngülerde bu temas noktalarını enstrümante etmeyi kolaylaştırır
    • Ajan döngüsü: Hassas eylem/araç çağrısından önce insan girdisi istemek
    • Doğrulama döngüsü: Hassas workflow’larda insanın grader rolünü üstlenmesi
    • Uygulama döngüsü: Son kullanıcıya dönmeden önce çıktının insan tarafından onaylanması
    • Hill climbing döngüsü: Yayına almadan önce harness iyileştirmelerinin insan incelemesinden geçmesi
  • Tüm LangChain açık kaynak framework’leri human in the loop’u birinci sınıf primitive olarak sunar

Genel özet

  • Dört döngünün üst üste nasıl konduğunun özeti
    • Ajan döngüsü: Model iş tamamlanana kadar araçları tekrar tekrar çağırır → iş otomasyonu; primitive’ler create_agent ve LangChain destekli modellerdir
    • Doğrulama döngüsü: Çıktıyı rubric’e göre puanlar ve başarısız olursa geri bildirimle yeniden dener → iş kalitesi ve doğruluğu güvence altına alınır; primitive RubricMiddleware’dir
    • Olay tabanlı döngü: Olaylar, gerçek sistemleri güncelleyen ajan çalıştırmalarını tetikler → büyük ölçekli iş otomasyonu; primitive’ler cron tetikleyicileri/webhook tabanlı LangSmith Deployment veya Fleet channels’dır
    • Hill climbing döngüsü: Production çalıştırma trace’leri, analiz ajanı aracılığıyla harness yapılandırmasını iyileştirir → harness iyileştirme; primitive LangSmith Engine’dir
  • Bu, swyx’in loopcraft dediği şeydir; yani gerçek döngü mühendisliğinin görünümü. Steipete, Boris ve Andrej gibi liderler de ajanın potansiyelinin onu çevreleyen döngülerde olduğu sonucuna varmıştır
  • Döngü 1 ve 2 uzun süredir ele alınıyordu; artık odak, ajanları ekosisteme yerleştirip ölçütlere göre sürekli iyileşen ve değerin bileşik biçimde biriktiği Döngü 3 ve 4’e kaymalıdır
  • Satya, organizasyon düzeyindeki çıkarları vurgulayarak insan yargısı ile token sermayesinin birlikte bileşik biçimde biriktiği öğrenme döngülerini erken kuran şirketlerin kopyalanması zor bir avantaj elde edeceğini belirtiyor

Henüz yorum yok.

Henüz yorum yok.