1 puan yazan ragingwind 3 시간 전 | Henüz yorum yok. | WhatsApp'ta paylaş

Claude Code'da Dynamic Workflows tanıtımı

Anthropic'in Claude Code ekibinin (Thariq Shihipar, Sid Bidasaria) paylaştığı bu yazı, Claude Code'a yeni eklenen Dynamic Workflows özelliğini açıklıyor. Dynamic Workflows, Claude'un göreve göre kendi yürütme yapısını (harness) anlık olarak JavaScript dosyası biçiminde yazıp birden fazla alt ajanı koordine etmesi yaklaşımıdır. Claude Code'un mevcut varsayılan harness'i kodlama işleri için optimize edilmiş olsa da, uzun süreli, büyük ölçekli paralellik ve adversarial doğrulama gerektiren görevlerde sınırlı kalıyordu; bunu çözmek için temel fikir, Claude'un kendisinin özelleştirilmiş harness'ler oluşturmasını sağlamak.

Arka planı ve çalışma biçimi

  • Tek bağlamın sınırları: Planlama ve yürütmenin tek bir context window içinde aynı anda yapıldığı durumlarda üç tür başarısızlık modu ortaya çıkıyor. Bunlar, işi yarım yapıp bittiğini ilan etme anlamındaki agentic laziness, kendi çıktısını olumlu değerlendirme eğilimi olan self-preferential bias ve bağlam sıkıştırma sürecinde asıl hedefin bulanıklaşması olan goal drift.
  • Çalışma yapısı: JavaScript dosyası çalıştırılarak alt ajanlar oluşturulup koordine ediliyor; JSON, Math, Array gibi standart işlevlerden yararlanılabiliyor. Her alt ajanın model türü (Sonnet, Opus vb.) ve worktree izolasyonu kullanıp kullanmayacağı da iş akışı tarafından doğrudan belirleniyor. Kesinti durumunda oturum yeniden açılarak yürütmeye devam edilebiliyor.
  • Nasıl çağrılır: Claude'dan bir iş akışı oluşturmasını istemek ya da tetikleyici kelime olan "ultracode"u kullanmak yeterli.

Öne çıkan kalıplar

  • Classify and Route: Bir sınıflandırıcı ajan önce görev türünü belirliyor, ardından uygun ajan ya da işleme akışına yönlendiriyor. Son aşamada sonuç sınıflandırması için de kullanılabiliyor.
  • Fan-out and Synthesize: Büyük bir görev küçük parçalara ayrılıyor, her parça için ayrı ajan çalıştırılıyor, ardından synthesize aşamasında tüm sonuçlar toplanıp tek bir çıktıda birleştiriliyor. Temiz bağlam gerektiren çok sayıdaki küçük görev için uygun.
  • Adversarial Verification: Her görev ajanına ayrı bir doğrulama ajanı bağlanıyor ve sonuç, rubric'e göre çürütülüp doğrulanıyor.
  • Generate and Filter: Çok sayıda fikir üretildikten sonra rubric ve doğrulama ile eleniyor, tekrarlar kaldırılıyor ve yalnızca en yüksek kaliteli adaylar bırakılıyor.
  • Tournament: Aynı görevi farklı yaklaşımlarla N ajan rekabet içinde yürütüyor; hakem ajan ise pairwise comparison ile kazananı seçiyor. Metne göre ikili karşılaştırma, mutlak puanlamadan daha güvenilir.
  • Loop Until Convergence: İş yükü baştan belirli değilse, yeni keşif ya da hata kalmayana kadar ajan üretimi tekrarlanıyor.

Kullanım örnekleri

  • Büyük ölçekli refactor ve migration: Çağrı noktaları, başarısız testler ve modüller bazında parçalanan işlerde alt ajanlar her worktree içinde değişiklik yapıyor, başka ajanlar bunları adversarial biçimde inceliyor ve sonra birleştiriyor. Zig'den Rust'a yeniden yazım örneği veriliyor; kaynak yoğun komutlardan kaçınılması istendiğinde paralellik en üst düzeye çıkarılabiliyor.
  • Derin araştırma (/deep-research becerisi): Web araması fan-out ile dağıtılarak kaynaklar toplanıyor, adversarial doğrulama ile iddialar kontrol ediliyor ve ardından alıntılı bir raporda sentezleniyor. Slack'te durum raporu yazımı ya da codebase'in derinlemesine incelenmesi gibi alanlara da uygulanabiliyor.
  • Fact-checking: Önce rapordaki tüm olgusal iddiaları tespit eden bir ajan çalışıyor, sonra her iddia için doğrulama alt ajanları kaynakları denetliyor ve ayrıca ayrı bir doğrulama ajanı kaynak kalitesini de değerlendiriyor.
  • Niteliksel sıralama ve derecelendirme: 1000 satırdan uzun destek kayıtlarını ciddiyet sırasına koymak gibi tek seferde işlenmesi zor görevler, tournament tarzı ikili karşılaştırma hattı ya da bucket'lara ayırıp paralel işledikten sonra birleştirme yöntemiyle çözülebiliyor.
  • Kural doğrulama ve CLAUDE.md otomasyonu: Her kural için doğrulama ajanları atanarak eksikler yakalanıyor, şüpheci persona'ya sahip bir ajan da kuralların kendisini sorguluyor. Tersi yönde ise son oturumlar ve code review'larda tekrarlanan düzeltmeler kümelenerek yeni kurallar otomatik çıkarılabiliyor.
  • Aralıklı başarısızlıkların debug edilmesi ve postmortem analiz: Loglar, dosyalar ve veriler bazında bağımsız ajanlar birbirinden ayrılmış kanıtlardan hipotez kuruyor; doğrulayıcı ve itirazcı paneller bu hipotezleri değerlendiriyor. Bu yaklaşım yalnızca kod için değil, gelir düşüşü nedenlerinin ya da veri hattı arızalarının analizi için de kullanılabiliyor.
  • Triage ve backlog işleme: Destek kuyruğu ve bug raporları sınıflandırılıyor, mevcut kayıtlarla yinelenenler ayıklanıyor, ardından otomatik düzeltme yapılıyor ya da insana escalation uygulanıyor. Güvenilmez dış içeriği okuyan ajanlar ile yetkili eylemler gerçekleştiren ajanları ayıran quarantine kalıbı öneriliyor. /loop ile birleştirildiğinde sürekli işletim de mümkün.
  • Yaratıcı keşif ve değerlendirme (Eval): Tasarım ya da isimlendirme gibi zevkin devreye girdiği işlerde çok sayıda seçenek üretiliyor, ardından review ajanları rubric ile puanlayıp seçiyor. Becerinin kendisinin kalitesini puanlayıp iyileştiren hafif değerlendirmelerde de kullanılabiliyor.
  • Model Routing: Bir sınıflandırıcı ajan görev karmaşıklığını önceden inceleyip Sonnet ile Opus arasında uygun modeli seçerek yönlendirme yapıyor.

Avantajlar ve farkları

  • Ayırt edici yönü: Claude Agent SDK ya da claude -p ile kurulan mevcut statik iş akışları, genelleştirilmiş işleme uygun olacak şekilde genel amaçlı yazılmak zorundayken Dynamic Workflows'ta fark, Claude'un o anda ihtiyaca özel bir harness'i anında yazması.
  • Avantajları: Bağlamı ayrılmış çok sayıda ajan kendi hedeflerine odaklandığı için tembellik, öz tercih ve hedef kayması sorunları yapısal olarak azaltılabiliyor. Yarıda kalan oturumların sürdürülmesi, token bütçesi belirtme ("use 10k tokens"), /goal ve /loop ile birlikte kullanım, s tuşuyla kaydedip ~/.claude/workflows dizini ya da beceriler üzerinden paylaşma gibi operasyonel özellikler de sunuluyor.
  • Dezavantajlar ve dikkat edilmesi gerekenler: Token kullanımı ciddi biçimde artabildiği için her görev için uygun değil. Yazarlar da açıkça, sıradan kodlama işleri için beş kişilik bir review paneline gerek olmadığını vurguluyor ve kullanmadan önce "gerçekten daha fazla hesaplama gerekiyor mu" diye sormayı öneriyor. En iyi uygulamalar da henüz oluşma aşamasında.

Dynamic Workflows, Claude Code'u tek bir kodlama yardımcısından çok sayıda ajanı koordine eden bir meta orkestratöre genişleten bir değişim olarak okunabilir. Statik pipeline'lar ile otonom ajanlar arasında orta bir noktayı hedefleyen bu yaklaşımın, code migration, derin araştırma, triage ve postmortem analiz gibi uzun soluklu yapısal işlerde özellikle etkili olması bekleniyor. Ancak token maliyeti yüksek ve en iyi uygulamalar henüz oturmuş değil; bu yüzden kalıplara göre uygunluğu dikkatle değerlendirip "hızlı iş akışları"ndan küçük başlayarak ilerlemek

Henüz yorum yok.

Henüz yorum yok.