- "Harness yapılandır" demeniz yeterli; alanınıza uygun uzman ajan ekipleri tasarlayan ve ajanların kullanacağı skill'leri de otomatik oluşturan bir meta skill
- 6 farklı mimari deseni destekliyor; ajanlar arası orkestrasyon ve hata yönetimi protokollerini de içeriyor
- Mimari desenler
- Pipeline: sıralı bağımlı işler
- Fan-out/Fan-in: paralel ve bağımsız işler
- Uzman havuzu: duruma göre seçmeli çağrı
- Üret-doğrula: üretim sonrası kalite kontrol
- Süpervizör: merkezi ajan dinamik dağıtım yapar
- Hiyerarşik delege etme: üstten alta özyineli delege etme
- 6 adımlı iş akışı: alan analizi → ekip mimarisi tasarımı (ajan ekibi vs alt ajan) → ajan tanımı üretimi → skill üretimi → entegrasyon ve orkestrasyon → doğrulama ve test
- Çalıştırma modları iki adet:
- Ajan ekibi (varsayılan): TeamCreate + SendMessage + TaskCreate yöntemi; 2 veya daha fazla ajan ve işbirliği gerektiğinde önerilir
- Alt ajan: Agent aracını doğrudan çağırma; tek seferlik işler ve iletişim gerekmeyen durumlar için uygundur
- Harness çalıştırıldığında
.claude/agents/ altında ajan tanım dosyaları (ör. analyst.md, builder.md, qa.md), .claude/skills/ altında ise skill dosyaları otomatik oluşturulur
- Oluşturulabilecek ekip yapılarına örnekler
- Derin araştırma —
Araştırma harness'ini yapılandır. Herhangi bir konuyu birden çok açıdan inceleyebilen bir ajan ekibine ihtiyacım var — web araması, akademik kaynaklar, topluluk tepkileri — çapraz doğrulama sonrasında kapsamlı bir rapor hazırlayan bir ekip.
- Web sitesi geliştirme —
Tam yığın web sitesi geliştirme harness'ini yapılandır. Tasarım, frontend (React/Next.js), backend (API) ve QA testini wireframe'den dağıtıma kadar bir pipeline içinde koordine eden bir ekip.
- Webtoon üretimi —
Webtoon bölüm üretim harness'ini yapılandır. Hikâye yazımı, karakter tasarım prompt'ları, panel düzeni planlama ve diyalog düzenleme ajanlarına ihtiyacım var; ayrıca birbirlerinin çıktılarını stil tutarlılığı açısından gözden geçirmeleri gerekiyor.
- YouTube içerik planlama —
YouTube içerik üretim harness'ini yapılandır. Trend araştırması, senaryo yazımı, başlık/etiket SEO optimizasyonu ve küçük resim konsepti planlamasını bir süpervizör ajanın koordine ettiği bir ekip.
- Kod inceleme —
Kapsamlı bir kod inceleme harness'i yapılandır. Mimariyi, güvenlik açıklarını, performans darboğazlarını ve kod stilini paralel olarak denetleyen ajanların sonuçları tek bir raporda birleştirdiği bir ekip.
- Teknik dokümantasyon yazımı —
Bu kod tabanında API dokümantasyonunu otomatik üreten bir harness yapılandır. Uç nokta analizi, açıklama yazımı, kullanım örnekleri oluşturma ve tamamlanmışlık incelemesini bir pipeline içinde işleyen bir ekip.
- Veri pipeline'ı tasarımı —
Veri pipeline'ı tasarım harness'ini yapılandır. Şema tasarımı, ETL mantığı, veri doğrulama kuralları ve izleme ayarlarını hiyerarşik olarak delege eden bir ajan ekibi.
- Pazarlama kampanyası —
Pazarlama kampanyası üretim harness'ini yapılandır. Hedef pazar araştırması, reklam metni yazımı, görsel konsept tasarımı ve A/B test planlamasını yinelemeli kalite incelemesiyle birlikte yürüten bir ekip.
- revfactory/harness-100 — 10 alan için, üretime hazır 100 ajan ekibi harness'i (Korece-İngilizce 200 paket) yayımlandı
- Her harness; 4-5 uzman ajan, orkestratör skill'i ve alana özel skill'ler içeriyor
- İçerik üretimi, yazılım geliştirme, veri/AI, iş stratejisi, eğitim, hukuk, sağlık gibi alanlarda 1.808 Markdown dosyasından oluşuyor
- Tamamı Harness eklentisi ile oluşturuldu
- Claude Code'da ajan ekibi özelliğinin etkinleştirilmesi gerekiyor:
CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1
7 yorum
Gerçekte kullanıp gördüğüm sonuçlar inanılmaz. Minho’nun yaptığı Harness’in yapısı, fan-in/out yaparken instruction’a uygun birden fazla çoklu ajanı amaca göre oluşturuyor ve bunları yöneten orkestratör de her iş adımını birden fazla phase’e bölerek yürütüyor.
Ortaya çıkan çıktıların seviyesi yarı profesyonel düzeyde; bu ister bir rapor olsun ister bir uygulama, bunun için gereken coder, tester, reviewer ve analyst gibi çeşitli rollerdeki ajanlar da oldukça yüksek seviyede çalışıyor.
MCP ya da diğer araçlarda olduğu gibi, Harness yüzünden context’in sürekli çok büyük kaldığını ve token’ların hızla tükendiğini düşünebilirsiniz; ancak context’i açıp baktığınızda bunun olabilecek en yüksek verimlilikle kullanıldığını görebiliyorsunuz. Yine de bizim aklımızdaki okunabilirlik ya da daha şık sonuçlar için Gemini API tabanlı bir nano banana görsel üretim Skill’i yapıp eklemek gerekiyor.
Claude Max 200 ile de muhtemelen 1-2 saat içinde günlük limite ulaşırsınız; ben Opus kullandım.
Japonya seyahat planını verip, bir Japonya gezi rehberi olarak interaktif bir seyahat planı sayfası oluşturmasını istemiştim; ortaya çıkan sonuç bu. Böyle şeyler çok fazla token harcamadan kısa sürede yapılıyor.
http://namojo.github.io/tokyo-tour
Deneyen varsa yorumlarını paylaşabilir mi?
Bunu Kakao AI Native strateji ekibi lideri Hwang Minho yapmış.
Kendisinin bunu birkaç kez tanıttığı yazıları görmüştüm; ne zaman yayımlanacağını merakla bekliyordum.
Bir kez deneyeceğim!
Zaten Claude code agent team kullanıyorsanız, çok da özel bir şey yoktu.
Ama ekip yapılandırma bilgileri gibi şeylerin yeni oturumlarda da sürdürülebilmesi için agents veya skills kullanarak altyapı kurmak kullanışlıydı.
Ekibi manuel olarak kurunca, ekip için boilerplate benzeri şeyler tekrar ediliyordu.
Ama bir sorun vardı: hem subagent’ı hem de agent team’i dikkate alan bir ortam olduğu için, Supervisor deseninde denetleyici, ekip oluşturulmuş olmasına rağmen işi subagent’a devreden tuhaf bir durum sık sık ortaya çıkıyor.
Maksimum 100 ama, başlar başlamaz token sınırına ulaştı T_T
Zaman ayırıp, uyguladığım şeyleri derledim. Bunu gerçek bir VibeCoding monorepo’sunda uyguladım.
Mode A (geliştirme), B (kod denetimi), C (entegrasyon: A+B) arasından, zaten ilerlemiş bir proje olduğu için Mode B ile devam ettim.
Statik analizle yakalanamayan, frontend/backend tip uyumsuzlukları gibi maddeleri tespit edebildim.
Uygulama sürecini derledim.
https://blog.neocode24.com/blog/claude-code-harness-real-world/
Harness'ı kişisel olarak geliştiren biri olarak, açık kaynakların uygulama etkisinin sonuçlarının hangi testlerle ortaya çıktığını merak ediyorum. Bunu nicelleştiren ve resmî bir benchmark aracı var mı?.. Genelde başkaları hissiyata değil de etkinlik doğrulamasına nasıl yaklaşıyor, bunu da merak ediyorum.