LangChain, Claude Code’un başarı oranını %25’ten %95’e çıkaran yöntemi ortaya koyan Skills setini duyurdu
(aisparkup.com)LangChain, kodlama ajanı performansını dramatik biçimde artıran "Skills" setini duyurdu.
Özellikle Claude Code gibi modeller LangChain/LangGraph/LangSmith ile ilgili görevleri yerine getirirken, skills olmadan yalnızca yaklaşık %25 başarı sağlarken skills eklendikten sonra bu oran %95’e kadar çıktı; LangSmith ile ilgili görevlerde ise %17 → %92 şeklinde büyük bir iyileşme görüldü.
Duyurulan skill türleri
- 11 LangChain skill’i: ajanın temel döngüsü, LangGraph’ta Human-in-the-Loop, Deep Agents vb.
- 3 LangSmith skill’i: tracing, dataset oluşturma, ajan değerlendirmesi
→ LangSmith CLI da birlikte duyuruldu (terminalden trace görüntüleme, dataset yönetimi ve deney çalıştırma mümkün)
Değerlendirme sonuçları ve çıkarımlar
- Skill kullanıldığında Claude Code tamamlama oranı %82, kullanılmadığında %9
- Skill çağırma doğruluğu: çok fazla olduğunda (20 adet) hatalı çalışma artıyor → yaklaşık 12’ye düşürüldüğünde doğruluk artıyor
- AGENTS.md veya CLAUDE.md içinde “hangi durumda hangi skill’in kullanılacağı” açıkça belirtilmeli; böylece etki en üst düzeye çıkıyor
Gelecek görünümü
- LangSmith skill’leri kullanıldığında ajan, kendi yürütme loglarını analiz etme → sorunları özetleme → test dataset’i + değerlendirici otomatik oluşturma şeklinde bir kendini iyileştirme döngüsü kurabiliyor.
- İleride “ajanın ajanı iyileştirdiği” terminal tabanlı döngülerin ana akım hâline gelebileceği öne sürülüyor.
Henüz yorum yok.