LangChain, Claude Code’un başarı oranını %25’ten %95’e çıkaran yöntemi ortaya koyan Skills setini duyurdu

(aisparkup.com)

32 puan yazan davespark 2026-03-10 | Henüz yorum yok. | WhatsApp'ta paylaş

LangChain, kodlama ajanı performansını dramatik biçimde artıran "Skills" setini duyurdu.

Özellikle Claude Code gibi modeller LangChain/LangGraph/LangSmith ile ilgili görevleri yerine getirirken, skills olmadan yalnızca yaklaşık %25 başarı sağlarken skills eklendikten sonra bu oran %95’e kadar çıktı; LangSmith ile ilgili görevlerde ise %17 → %92 şeklinde büyük bir iyileşme görüldü.

Duyurulan skill türleri

11 LangChain skill’i: ajanın temel döngüsü, LangGraph’ta Human-in-the-Loop, Deep Agents vb.
3 LangSmith skill’i: tracing, dataset oluşturma, ajan değerlendirmesi
→ LangSmith CLI da birlikte duyuruldu (terminalden trace görüntüleme, dataset yönetimi ve deney çalıştırma mümkün)

Değerlendirme sonuçları ve çıkarımlar

Skill kullanıldığında Claude Code tamamlama oranı %82, kullanılmadığında %9
Skill çağırma doğruluğu: çok fazla olduğunda (20 adet) hatalı çalışma artıyor → yaklaşık 12’ye düşürüldüğünde doğruluk artıyor
AGENTS.md veya CLAUDE.md içinde “hangi durumda hangi skill’in kullanılacağı” açıkça belirtilmeli; böylece etki en üst düzeye çıkıyor

Gelecek görünümü

LangSmith skill’leri kullanıldığında ajan, kendi yürütme loglarını analiz etme → sorunları özetleme → test dataset’i + değerlendirici otomatik oluşturma şeklinde bir kendini iyileştirme döngüsü kurabiliyor.
İleride “ajanın ajanı iyileştirdiği” terminal tabanlı döngülerin ana akım hâline gelebileceği öne sürülüyor.

LangChain, Claude Code’un başarı oranını %25’ten %95’e çıkaran yöntemi ortaya koyan Skills setini duyurdu

İlgili okumalar

Henüz yorum yok.