cgrep: Yapay zeka kodlama ajanları için yerel kod niyeti arama aracı
(github.com/meghendra6)Merhaba. cgrep adında, önce yerel çalışan (code-local) bir kod arama aracı geliştirdim.
Temel hedefi, yapay zeka kodlama ajanlarının bir kod tabanını gezerken ortaya çıkan token israfını ve tekrarlayan aramaları azaltmak.
cgrep, BM25 aramayı (Tantivy) + AST sembol analizini (tree-sitter) birleştirerek, basit bir dizge aramasına kıyasla kod niyetine daha uygun keşif yapacak şekilde tasarlandı.
Başlıca özellikler:
- Kod keşfi: definition / references / callers / dependents
- Bağlam keşfi: read / map
- Ajanlar için 2 aşamalı akış:
agent locate -> agent expand(küçük bir payload ile adayları bulup yalnızca gerekenleri genişletme) - MCP desteği:
cgrep mcp serve+ host kurulum desteği - Ajan kurulum desteği: claude-code, codex, copilot, cursor, opencode
PyTorch bazlı benchmark (uygulama izleme senaryosu 6 adet):
- grep bazında tokens-to-complete: 127,665
- cgrep(agent locate/expand) tokens-to-complete: 6,153
- Tokenlerde %95,2 azalma (20.75x küçülme)
- Tamamlanana kadar ortalama arama gecikmesi: 1321.3ms -> 22.7ms (yaklaşık 58.2x)
Tüm işlemler yerelde çalışır (bulut indeksine bağımlılık yok).
Geri bildirimlerinizi bekliyorum:
- Gerçek büyük kod tabanlarında eksik kalan noktalar
- MCP/ajan entegrasyonunda gerekli iyileştirmeler
- Benchmark senaryolarını güçlendirme fikirleri
Repo: https://github.com/meghendra6/cgrep
Docs: https://meghendra6.github.io/cgrep/
Benchmark: https://meghendra6.github.io/cgrep/benchmarks/…
4 yorum
mgrep ya da ck aracı ile benzer bir amaca sahip görünüyor.
macOS'ta v1.4.1 sürümü baz alınarak yayınlanan binary'yi çalıştırmaya çalışınca uyarı çıkıyor ve çalışmıyor.
agent-browser örneği gibi, agent'ın başvurabileceği skills veya instruction'lar olsa iyi olurdu diye düşündüm.
Binary imzasında bir sorun vardı, onu çözdüm.
Kontrol edip inceleme yaptığınız için teşekkürler!
Token azaltma etkisi gerçekten çok iyi. README'de kodlamayla ilgili benchmark sonuçları da birlikte olsa, benchmark performansı benzer şekilde korunuyor olsa bile güvenilirlik daha da artacak gibi görünüyor.
Geri bildiriminiz doğrultusunda, gerçek coding agent senaryosu için benchmark sonuçlarını da ekledim.
Geri bildiriminiz için teşekkürler!