Context Mode - AI kodlama ajanlarının context window’unu %98 tasarruf ettiren MCP sunucusu
(github.com/mksglu)- MCP araç çağrılarının context window’a yığdığı ham veriyi tasarruf eder ve oturum süresini ~30 dakikadan ~3 saate uzatır
- Bağlam tasarrufu: ham veriyi sandbox içinde izole ederek 315KB → 5.4KB ile %98 azalma sağlar
- Oturum sürekliliği: dosya düzenleme, git işlemleri, görevler, hatalar ve kullanıcı kararları gibi tüm olayları SQLite+FTS5’e kaydedip indeksledikten sonra BM25 ile arayarak oturum olay takibi ve compact sonrası kurtarma sağlar
- Kodla düşünme: LLM veriyi doğrudan okumak yerine script yazar ve yalnızca sonucu döndürür (örneğin fonksiyon sayarken, bağlamı kaydetmeden ilgili kodu yazıp gerçek sonucu alır)
- Çıktı sıkıştırma: ~%65-75 daha az çıktı token’ı, teknik doğruluk korunur
- 14 platform desteği: Claude Code (plugin marketplace), Codex CLI, Gemini CLI, Cursor, OpenCode, OpenClaw, Antigravity vb.
- Her platformun hook düzeyine göre (PreToolUse, PostToolUse, SessionStart, PreCompact) oturum sürekliliği dereceli olarak desteklenir
- 11 MCP aracı sunar:
ctx_execute(11 dil runtime’ı),ctx_batch_execute(çoklu komut + arama toplu çalıştırma),ctx_execute_file(dosya sandbox işleme),ctx_index/ctx_search(FTS5+BM25 tabanlı bilgi tabanı indeksleme ve arama),ctx_fetch_and_index(URL fetch, indeksleme, 24 saat TTL cache),ctx_stats/ctx_doctor/ctx_upgrade/ctx_purge/ctx_insight - Güvenlik: Claude Code’un
permissionsayarları (deny/allow pattern’leri) MCP sandbox’a da aynen uygulanır; zincirlenmiş komutlar da tek tek ayrılıp denetlenir - Tamamen yerel çalışma: telemetri, bulut senkronizasyonu veya kullanım takibi yoktur; SQLite DB home dizininde saklanır
- Microsoft, Google, Meta, Amazon, NVIDIA, Stripe, Datadog gibi büyük şirketlerin ekipleri tarafından kullanılıyor
- Elastic License 2.0 (kaynak açık, hosting hizmeti sunma yasak)
8 yorum
Ben de etkisini hissediyor gibiyim. Şimdilik sadece MCP kullanıyorum, hook'ları ise dışarıda bırakıyorum.
İşe yarıyor mu..
Claude mem ile caveman karışımı gibi duruyor
Bu aralar token tasarrufu yaptığını söyleyen ürünler ve prompt’lar moda olmuş gibi görünüyor; pratikte ne kadar etkili olur emin değilim ama.
Token tasarrufu ile context window tasarrufunun örtüştüğünü, ama aynı şey olmadığını düşünüyorum.
Token tasarrufu maliyet meselesidir; context window tasarrufu ise modelin çalışma belleğinin kalitesi meselesidir. Büyük hacimli logları ya da DOM snapshot’larını olduğu gibi eklerseniz maliyet de artar, ancak daha büyük sorun modelin önemli ipuçlarını gürültü içinde kaçırma ya da yanlış referans verme olasılığının yükselmesidir.
context-mode’u “daha az kullanalım”dan ziyade “kontekste neyin yer alacağını kontrol edelim”e daha yakın bir araç olarak anlamak doğru görünüyor.
Token tasarrufu ile bağlam penceresi tasarrufunu ayrı düşünmelisiniz.
Genelde birlikte ele alındıkları için karıştırılması kolay oluyor elbette.
Aynen, ne kadar pratik olduğundan emin değilim.. Bir iki kez daha kullanınca daha fazla token harcamaz mı diye düşünüyorum..
Doğru mu?