Gerekçe
- Claude Opus 4.7 sürüm notlarında en çok göze çarpan kısım 'token kullanımındaki artış' oldu.
- Yeterli token ve zaman varsa yapılabilecek şeylerin çok arttığı bir döneme girilirken, token verimliliği de sürekli bir gündem olmaya devam ediyor.
- Mart ayı civarında Claude Code'un önbellek TTL değerini sessizce 1 saatten 5 dakikaya düşürmesi toplulukta büyük tepki çekti.
- Opus 4.7 ile ölçüm yapıldığında 4.6'ya göre neredeyse 1.5 kat daha fazla token tüketildiğine dair bir analiz var.
- Claude Code önbellek verimliliği üzerine bir araştırma deposu da mevcut.
- 'Claude Code ve Codex'te ayarları değiştirerek token verimliliğini artırmanın bir yolu var mı?' sorusu ortaya çıktı; Claude Code resmi dokümantasyonu (ayarlar/ortam değişkenleri/IDE), Codex resmi dokümantasyonu (ayarlar/ortam değişkenleri/MCP) ve Codex kaynak kodu incelendiğinde anlamlı sonuçlar elde edildi.
- Sadece günlük kullanılan etkileşimli modda değil, programlanabilir şekilde etkileşimsiz modda da token verimliliği/başlatma hızı/kararlılık gibi alanları iyileştirmenin birçok yolu öğrenildi.
Kendi durumumu analiz etmek için prompt
Lafı uzatmadan, kodlama ajanı ayarlarının nasıl durumda olduğunu kontrol etmek isteyenler için prompt:
https://gist.github.com/spilist/c468cbf1ed0ffc91100f813aabdcd520/… 를 읽고 그대로 실행해줘
Gerçekte token'ı ne tüketiyor?
Kodlama ajanlarında token sızıntısı genelde üç yoldan olur:
- Her oturuma veya her tura otomatik eklenen fazladan metin
- Konuşma geçmişinde kalan aşırı uzun araç çağrısı çıktıları
- Arama, bağlayıcılar, IDE entegrasyonu gibi dış bağlantıların yol açtığı ek çağrılar
Claude Code ve Codex'te yukarıdaki üç alanı azaltabilecek kaldıraçlar tanıtılıyor. (Kullanılmayan MCP sunucularını/eklentilerini kapatmak, model ve akıl yürütme düzeyini ayarlamak gibi temel noktalar atlanmıştır.)
- Her ayarın açıklaması ve ne tür ödünleşimler getirdiği blogda ayrıntılı biçimde yazılmış.
Claude Code (son doğrulanan sürüm: 2.1.114)
-
includeGitInstructions: false
-
autoConnectIde: false
-
CLAUDE_CODE_GLOB_NO_IGNORE=false
-
Çıktı üst sınırı ayarlamak (BASH_MAX_OUTPUT_LENGTH, CLAUDE_CODE_FILE_READ_MAX_OUTPUT_TOKENS, MAX_MCP_OUTPUT_TOKENS)
-
Kısa ve basit işler ya da etkileşimsiz mod için ortam değişkenleri ve bayraklar
ENABLE_CLAUDEAI_MCP_SERVERS=false: MCP sunucularını kapatırCLAUDE_CODE_DISABLE_AUTO_MEMORY=1: otomatik kaydedilen belleklerin yüklenmesini engellerCLAUDE_CODE_DISABLE_CLAUDE_MDS=1: genel/projeCLAUDE.mddosyalarını yok sayarCLAUDE_AGENT_SDK_DISABLE_BUILTIN_AGENTS=1: yerleşik alt ajanları ve beceri tanımlarını sistem prompt'undan çıkarır--tools: yerel araçları seçerek etkinleştirir.--tools ""ise hepsini devre dışı bırakır. Gerçekten yalnızca model zekâsını kullanan worker'larda hepsini kapatmak sorun olmayabilir; ama etkileşimli modda basit işler yaptırırken hepsini kapatırsanız iş yapamaz hale gelir, bu yüzden"Bash,Edit,Glob,Grep,Read,Write"gibi yalnızca gerekenleri açmak gerekir--strict-mcp-config: yalnızca CLI ile açıkça belirtilen MCP ayarlarını kullanır, genel MCP ayarlarını yok sayar. Her worker için yalnızca gerekli bağlayıcılar temiz şekilde enjekte edilebilir.--disable-slash-commands:/help,/cleargibi slash komut tanımlarını sistem prompt'undan çıkarır--no-session-persistence: oturum kaydetme/devam ettirme yolunu kullanmadığı için tek seferlik çalıştırmaların izi kalmaz--exclude-dynamic-system-prompt-sections: makineye/ortama göre değişen bölümleri çıkararak prompt önbelleğinin yeniden kullanım oranını artırır--system-prompt: isterse Claude sistem prompt'unu tamamen değiştirmek de mümkün
-
attribution alanını boşaltmak
Codex CLI (son doğrulanan sürüm: 0.121.0 + bu sürümün Codex Github kaynak kodu)
- ChatGPT'ye bağlı MCP'leri (uygulamalar/bağlayıcılar) kapatmak (features.apps = false)
- web_search = "disabled"
- Çıktı üst sınırı ayarlamak (tool_output_token_limit)
- Etkileşimsiz modda sorunsuz çalışmasını sağlayan bayraklar
--profile: belirli ayarları (web_search = "disabled",tool_output_token_limit = 2000vb.) gruplayıp seçerek uygulamayı sağlar--json+--output-last-message FILE: pipeline içinde ayrıştırma/çıkarma işlemini kolaylaştırarak son işleme aşamasında token'ın yeniden tüketilmesini azaltır--sandbox read-only: yalnızca okuma gereken otomasyonlarda istenmeyen yazma girişimi → yeniden deneme döngüsü → token israfı zincirini engeller--skip-git-repo-check: güvenilen bir dizin olmasa da çalıştırılabilir--ephemeral: oturum dosyasını diske kaydetmez--color never: pipe çıktısını daha temiz hale getirir
- attribution alanını boşaltmak
Kapanış
Titiz bir doğrulama yapıldı, ancak elbette hatalı kısımlar olabilir. Rahatça bildirirseniz memnun olurum.
5 yorum
Teşekkür ederim.
Oldukça iyi bir referans olacak bir yazı gibi görünüyor. Metin "gelen token" vanasını kapatma yaklaşımını benimsiyorsa,
ben daha çok "kaydedilmiş olanların kendisinin" fazlalaşması nedeniyle sorun yaşanan durumlarla sık karşılaştığım için
claude-slimadlı bir araç geliştirdim.60 skill'in yarısının bir kez bile kullanılmaması ya da eklentiler yüzünden
CLAUDE.mddosyasının şişmesi gibidurumları tarayıp sınıflandıran ve düzenleyen bir CLI. Token sayımı
js-tiktokentabanlı;kaldırmak yerine
skills.disabled/içine taşıyor, böylece istenildiği zaman geri yüklenebiliyor.https://github.com/iops-leo/claude-slim
Metindeki ayarlarla yönü tam olarak birbirini tamamlıyor; birlikte kullanmak iyi olabilir diye düşünüyorum
Vay, paylaştığınız için teşekkürler!
Değerli bilgi paylaşımı için teşekkürler. Temelde token kullanımının kendisinin zaten çok azaldığını hissediyorum; keşke Claude tarafında biraz artırılsa. Harness çalışırken yarıda kesiliyor da...
Teşekkürler. Claude’un token tüketimi de yüksek ve iş kalitesinden de Codex’e kıyasla pek memnun kalmadığım için ben de son zamanlarda daha çok Codex ile çalışıyorum.