Claude Code ve Codex ayarlarını değiştirerek token tasarrufu yapma yöntemleri

(stdy.blog)

56 puan yazan spilist2 10 일 전 | 5 yorum | WhatsApp'ta paylaş

Gerekçe

Claude Opus 4.7 sürüm notlarında en çok göze çarpan kısım 'token kullanımındaki artış' oldu.
Yeterli token ve zaman varsa yapılabilecek şeylerin çok arttığı bir döneme girilirken, token verimliliği de sürekli bir gündem olmaya devam ediyor.
- Mart ayı civarında Claude Code'un önbellek TTL değerini sessizce 1 saatten 5 dakikaya düşürmesi toplulukta büyük tepki çekti.
- Opus 4.7 ile ölçüm yapıldığında 4.6'ya göre neredeyse 1.5 kat daha fazla token tüketildiğine dair bir analiz var.
- Claude Code önbellek verimliliği üzerine bir araştırma deposu da mevcut.
'Claude Code ve Codex'te ayarları değiştirerek token verimliliğini artırmanın bir yolu var mı?' sorusu ortaya çıktı; Claude Code resmi dokümantasyonu (ayarlar/ortam değişkenleri/IDE), Codex resmi dokümantasyonu (ayarlar/ortam değişkenleri/MCP) ve Codex kaynak kodu incelendiğinde anlamlı sonuçlar elde edildi.
Sadece günlük kullanılan etkileşimli modda değil, programlanabilir şekilde etkileşimsiz modda da token verimliliği/başlatma hızı/kararlılık gibi alanları iyileştirmenin birçok yolu öğrenildi.

Kendi durumumu analiz etmek için prompt

Lafı uzatmadan, kodlama ajanı ayarlarının nasıl durumda olduğunu kontrol etmek isteyenler için prompt:

https://gist.github.com/spilist/c468cbf1ed0ffc91100f813aabdcd520/… 를 읽고 그대로 실행해줘

Gerçekte token'ı ne tüketiyor?

Kodlama ajanlarında token sızıntısı genelde üç yoldan olur:

Her oturuma veya her tura otomatik eklenen fazladan metin
Konuşma geçmişinde kalan aşırı uzun araç çağrısı çıktıları
Arama, bağlayıcılar, IDE entegrasyonu gibi dış bağlantıların yol açtığı ek çağrılar

Claude Code ve Codex'te yukarıdaki üç alanı azaltabilecek kaldıraçlar tanıtılıyor. (Kullanılmayan MCP sunucularını/eklentilerini kapatmak, model ve akıl yürütme düzeyini ayarlamak gibi temel noktalar atlanmıştır.)

Her ayarın açıklaması ve ne tür ödünleşimler getirdiği blogda ayrıntılı biçimde yazılmış.

Claude Code (son doğrulanan sürüm: 2.1.114)

includeGitInstructions: false
autoConnectIde: false
CLAUDE_CODE_GLOB_NO_IGNORE=false
Çıktı üst sınırı ayarlamak (BASH_MAX_OUTPUT_LENGTH, CLAUDE_CODE_FILE_READ_MAX_OUTPUT_TOKENS, MAX_MCP_OUTPUT_TOKENS)
Kısa ve basit işler ya da etkileşimsiz mod için ortam değişkenleri ve bayraklar
- ENABLE_CLAUDEAI_MCP_SERVERS=false: MCP sunucularını kapatır
- CLAUDE_CODE_DISABLE_AUTO_MEMORY=1: otomatik kaydedilen belleklerin yüklenmesini engeller
- CLAUDE_CODE_DISABLE_CLAUDE_MDS=1: genel/proje CLAUDE.md dosyalarını yok sayar
- CLAUDE_AGENT_SDK_DISABLE_BUILTIN_AGENTS=1: yerleşik alt ajanları ve beceri tanımlarını sistem prompt'undan çıkarır
- --tools: yerel araçları seçerek etkinleştirir. --tools "" ise hepsini devre dışı bırakır. Gerçekten yalnızca model zekâsını kullanan worker'larda hepsini kapatmak sorun olmayabilir; ama etkileşimli modda basit işler yaptırırken hepsini kapatırsanız iş yapamaz hale gelir, bu yüzden "Bash,Edit,Glob,Grep,Read,Write" gibi yalnızca gerekenleri açmak gerekir
- --strict-mcp-config: yalnızca CLI ile açıkça belirtilen MCP ayarlarını kullanır, genel MCP ayarlarını yok sayar. Her worker için yalnızca gerekli bağlayıcılar temiz şekilde enjekte edilebilir.
- --disable-slash-commands: /help, /clear gibi slash komut tanımlarını sistem prompt'undan çıkarır
- --no-session-persistence: oturum kaydetme/devam ettirme yolunu kullanmadığı için tek seferlik çalıştırmaların izi kalmaz
- --exclude-dynamic-system-prompt-sections: makineye/ortama göre değişen bölümleri çıkararak prompt önbelleğinin yeniden kullanım oranını artırır
- --system-prompt: isterse Claude sistem prompt'unu tamamen değiştirmek de mümkün
attribution alanını boşaltmak

Codex CLI (son doğrulanan sürüm: 0.121.0 + bu sürümün Codex Github kaynak kodu)

ChatGPT'ye bağlı MCP'leri (uygulamalar/bağlayıcılar) kapatmak (features.apps = false)
web_search = "disabled"
Çıktı üst sınırı ayarlamak (tool_output_token_limit)
Etkileşimsiz modda sorunsuz çalışmasını sağlayan bayraklar
- --profile: belirli ayarları (web_search = "disabled", tool_output_token_limit = 2000 vb.) gruplayıp seçerek uygulamayı sağlar
- --json + --output-last-message FILE: pipeline içinde ayrıştırma/çıkarma işlemini kolaylaştırarak son işleme aşamasında token'ın yeniden tüketilmesini azaltır
- --sandbox read-only: yalnızca okuma gereken otomasyonlarda istenmeyen yazma girişimi → yeniden deneme döngüsü → token israfı zincirini engeller
- --skip-git-repo-check: güvenilen bir dizin olmasa da çalıştırılabilir
- --ephemeral: oturum dosyasını diske kaydetmez
- --color never: pipe çıktısını daha temiz hale getirir
attribution alanını boşaltmak

Kapanış

Titiz bir doğrulama yapıldı, ancak elbette hatalı kısımlar olabilir. Rahatça bildirirseniz memnun olurum.

5 yorum

windbug99 2 일 전

Teşekkür ederim.

dzzwe 10 일 전

Oldukça iyi bir referans olacak bir yazı gibi görünüyor. Metin "gelen token" vanasını kapatma yaklaşımını benimsiyorsa,
ben daha çok "kaydedilmiş olanların kendisinin" fazlalaşması nedeniyle sorun yaşanan durumlarla sık karşılaştığım için
claude-slim adlı bir araç geliştirdim.

60 skill'in yarısının bir kez bile kullanılmaması ya da eklentiler yüzünden CLAUDE.md dosyasının şişmesi gibi
durumları tarayıp sınıflandıran ve düzenleyen bir CLI. Token sayımı js-tiktoken tabanlı;
kaldırmak yerine skills.disabled/ içine taşıyor, böylece istenildiği zaman geri yüklenebiliyor.

https://github.com/iops-leo/claude-slim

Metindeki ayarlarla yönü tam olarak birbirini tamamlıyor; birlikte kullanmak iyi olabilir diye düşünüyorum

spilist2 10 일 전

Vay, paylaştığınız için teşekkürler!

duse0001 10 일 전

Değerli bilgi paylaşımı için teşekkürler. Temelde token kullanımının kendisinin zaten çok azaldığını hissediyorum; keşke Claude tarafında biraz artırılsa. Harness çalışırken yarıda kesiliyor da...