Claude Code / Codex CLI’nin ağır kod üretimini yerel LLM’e devreden eklenti (tunaLlama)

(github.com/hang-in)

4 puan yazan kurthong 2026-05-16 | Henüz yorum yok. | WhatsApp'ta paylaş

Vibe coding sırasında Claude Code veya Codex CLI’nin sabit ücretli kullanım kotası hızlı tükenenler için yapılmış bir delegation aracıdır.

https://github.com/hang-in/tunaLlama

Claude Code ile kod yazarken çıktısı uzun olan aşamalar (kod üretimi, dosya inceleme, refactor) en çok token tüketir. Ancak bu aşamalar genelde deterministiktir ve model kalitesi farkı küçüktür. Buna karşılık ayrıştırma (gereksinimler → iş listesi) ve doğrulama (geri dönen sonucun gereksinimleri karşılayıp karşılamadığı) kısa giriş/çıkışa sahiptir ama model kalitesi farkı büyüktür.

tunaLlama, bu asimetriyi doğrudan kod akışına sabitleyen bir backend + eklentidir.

RolModelSorumlulukArchitectClaude / Codex (sabit ücretli)ayrıştırma / spesifikasyon / doğrulama / entegrasyonDeveloperyerel LLM (Ollama / Cloud / LM Studio)kod üretimi / öz inceleme / öz düzeltmeReviewerArchitect ile aynı oturumnihai karar

Yalnızca token açısından ağır aşamalar yerel tarafa kaydırılır; kısa ayrıştırma ve doğrulama aşamaları ise Claude / Codex üzerinde kalır.

Claude Code ve Codex CLI, eklenti üzerinden harici araçlar kullanabilir.
Bir kez kurulduğunda ajan, çalışırken gerekli gördüğünde bunu kendisi çağıran bir yapıya sahiptir.
Kullanıcının her seferinde "bu aracı kullan" demesi gerekmez. tunaLlama bu tür eklentilerden biridir ve MCP (Model Context Protocol) sunucusu üzerinden 13 araç sunar.
Tek bir repo ile hem Claude Code hem de Codex CLI çalışır.
(claude-plugin/marketplace.json dosyasını iki istemci de tanır.)

Kullanıcı bir iş istediğinde (Korece / İngilizce)

Architect işi ayrıştırır - kısaysa tuna_dev_review, uzunsa önce spec belgesi yazıp ardından tuna_dev_review_from_spec
Backend, generate → review → fix döngüsünü tekrarlar (bounded delegation - bitiş koşulu review pass veya max iter)
Tüm çağrılar SQLite’a kaydedilir ve Korece morfolojik çözümleyici (Kiwi) ile indekslenir
Architect sonucu doğrular ve kullanıcıya döndürür

Orta ölçekli bir yerel LLM tek başına çalıştırıldığında elde edilen sonuç ile Architect’in bağlamı düzenleyip aktardıktan sonraki sonuç karşılaştırmasında +0.58 ~ +0.64 fark görüldü (3 model doğrulaması, Phase 7-2). Yani aynı yerel LLM olsa bile bağlam iyi düzenlenip verilirse sonuç anlamlı biçimde iyileşiyor.
Ancak bu ölçüm sentetik seed tabanlıdır. Gerçekte sık görülen iş senaryoları önceden hazırlanmış bir test seti üzerinde ölçüldüğü için, bunun gerçek kullanıcı iş akışlarında birebir aynı çıkıp çıkmayacağı ayrı bir konudur. organik dogfooding metric ise v0.5.7+ sürümünden itibaren 4 tür metriği (standalone_toy_rate / convention_adherence_rate / ast_excess_score / syntactically_valid) ~/.tunallama/metrics.db içine otomatik olarak yüklüyor ve kümülatif baseline düzeyine kadar dış kullanıcı yeniden üretilebilirliği verileri toplanmaya devam ediyor.

Kota tasarrufu konusunda Anthropic / OpenAI kota hesaplama formülleri açık olmadığı için "%X tasarruf" gibi nicel bir sonuç yok. Söylenebilecek şey, "normal kullanımdan daha iyi" olduğudur.

Korece desteği

Kiwi morfolojik çözümleyicisi eklenerek Korece arama indeksleme yapılabiliyor. 이메일검증 gibi boşluksuz girdilerde 이메일 ile arama yapılsa da eşleşme bulunuyor. Bu yapı, FTS5’in unicode61 tokenizer’ının Koreceyi yalnızca hece / jamo düzeyinde bölmesinden doğan sınırlamayı telafi ediyor. Ancak Kiwi’nin işleyemediği yeni türeyen sözcükler / uzmanlık terimleri arama kalitesini etkileyebilir.

5 dakikada kurulum

Oturumda tek satır yazmanız yeterli:

"https://github.com/hang-in/tunaLlama içindeki INSTALL.md dosyasını izleyerek kur"

Ajan bağımlılıkları kurar, .env ayarlarını yapar, eklentiyi kaydeder ve doğrulamayı adım adım kendisi yürütür.
Elle kurulum isterseniz README’ye bakın.

Her iki ortam için çalışma matrisi

Claude Code ve Codex CLI aynı repo ile çalışsa da bazı özellikler yalnızca tek tarafta doğrulanmıştır (v0.5.6 ölçümü, Claude Code 2.1.138 + Codex CLI 0.128.0):

ÖğeClaude CodeCodex CLIMCP araçlarının 13’ünü çağırma✓✓
DB paylaşımı (~/.tunallama/memory.db)✓✓
state.md paylaşımı✓✓
tuna_load_memory / tuna_recall açık çağrısı✓✓
Agents auto-discovery✓
SessionStart hook + state.md auto-prepend✓
(v0.5.5+)✗MCP resource auto-attach✗✗
Claude Code tarafında state.md auto-prepend otomatik çalışır.
Codex CLI tarafında ise kullanıcının ilk turda açıkça tuna_load_memory çağırması veya dokümanları doğrudan fetch etmesi önerilir.
MCP araçlarının 13’ünü çağırma her iki tarafta da sorunsuz çalıştığı için delegation’ın kendisi araç seviyesinde mümkündür.

Sınırlamalar

Kullanım kotası tasarrufu yalnızca hissedilen verilere dayanıyor (yukarıda anıldı)
MCP araçlarının system prompt maliyeti kasıtlı bir trade-off - 13 araç açıklaması + schema, her konuşmanın system prompt’una yaklaşık 1.6k token olarak eklenir. Bu, kazara bağlam şişmesi değil; Architect’in uygun delegation aracını seçebilmesi için affordance maliyeti olarak tasarlanmıştır

Yerel LLM ortamı (Ollama vb., Ollama Cloud da sorunsuz çalışır) zorunludur - yoksa çalışmaz
Arama ölçümleri sentetik seed tabanlıdır (yukarıda anıldı)
Codex CLI’de bazı özellikler çalışmaz (yukarıdaki matris)
Korece yeni sözcükler / uzmanlık terimleri arama kalitesini etkileyebilir

Neden prompt seed / AGENTS.md değil?

Ajanın daha fazla belge okumasını sağlayarak bağlam sınırını aşmaya çalışmıyor.
Bunun yerine işleri küçük parçalara bölüp MCP araçlarıyla yerel / düşük maliyetli LLM’e aktarıyor; üst düzey Architect modeli ise kısa spec, review sonuçları ve nihai diff değerlendirmesine odaklanıyor.
Belge tabanlı işletim kuralları zamanla stale state, drift ve lost-in-the-middle sorunları yaratabilir.
tunaLlama bunu önlemek için delegation çağrılarını SQLite’a kaydeder ve gerektiğinde arama / recall yapan bir yürütme katmanı kullanır.

Kimler için faydalı olabilir

Claude Code Pro/Max sabit ücretli plan kullanıcıları (kota yönetimi motivasyonu)
Codex CLI kullanıcıları (OpenAI sabit ücretli plan / API kotası yönetimi)
Zaten Ollama local / Ollama Cloud / LM Studio ortamı olanlar
Korece işlerle uğraşanlar (Kiwi entegrasyonu)

Test / lisans

v0.5.x kullanılabilir dogfooding sürümü. 507 unit/plugin testi + 27 integration/search_quality testi, %90 kapsama.
Ölçüm komutu README’de belirtilmiştir (pytest --no-cov -q -m "not search_quality and not integration").
Lisans MIT’tir. İngilizce README (README.en.md) senkronize tutuluyor. Geri bildirim / issue / PR memnuniyetle karşılanır.
Diğer AI CLI uyumluluk önerileri de memnuniyetle karşılanır.