NambaAI - Codex çalışmalarını SPEC, doğrulama ve PR handoff akışıyla düzenleyen CLI aracı
(github.com/Nam-Cheol)Codex kullanırken belirsiz isteklerin doğrudan kod değişikliğine dönüşmesi bana kullanışsız geldiği için, bunu daha yapısal bir geliştirme sürecine dönüştüren bir CLI aracı geliştiriyorum.
NambaAI, Codex'in yerine geçen bir araç değil; daha çok Codex'in çevresinde çalışan bir workflow katmanına yakın.
Temel fikir şu şekilde:
request → SPEC → execution → validation → PR handoff
Yani kullanıcının isteğini doğrudan implementasyona geçirmek yerine önce hedefi, kapsamı, kısıtları ve kabul kriterlerini düzenleyip bunu bir SPEC dosyası olarak bırakıyor, ardından çalışmanın ilerlemesine yardımcı oluyor.
Şu anda esas olarak aşağıdaki akış etrafında yapılandırılmış durumda.
namba project
namba plan "çalışma isteği"
namba run SPEC-XXX
namba sync
namba pr
namba land
Birden fazla SPEC'i sırayla işlemek için queue akışını da deniyorum.
Bu aracı yapma nedenim, yapay zeka ile kodlama ne kadar kolaylaşırsa değişiklik sürecinin o kadar izlenemez hale gelmesi ya da hangi ölçütlere göre implemente edildiğinin sonradan anlaşılmasının zorlaşmasıydı. Özellikle Codex'i tekrar tekrar kullanırken “neyin yapılmasına karar verildiği”, “kapsamın nereye kadar olduğu”, “doğrulamanın nasıl yapıldığı” ve “PR'da neye bakılması gerektiği” gibi noktaların bulanıklaşabildiğini hissettim.
NambaAI bu sorunu aşağıdaki şekilde azaltmayı deniyor.
- Çalışma öncesinde hedef ve kapsamı önce düzenlemek
- Implementasyondan önce SPEC dosyası oluşturmak
- Çalıştırma sonuçlarını ve doğrulama evidence'ını kaydetmek
- PR handoff belgesi oluşturmak
- Codex'in yaptığı değişiklikleri insanların review etmesini kolaylaştıracak şekilde düzenlemek
- Tek seferlik prompt'lar yerine tekrarlanabilir bir geliştirme süreci olarak yönetmek
Mevcut AI agent framework'leri gibi genel amaçlı otonom bir ajan yapmayı hedeflemiyorum. Şu anda odak noktası, Codex'i merkeze alıp işleri geliştiricinin inceleyebileceği birimlere bölmek ve bunları kayıt altına almak.
Henüz erken aşamada olduğu için eksik tarafları da çok.
- Gerçek kullanım örnekleri yetersiz
- Onboarding dokümantasyonunun iyileştirilmesi gerekiyor
- eval pack yetersiz
- installer/hook güvenlik incelemesi gerekiyor
- macOS, Linux, Windows arasında çapraz test gerekiyor
- Mevcut AI coding harness'larıyla karşılaştırma yetersiz
- Gerçek projelerde doğrulama yetersiz
Bu, bizzat geliştirdiğim erken aşamadaki bir açık kaynak proje; henüz olgun bir üründen çok yönünü doğrulama safhasında.
Codex'i işte ya da kişisel projelerde kullananlardan özellikle şu konularda geri bildirim almak istiyorum.
- Böyle bir SPEC tabanlı Codex workflow'su gerçek geliştirme sürecinde faydalı görünüyor mu?
- Hangi kısımlar fazla tasarlanmış gibi görünüyor?
- Bunu gerçek projelere uygulamak için hangi güven mekanizmalarına daha çok ihtiyaç var?
- Karşılaştırmaya değer mevcut araçlar ya da pattern'ler var mı?
- Kurulum/kullanım akışında rahatsız edici ya da riskli görünen noktalar var mı?
Eleştirel görüşler de memnuniyetle karşılanır. Henüz erken aşamada olduğu için, şu anda güzel sözlerden çok gerçekten hangi tarafların zayıf olduğunu bilmek daha faydalı olur.
1 yorum
CLI hedefiyle yaptım ama ben bu aralar
codex desktopta kullanıyorum!Codex desktopun yerleşik harness’iyle çakışma olur mu diye endişelenmiştim, ama neyse ki uyumluluk gayet sorunsuz hahaBunun dışında bu 0.131.0
codexgüncellemesindeki içerikleri de yansıtmak gerekiyor ve ben yalnızca bu harness’i kullandığım için eksik kalan noktaları da sürekli görüyorum ama en büyük eksik benim enerjim sanırım...