Claude Code(~100 saat) vs. Codex(~20 saat) karşılaştırması

(reddit.com)

59 puan yazan GN⁺ 15 일 전 | 18 yorum | WhatsApp'ta paylaş

14 yıllık deneyime sahip kıdemli bir mühendis, 80 bin satırlık bir Python/TypeScript projesinde Claude Code (Opus 4.6) ile Codex’i (GPT-5.4) gerçek kullanımda karşılaştırdığı deneyimini aktarıyor
Claude Code hızlı ve interaktif, ancak yönergeleri yok sayma, işi yarım bırakma, mevcut dosyalara gelişigüzel fonksiyon ekleme gibi nedenlerle aktif yönetim gerektiriyor
Codex 3-4 kat daha yavaş ama daha temkinli ve sistematik kod yazıyor; kendiliğinden refactor yapıyor ve yönerge dosyasına (AGENTS.md) sıkı biçimde uyuyor
Değerlendirmeye göre Claude Code hızlı prototipleme için, Codex ise kurumsal düzeyde yazılım geliştirme için daha uygun
Sonuç olarak iki araç da yazılım mühendisliği yetkinliği olmadan iyi sonuç üretmekte zorlanıyor

Yazarın geçmişi ve geliştirme ortamı

MAG7 (ABD’nin büyük teknoloji şirketleri) ve başka bir büyük teknoloji şirketinde 14 yıl çalışmış, Principal/Staff Eng Manager seviyesinde bir mühendis
Ağırlıklı uzmanlığı platform seviyesi geliştirme ve dağıtık sistemler
Proje, VSCode eklentisi olarak kurgulanmış Python/TypeScript tabanlı 80 bin satırlık kod, yaklaşık 2.800 test içeriyor
Kullanıcı PDF/CSV/XML dosyaları yüklediğinde bunları parse edip Postgres tabanlı yapılandırılmış veri modeline normalize eden bir veri analizi uygulaması
Arka uç, gerçek zamanlı veri sağlayıcısına WebSocket ile bağlanarak güncel veriyi veri modeline akıtıyor
Sunucu tarafında veri akışı tabanlı analiz güncelleniyor ve SSE (Server-Sent Events) ile web arayüzüne iletiliyor
Vibe coding değil, sistematik mimari temelli geliştirme yapılıyor

Ortak ajan iş akışı

Önce Plan modunda kapsamı yeterince net tanımlanmış bir prompt ile başlanıyor ve plan-review yeteneğiyle 8 alt ajan (mimari, kodlama standartları, UI tasarımı, performans vb.) çalıştırılıyor
Her alt ajanın, önceki araştırma oturumlarında oluşturulmuş referans belgelerle (ör. postgres_performance.md, python_threading.md, software_architecture.md) birlikte özelleştirilmiş prompt’ları bulunuyor
- Mimari inceleme uzmanı için prompt, SOLID, DRY, KISS, YAGNI gibi kavramlara göre gözden geçirme yapacak şekilde hazırlanmış
Kod yazıldıktan sonra planın her aşaması için ayrı commit atılıyor; code-review yeteneğiyle (plan alt ajanlarını yeniden kullanarak) her commit inceleniyor ve geri bildirimler elle kontrol edilip ayarlanıyor
CLAUDE.md yaklaşık 100 satır; TDD, Git iş akışı, temel DevEx kuralları, Docker komutları gibi proje araç kullanımını içeriyor

Claude Code deneyimi (Opus 4.6)

Son teslim tarihine yetişmeye çalışan bir mühendis gibi davranıyor; temel mimariyi yeniden değerlendirmekten çok hack, patch ve helper function yağdırarak yalnızca işlevi yetiştirmeye odaklanma eğiliminde
İnteraktif, ama bu yüzden daha fazla gözetim gerektiriyor
Çalışan kodu hızlı üretiyor, ancak harekete geçmeden önce yeterince düşünmüyor
Bağlam elle dikkatlice yönetilse bile (1M context’in acemiler için tuzak olduğu ve 1/4’ün altında tutulması gerektiği düşünülüyor), neredeyse her oturumda CLAUDE.md’yi bariz şekilde yok saydığı durumlar yaşanıyor
Görevleri yarım bırakma eğilimi sık görülüyor
- Örnek: 8 test suite’inin asenkron örüntü migrasyonunda çoğunu dönüştürüp bazılarını eski örüntüde bırakması
Yeni özellikler için yeni dosya oluşturmayı neredeyse hiç tercih etmiyor, bunun yerine mevcut dosyalara sürekli fonksiyon ekliyor
- Bu durum güçlü OO ilkeleri ve dosya başına 600 satırdan kısa tutma tercihiyle çelişiyor
Testler bozulduğunda prompt olmadan keyfi düzeltmeler yapma eğilimi var; bu yüzden "test bozulursa dur ve bana sor" gibi yönergeler sıkça eklenmek zorunda kalıyor
- Yazdığı testlerin %95’i faydalı olsa da, %5’i yanlış davranışı sabitliyor ve bu zamanla birikiyor

Codex deneyimi (GPT-5.4)

5-6 yıllık deneyime sahip genç bir kıdemli mühendis gibi hissettiriyor; ayrıca söylenmeden durup kodu daha temiz hâle getirmek için yeniden işliyor
Claude’dan 3-4 kat daha yavaş (aynı görev için)
Daha temkinli ve bilinçli çalışıyor; Claude gibi bir 'god class'ı büyütmek yerine kodu otomatik olarak daha sıkı biçimde organize ediyor
Çalışma sırasında kendi varsayımlarını yeniden gözden geçirip süreç içinde rework yapıyor
Beklenmeyen katma değerli işler üstlendiği de oluyor
AGENTS.md’yi yok saydığı hiç görülmemiş; oturum sırasında yönergeleri geçersiz kılmaya çalışsanız bile buna izin vermiyor
Yeterli yetkinliği gösterdiği için görevi verip bitince inceleme modeline geçilebiliyor; anlık izleme gerekmiyor

Genel karşılaştırma

Codex Pro x5 kullanım limiti, Claude x20 ile benzer seviyede
Codex belirgin biçimde daha yavaş ve daha az interaktif ama daha temkinli; Claude ise hızlı ve interaktif ama yönetim gerektiriyor
Claude ile tek oturumda daha fazla iş hacmi çıkarılabiliyor, ancak Codex’in iş kalitesi daha yüksek
- Claude ile son derece hızlı prototipleme ve build mümkün, ancak birkaç günde bir refactor yönlendirmesi yapmak gerekiyor
- Codex’te de uygulama büyüdükçe refactor gerekir, ama seviye "hangi dağınıklıkları toplamalıyız" değil, "uygulama büyüdü, artık refactor zamanı" düzeyinde
Düşük ila orta karmaşıklıktaki projelerde vibe coding için Claude daha hızlı tamamlanabiliyor
Kurumsal yazılım inşasında Codex daha uygun
İki araç da faydalı, ancak Claude, Codex’e kıyasla daha deneyimli ve daha odaklı bir sürücü istiyor
Yazılım mühendisliğini hiç bilmiyorsanız iki araç da iyi sonuç vermiyor

📋 Reddit yorumlarında öne çıkan başlıklar

İki aracı birlikte kullanma stratejisi (en sık anılan konu)

Claude ile taslak/hızlı iş → Codex ile kod inceleme şeklindeki çapraz doğrulama iş akışı en popüler kalıp
- "Claude’un yazdığı kodu Codex’e inceletin, tersini de deneyin" — iki modelin aynı şekilde halüsinasyon görmesi son derece nadir
Claude token’ları bittikten sonra Codex’e geçen baton-pass stratejisi kullananlar da var
- Durum save-state.md ve next-task.md içinde saklanıyor; Codex buradan devam ediyor ve her geçişte handoff kalitesi iyileşiyor
Codex CLI’yi MCP sunucusu olarak sarmalayıp Claude Code içinde Codex iş birliğini otomatikleştiren örnekler de var
- Claude görevini tamamladıktan sonra Codex öneri döndürüyor, Claude da bunu uyguluyor; bu yöntemle kod kalitesinin dramatik biçimde arttığı söyleniyor
Gün boyu Codex ile çalışıp son rötuşları Claude ile yaptıktan sonra tekrar Codex’e dönmek de işe yarayan bir akış olarak görülüyor

Codex’in artılarına katılım

Claude Code’u 20x ($200) plandan 5x ($100) plana düşürüp buna Codex’in $100 planını ekleyen kullanıcılar var
GPT-5.4 ile Opus 4.6 arasında çok ciddi bir kalite farkı algılanmadığı, sonucun probleme göre 50:50 değiştiği belirtiliyor
"Bırakıp kahve içmeye gidiyorsun, dönünce bitmiş oluyor" — fire-and-forget kullanımında Codex’in Opus’tan daha iyi olduğu görüşü var
Codex’in AGENTS.md yönergelerine reddedecek kadar sıkı uyduğu, bunları yok sayması için açıkça override edilmesinin gerektiği söyleniyor
Tamamen Codex ile plan + uygulama + ayrı bir Codex instance’ı ile review düzenine geçenlerin daha iyi sonuç aldığını bildiren yorumlar mevcut

Codex’in eksileri

En büyük şikâyet robotik iletişim tarzı
- Python dict içindeki [0.1, 0.3, 0.5, 0.7, 0.9] değerlerini tek satırda yazmak yerine her değeri ayrı satıra koyarak çıktı vermesi gibi
- RL eğitiminin "ne kadar çok bullet point, o kadar iyi" yönünde ödüllendirilmiş olabileceği tahmin ediliyor
- İletişim ayarları değiştirilse bile aşırılıklar arasında gidip geliyor ve uygun dengeyi bulmak zor oluyor
Kullanıcıya sürekli itiraz etme eğilimi — 10+ yıllık deneyimli geliştirici net yönerge verse bile karşı çıkıp durabiliyor ve sonunda daha iyi bir alternatif de sunmayabiliyor
Konuşmanın gereksiz yere uzaması — işe odaklanamayıp dağınıklaşıyor
Büyük özellikler geliştirirken çok sayıda parçayı atlayabildiği, mevcut kod tabanını yeterince kavrayamadığı durumlar yaşanıyor
- Mevcut formatter varken yeni bir formatter yazması veya ViewModel içine hardcoded string yerleştirmesi gibi
Özellik seti açısından Claude Code’a göre hooks, MCP desteği ve eklentilerde geride; bu yüzden geçiş bazen geriye gidiş gibi hissettiriyor

Claude Code’un kronik sorunlarına katılım

Claude’un kullanıcının talimatlarını yok sayıp kendi istediği gibi davranması örüntüsüne geniş çaplı katılım var
- "Claude senin istediğini değil, istediğini sandığını yapmaya çalışıyor" — talimatlara uyum güvenilir bulunmuyor
- 100 nesnelik bir listeyi hardcode edip bunu başarı saydığı, bunu önleyen hooks’ları bile atlattığı örnekler aktarılıyor
Son aylarda Claude’un karmaşık kodda asıl sorunu bulamama eğiliminin arttığı söyleniyor
- Kök nedeni değil belirtileri yamayıp sonra da "sorunu buldum" diye kendinden emin davranabiliyor
- Codex’in de Claude’un özgüvenli ama yanlış analizinden yanıltıldığı durumlar olabiliyor
Claude’un kredi tüketim hızının çok yüksek olması nedeniyle aboneliğini iptal eden kullanıcılar da var — aracı öğrenmeye vakit bile kalmadığını söylüyorlar

Karşı görüş: Claude hâlâ önde diyenler

Opus 4.6’nın daha temkinli ve daha derin düşündüğü, tasarım/mimari aşamasında GPT-5.4’ten daha iyi analiz verdiğini söyleyen deneyimler de var
- GPT-5.4’ün kaçırdığı bazı sorunları Opus’un review sırasında ek olarak yakaladığı belirtiliyor
- Ancak bunun, son dönemde Claude modellerinin "daha az çaba harcayacak şekilde" ayarlanmış olduğu söylentisiyle ilgili olabileceği de ekleniyor
Clean Architecture açıkça istendiğinde Claude’un da yeni dosyaları aktif biçimde oluşturduğu ve god class sorununun ortaya çıkmadığı söyleniyor
- Her iki araç da mimariye uyduğunda kod kalitesi neredeyse eşdeğer; fark daha çok hız ve kullanım kolaylığında ortaya çıkıyor
Sistematik bir iş akışı (plan mode + custom skill’ler + coderabbit/sonarqube geri bildirimi) kurulduğunda, başkalarının yoğun şikâyet ettiği dönemlerde bile iyi kod üretilebildiği ve limite takılınmadığı anlatılıyor

Diğer ilginç görüşler

"Anthropic ekibinin bu kadar çok özellik çıkarabilmesi etkileyici; hele ki kodun %100’ünü Claude yazıyorsa" (alaycı bir yorum)
"Codex ile kodla → Claude’da review et → Gemini’yi de review’a kat" — 3 modelle çapraz inceleme stratejisi; bazen Sonnet, Opus’un kaçırdığını yakalayabiliyor
"Muhtemelen Mythos (bir sonraki nesil model) gelince bu tür uğraşlar azalır" beklentisi de dile getiriliyor

18 yorum

brainer 15 일 전

Hangisi olursa olsun HITL gerekiyor. (En azından bugün itibarıyla)
Lütfen Ralph Loop falan gibi şeyler söylemeyin.

loblue 12 일 전

Ben sadece Codex kullanıyorum ve hissettiklerimle tam olarak örtüşüyor.
Benim tarzıma da uyduğu için memnuniyetle kullanıyorum.
KakaoTalk ChatGPT bitince Claude'a geçmeyi düşünüyordum
ama nedense Claude'un dezavantajları benim tarzıma uymayacakmış gibi geliyor..

oberon 13 일 전

Claude ve Codex kullanıcılarının ağırlıklı olarak kullandıkları diller arasında bir fark var mı acaba.

tested 14 일 전

> Kullanıcıya durmaksızın itiraz etme eğilimi — 10 yıldan fazla deneyime sahip bir geliştirici açıkça talimat verse bile sürekli itiraz ediyor, üstelik sonunda kendi başına iyi bir alternatif de sunamıyor.

gülme

clash4970 14 일 전

Kullanım biçimindeki farkların da etkisi vardır diye düşünüyorum. Geliştiricinin eğilimine göre ele alış şekli değiştiği ve zevkler farklı olduğu gibi. Çok kullanınca belirli bir modelle çalışma akışına alışılıyor; bu yüzden başka bir model de yabancı gelebilir.

sea715 14 일 전

Belirli bir modelde ısrar etmek için bir neden var mı, emin değilim~

tangokorea 15 일 전

Hangi alana uygulandığına göre değişmiyor mu?
Şu anda üzerinde çalıştığım rhwp gibi, 1 mm’lik render farklarını yakalayıp işlemem gereken durumlarda Codex kullanırsam işler bozuluyor. Şimdilik yüksek zorluk seviyesinde Claude Code önde olsa da, belirli bir seviyeye kadar prosedüre göre işlenmesi yeterli olan ve sadece iş akışı ile framework gerektiren web uygulaması geliştirmede Codex kullanmanın ruh sağlığı açısından daha iyi olduğunu düşünüyorum.

act1000 7 일 전

Memnuniyetle kullanıyorum
Mac'te Viewer'dan daha hızlı yükleniyor ve harika!

kyg5474 9 일 전

Ezici derecede teşekkürler

ifmkl 13 일 전

Oo, çok iyi kullanıyorum. Harika proje için teşekkürler.

dhlee0305 14 일 전

rhwp'yi iyi kullanacağım.

saygılar

bungker 15 일 전

Codex'in titiz olduğuna katılıyorum. Claude ile yazıp Codex ile review etmenizi öneririm. Çok zaman alıyor ama tuvalete gitmeden ya da toplantıdan önce çalıştırıp bırakırsanız tamamlanma oranı da yüksek oluyor.

oneforall88 15 일 전

Ben de bunu yapıyorum. Biraz daha detaylı anlatırsam, 100 dolarlık Claude ve 200 dolarlık Codex kullanacak şekilde ayarladım; Claude Code Opus ile planlama -> Sonnet ile uygulama -> Codex incelemesi -> Opus ile inceleme doğrulaması -> tekrar Sonnet ile uygulama -> Codex incelemesi (ve sonrası aynı döngü) şeklinde sürekli dönecek biçimde bunu adeta bir skill haline getirdim ve memnunum.

minhoryang 15 일 전

Ben de bunu bu şekilde kullanıyorum. Ancak rolü tek bir modele sabitlemektense, kotası en esnek ama aynı zamanda en güçlü olan modele önce atama yapıyorum.

gpdir16 15 일 전

Ben ikisini de kullanıp tam tersini düşündüm ama öyle değilmiş galiba.
Ben kullanırken Codex çoğu zaman yönergeleri görmezden geliyordu.
Son zamanlarda Anthropic 4.6 Opus performansını düşürdü, ondan dolayı değişmiş gibi de görünüyor.

master6559 15 일 전

Tersi değil mi? Kıdemli sandığımdan daha yetersizmiş.

wedding 15 일 전

Claude Code'un kronik sorunu; görünüşe göre bunu hiç yaşamamışsınız. Reddit'te de sürekli ortalık karışıyor.

shblue21 15 일 전

Benim için daha iyi deneyim codex oldu.