GPT-5-Codex
(openai.com)- GPT-5-Codex, gerçek yazılım mühendisliği için optimize edilmiş bir model olup kısa etkileşimli oturumlardan uzun süreli bağımsız çalışmalara kadar her ikisini de destekler
- Yeni modelde kod inceleme yetenekleri güçlendirildi; bağımlılık keşfi, test çalıştırma ve niyet ile uygulamayı karşılaştırma yoluyla kritik hataları erken yakalar
- Büyük ölçekli kod refaktöringi gibi işlerde üstün performans gösterir ve kullanıcı gereksinimlerine göre çalışma süresini dinamik olarak ayarlar
- Codex CLI ve IDE eklentileri yenilenerek görsel ekleme, iş ilerleyişi takibi, web araması ve MCP entegrasyonu gibi ajan tabanlı iş akışlarına uygun hale getirildi
- GitHub entegrasyonu sayesinde PR'leri otomatik inceleyip düzeltme önerileri sunabilir; böylece ekibin inceleme yükünü azaltır ve sürüm güvenilirliğini artırır
- Codex artık ChatGPT Plus, Pro, Business, Edu, Enterprise planlarına dahil
GPT-5-Codex
- GPT-5-Codex, karmaşık gerçek dünya mühendislik işlerine (proje derleme, özellik ekleme, büyük ölçekli refaktöring, hata ayıklama, kod inceleme) odaklanmış bir modeldir
- AGENTS.md yönergelerine uyma becerisi geliştirildiği için kod stili veya temizlik hakkında uzun açıklamalar olmadan da istenen sonuç alınabilir
- İşin zorluk derecesine göre düşünme süresini dinamik olarak ayarlar
- Basit isteklere hızlı yanıt verir; büyük ölçekli işlerde ise saatler boyunca bağımsız çalışıp sonucu iyileştirir
- Kod incelemesi için optimize edilmiştir; kod tabanını gezerek, bağımlılık analizi yaparak ve test çalıştırarak doğru doğrulama gerçekleştirir
- Açık kaynak proje commit'lerinin doğrulanmasında GPT-5-Codex incelemeleri daha güvenilir olarak değerlendirildi
- Frontend işlerinde de güçlüdür; bulutta görsel girdi kullanarak ilerlemeyi görsel olarak inceleyebilir ve sonuçları ekran görüntüsü olarak paylaşabilir
- GPT-5 genel amaçlı bir modelken, GPT-5-Codex yalnızca Codex ortamına yönelik ajan tabanlı kodlama işleri için tasarlanmıştır
Codex güncellemeleri
- Codex CLI ve IDE eklentileri, ajan tabanlı kodlama deneyimi odağında yeniden tasarlandı
- CLI tarafında görsel ekleme, iş ilerleyişi için To-Do yönetimi, dış sistem bağlantısı mümkün hale geldi
- Terminal arayüzü, araç çağrıları ve diff'lerin daha kolay görülmesini sağlayacak şekilde iyileştirildi
- Onay modu sadeleştirilerek aynı anda hem güvenlik hem kullanım kolaylığı sağlandı
- IDE eklentisi VS Code, Cursor gibi ortamlarda çalışır; dosyalar ve seçili kod temelinde daha kısa prompt'larla daha hızlı sonuç verir
- Yerel ve bulut ortamları arasında sorunsuz geçiş yapar; devam eden işleri izlemeyi ve tamamlanan işleri gözden geçirmeyi destekler
- Bulut ortamında önbellekleme ile hız artışı (%90 kısalma), otomatik ortam kurulumu ve internet erişim denetimi güçlendirildi
- UI tasarım spesifikasyonları veya hata bildirimlerinde görseller kullanılabilir; Codex kendi tarayıcısını açıp çıktıyı doğrulayabilir ve PR'ye ekran görüntüsü ekleyebilir
- GitHub entegrasyonu ile PR otomatik inceleme ve düzeltme önerileri desteklenir
- Belirli bir inceleme isteği için
@codex reviewkomutu kullanılabilir - OpenAI içinde de PR'lerin çoğu Codex tarafından ön incelemeden geçirilir ve yüzlerce sorun erken aşamada tespit edilir
- Belirli bir inceleme isteği için
Güvenlik ve emniyet
- Codex varsayılan olarak sandbox ortamında çalışır; ağ erişimi kısıtlıdır
- Onay temelli olarak riskli komutların çalıştırılması denetlenebilir ve yalnızca güvenilen domain'lere izin verilebilir
- Geliştiriciler güvenlik seviyesini kendi ortamlarına göre ayarlayabilir; Codex ise doğrulamayı desteklemek için her işte log'lar ve test sonuçları sunar
- İnsan incelemesinin yerini alması yerine yardımcı bir inceleyici olarak kullanılması önerilir
- GPT-5-Codex, biyoloji ve kimya alanlarında yüksek yetenekli bir model olarak sınıflandırıldığı için güvenlik önlemleri uygulanır
Fiyatlandırma ve sunum
- Codex, ChatGPT Plus, Pro, Business, Edu, Enterprise planlarına dahildir
- Plus/Edu/Business haftada 1-2 oturum için uygundur; Pro ise tam zamanlı haftalık geliştirme çalışmasını destekler
- Business planında ek kredi satın alınabilir, Enterprise ise paylaşımlı kredi havuzu ile çalışır
- Codex CLI API anahtarı kullananlara da yakında GPT-5-Codex sunulacak
- Codex, daha hızlı ve daha güvenilir bir kodlama partneri olarak gelişmeye devam edecek ve ekiplerin iddialı projeleri hayata geçirmesine yardımcı olan bir araç haline gelecek
6 yorum
Birden fazla bağlamın dikkate alınması gereken sorunlarda problem çözme yeteneği zayıf ve genel olarak gereksiz tasarım kalıbı kodlarını çok kullanıyor. Eğitimde gerçek dünya kodundan ziyade çoğunlukla öğretici örnek kodların kullanıldığı izlenimini güçlü biçimde veriyor.
Genel olarak Gemini ile arasında oldukça belirgin bir performans farkı var.
Claude Code ile karşılaştırınca, şimdilik Claude Code biraz daha kullanışlı mı?
Sonuçta iyi bir AI aracı, kullanıcının kültürel birikim(?) düzeyini hesaba katarken aynı zamanda ortaya çıkan sonucun kalitesini de belli bir seviyede garanti edebiliyorsa, iyi bir kullanıcı deneyimi mi sunmuş olur?
Her seviyeden kullanıcının istisnasız şekilde AI araçlarından daha iyi bir şeyler bekliyor olması ilginç.
Claude çok kullanışsız olduğu için ona geçmeyi düşünüyorum.
Acaba hangi nokta sizi rahatsız ediyor?
Hacker News görüşleri
Yeni modelin prompt boyutunun öncekine göre neredeyse yarıya indiği doğrulanmış (10KB vs 23KB) (ilgili kaynaklar: önceki prompt örneği, daha eski prompt örneği)
SWE-bench performansı mevcut gpt-5 ile benzer, ancak
gpt-5-codexözellikle kod refaktörü alanında güçlendirilmiş gibi görünüyor (iç benchmark’a göre 33.9% -> 51.3%)Yakın zamanda Codex CLI(
gpt-5-high) ile birkaç dahili kütüphaneyi paketlere ayıran büyük bir refaktör denedim; model dosyaları silip yeniden yazma sürecinde sık sık bug üretti (önemli dosyaların eksik kalması gibi)Ben şahsen dosyaları doğrudan kopyalayıp paket bazında düzenleme yaklaşımını tercih ediyordum; bu iyileştirmede ise daha iyi tool calling uygulanmış gibi görünüyor
Ayrıca yeni modelin daha "steerable" (açık şekilde yönlendirilebilir) olduğu iddia ediliyor; benim deneyimimde Codex CLI(gpt-5) zaten Claude Code’dan çok daha kolay kontrol edilebiliyordu ve ek iyileştirmeler çok memnuniyet verici
SWE-bench puanlarının gpt-5 ve gpt-5-codex için benzer olduğu konusunda hemfikirim, ancak SWE-bench değerlendirmesinin kendisi oldukça sınırlı bir test
Aynı puan olsa bile gerçek kullanım deneyimi büyük ölçüde farklı olabilir
SWE-bench’in ölçemediği unsurları ayrıntılı ele alan bir X(eski Twitter) flood’u da paylaşılmış: bağlantı
"Daha steerable" olması aslında dezavantaj da olabilir
Çünkü promptları bazen fazla harfiyen uygulayabiliyor
Sonuç olarak daha iyi prompt yazma yöntemleri ve modelden nasıl yararlanılacağına dair anlayış gerekiyor
Üst seviye yazılım mühendisleri için iyi olabilir ama sezgisel şekilde kod yazan geliştiriciler(vibe-coder) için zorlayıcı olabilir
Birdenbire Codex CLI w/gpt-5-codex’in Claude Code’dan daha iyi hale geldiğini söyleyen çok görüş var ama buna kolayca inanmak zor
Promptun bir kısmının daha üst katmanlara taşınmış ya da başka bir şekilde gömülmüş(bake edilmiş) olup olmadığını merak ediyorum
Kod refaktöründe pakete taşırken dosyaları doğrudan elle taşıma yöntemini tavsiye ederim
Codex’e sadece "eskiden dosya başka bir konumdaydı, çalışacak şekilde düzelt" demek yeterli
Dosya taşıma kavramını Codex ve diğer CLI’lar hâlâ iyi yönetemiyor gibi görünüyor
Özellikle dosya silme/taşıma işlemleri git commit oluşturulurken neredeyse hiç düzgün izlenmiyor
Uzun süredir claude-4-sonnet + Cursor kombinasyonunun ateşli bir kullanıcısıydım ama son 2 ayda kullanımım ciddi biçimde arttı
Cursor’un temel aboneliğinden Pro’ya yükselttim, ama yine sınıra takıldım ve sonunda Claude API anahtarını doğrudan kullanıp haftada yaklaşık 70 dolar harcamaya başladım (sürdürülebilir gelmiyor)
Sonra grok-code-fast-1 çıktı; bunu Cursor’a bağlayıp her gün kullanmaya başladım, hızlı, ucuz (şimdiye kadar ücretsiz) ve çok memnun kaldım
Yakın zamanda GPT-5’i de resmi Codex VSCode eklentisi üzerinden denedim ve gerçekten şaşırtıcı derecede iyi buldum
gpt-5-mediumile bir React Native uygulamasını büyük ölçüde refaktör edip uygulama yapısını ve performansını tek bir gecede iyileştirdim (bunu kendim yapsaydım en az 2 gün sürerdi)Şu anda
gpt-5-medium-codexile uygulamanın routing yapısını baştan elden geçirtiyorum; çok sayıda tool call yapıyor, komutları anlama ve uygulama biçimi de çok sistematikBundan sonra kullanacağım stack muhtemelen Cursor + grok-code-fast-1(günlük işler için), gerektiğinde de Codex/GPT olacak
Bu arada
gpt-5-mediumu gün boyu gerçekten çok zorladım ama ChatGPT Plus hesabıyla bir kez bile limite takılmadım; bu yüzden OpenAI ekibine minnettarımgpt-5-mediumile refaktör denediğin workflow’u merak ediyorumKendim test edebileceğim uygun bir örnek olmadığı için, modele promptları nasıl verdiğini, ne tür öneriler aldığını ve geliştirici olarak kendi bilgimin ne kadar yardımcı olacağını merak ediyorum
Senin empati kurulabilir deneyimin ortalama bir SWE ya da ortalama bir geliştirici için de mümkün mü, bunu öğrenmek isterdim
Cursor’u 1 yıldır kullanıyorum ve ilk kez kullanım limitini aştım
Claude, GPT ve Grok’un hepsinde limite takıldığım oldu
Bu yüzden Cursor Pro aboneliği içinde ek kullanım ödemesini (ayda $25, yani $20+$5) seçip Claude kullanmaya devam ediyorum; çünkü Grok’tan daha hızlıydı
Ben de neredeyse aynı kararı verdim
grok-code-fast-1çoğu kodlama görevinde iyi iş çıkarıyorŞu anda opencode içinde kullanıyorum; belli bir ücretsiz kota veriyor gibi görünüyor ve ayrıca bir grok anahtarı eklememiş olmama rağmen kullanabildim
Codex CLI IDE’nin kalitesinden çok etkilendim
Daha önce zayıf bulduysanız bile, vscode eklentisiyle tekrar denemenizi öneririm; Plus aboneliğinde cömertçe verilen kullanım miktarı buna değiyor
Claude code max aboneliğini bırakıp ChatGPT pro $200 planına geçtim
Çok daha hızlı ve şu ana kadar limite hiç takılmadım
Proje geliştirmede aider ile gemini pro kombinasyonunu kullanıyorum
Özellikle kendi araç projemi paylaşayım: aretecodex.tools
Cursor’u 20 dolarlık planda kullanıyorum ama 15 günde limite ulaştım ve ayın kalanında ek ücret ödemek zorunda kaldım
Önerilebilecek çözümleri merak ediyorum
CLI IDE’nin tam olarak ne anlama geldiğini merak ediyorum
Artık claude code gibi abonelik modeliyle de kullanılabiliyor mu, yoksa sadece API mi var, kafam karıştı
Bu başlıkta birçok kullanıcının Codex’e geçmesi ya da Claude Code’dan uzaklaşması ilgimi çekti
Claude Code’un en büyük sorunu, çok fazla iş yüklendiğinde mock implementasyonlar ya da sahte kod üretmeye sık sık başlaması ve bunun pratikte sorunları daha da kötüleştirmesiydi
Girdi promptunu ayarlayarak bunu düzeltmekte zorlandım ve sonunda Codex’e geçtim
Codex’in zaten tamamen kurulmuş bir codebase içinde çalışma avantajı var, ama gerçek deneyim açısından da Codex çok daha iyiydi
Diğer sistemlerde ayrı bir "planning" modu olmadığından, baştan doğrudan implementasyona geçmeye çalışıyorlar; bu yüzden promptu dikkatle ayarlamak gerekiyor
Claude "plan > execute" yapısını ayrı desteklediği için yaklaşım farklı
Son 2 haftalık gözlemime göre Claude Code hem performans olarak çok geriledi hem de kullanım kotası ciddi biçimde düştü; buna karşılık OpenAI Codex hem performansını artırmış hem de kotası çok daha cömert hale gelmiş gibi hissettiriyor
Bir aydan uzun süredir denememiş olan varsa, Codex CLI’ı yeniden test etmesini öneririm
Son kullanıcı açısından en önemli şeyin "istediğin an çıkabilmek" olduğunu düşünüyorum
Servisleri sürekli karşılaştırıp fiyat/performans oranı en iyi olanı seçmek gerekiyor
Geçen yıl boyunca farklı şirketler çeşitli artı ve eksilerle rekabet etti ama gerçekten çığır açıcı bir hizmet çıkmadı
Belirli bir hizmette ısrar etmenin anlamı yok; kullanıcıyı elde tutmaya çalışanlar asıl SaaS şirketleri
Codex CLI’ın projede git varsa otomatik olarak "YOLO(önce yap, sonra düşün)" tarzında davranma alışkanlığının sürüp sürmediğini merak ediyorum
Bir kodlama yardımcısında mutlaka görmek istediğim şeyler şunlar:
rmgibi tehlikeli komutlarda her seferinde onay istemesiBuild hook’ları ya da sub-agent özellikleri olmasa da çok sorun değil
Bir şeyi merak ediyorum: Codex CLI’da Claude’un "normal mode"una denk gelen modu nasıl kullanıyoruz?
Codex ya vibe coding ya da plan modu sunuyor gibi; ama arada "bu işi(a/b) yapmamı ister misin" diye soran etkileşimli bir mod olmayınca insanı sıkıştırıyor
Düzenlenmiş kodu kopyala-yapıştır ile almak ya da otomatik kabul etmek arasında seçim yapmak zorunda kalmayı anlamakta zorlanıyorum
Ardından plan döngüsünü birkaç kez gözden geçirip ancak sonra yürütmeye geçmesini istiyorum
Bazen LLM planı "unutabiliyor", bu yüzden planı ayrı kopyalayıp saklıyorum
Görevi adım adım bana teslim etmesini ya da build/unit test gibi her kilometre taşında doğrulama yapmasını da sağlıyorum
Oldukça etkileyici geldi
"Paylaşılan varlık" animasyonu üzerinde çalışırken (tüm kullanıcıların imleç konumuna göre arka planı değişen bir web uygulaması) hem Claude hem Codex ile denemeler yaptım
Düne kadar iki model de zorlanıyordu, ama Claude hafifçe öndeydi
Bir şeyi "yaratıcı" şekilde üretmesi gereken durumlarda iki model de biraz sıradan(stock) sonuçlar veriyordu ve simülasyon tarafını uygulamak zordu
Bugün aynı görevi Codex ile yaptığımda tasarım tarafı hâlâ zayıftı ama simülasyon kısmı çok daha iyi performans gösterdi
Ek UI özellikleri ya da "mevcut uygulama tasarımını referans alıp buna uydur" gibi talimatlar verirsen sonuçlar çok daha iyi olur
Yapay zeka ile kodlamaya yeniden şans vermek için ChatGPT’ye abone olup Codex’i denedim ama hız bana aşırı yavaş geldi
Neredeyse boş bir repository’de çok basit bir görev olmasına rağmen model 20 dakika boyunca sadece "düşünüyor"
Mühendisin yalnızca beklediği bu deneyimin gerçek üretkenliğe katkısı konusunda şüpheliyim
Asenkron bir ajan ise birkaç tanesini paralel çalıştırmak mümkün olabilir, ama bunun için yapılandırılmış bir codebase gerekiyor ve ben saatler harcamama rağmen daha bir iskelet bile çıkaramadım
Dokümanları ve videoları da okuyup izledim ama bu gidişle bunu elle yapmak çok daha hızlı olacak gibi geliyor
Yanlış yaptığım bir şey mi var, sadece sunucu yükü mü fazla, yoksa mevcut yapay zeka seviyesi zaten bu mu, merak ediyorum
Birden fazla ajanı aynı anda çalıştırmaya alışınca oldukça işe yarar hale geliyor diye düşünüyorum
Bununla ilgili bir yazı okumuştum ama şu an bulmak zor
Hafta sonu ilk kez Codex’i denedim ve sonuç biraz tuhaftı
Oldukça basit bir örnekte bile (bir Rails uygulamasını Docker Compose ile ayağa kaldırmak ve ana sayfa/Devise eklemek) gerçek dosyaları oluşturmak yerine tüm dosya içeriklerini
bootstrap.shiçine hardcode ettiİleride farklı davranıp davranmayacağını görmek için biraz daha izlemek istiyorum
Geçen ay satın alıp ChatGPT kullanıyorum; OpenAI’ın son zamanlarda kullanıcı deneyimini epey iyileştirdiğini düşünüyorum
Örneğin voice modu Claude’dan çok daha iyi ve model adları da eskiden kafa karıştırıcıyken şimdi sadeleştiği için kullanımı kolaylaştı
Genel amaçlı asistan olarak da Claude’dan daha iyi performans verdi ve OpenAI yeni araçları sürekli çıkardığı için güvenilirlik açısından da önde görünüyor