GPT-5-Codex

(openai.com)

16 puan yazan GN⁺ 2025-09-17 | 6 yorum | WhatsApp'ta paylaş

GPT-5-Codex, gerçek yazılım mühendisliği için optimize edilmiş bir model olup kısa etkileşimli oturumlardan uzun süreli bağımsız çalışmalara kadar her ikisini de destekler
Yeni modelde kod inceleme yetenekleri güçlendirildi; bağımlılık keşfi, test çalıştırma ve niyet ile uygulamayı karşılaştırma yoluyla kritik hataları erken yakalar
Büyük ölçekli kod refaktöringi gibi işlerde üstün performans gösterir ve kullanıcı gereksinimlerine göre çalışma süresini dinamik olarak ayarlar
Codex CLI ve IDE eklentileri yenilenerek görsel ekleme, iş ilerleyişi takibi, web araması ve MCP entegrasyonu gibi ajan tabanlı iş akışlarına uygun hale getirildi
GitHub entegrasyonu sayesinde PR'leri otomatik inceleyip düzeltme önerileri sunabilir; böylece ekibin inceleme yükünü azaltır ve sürüm güvenilirliğini artırır
Codex artık ChatGPT Plus, Pro, Business, Edu, Enterprise planlarına dahil

GPT-5-Codex

GPT-5-Codex, karmaşık gerçek dünya mühendislik işlerine (proje derleme, özellik ekleme, büyük ölçekli refaktöring, hata ayıklama, kod inceleme) odaklanmış bir modeldir
- AGENTS.md yönergelerine uyma becerisi geliştirildiği için kod stili veya temizlik hakkında uzun açıklamalar olmadan da istenen sonuç alınabilir
İşin zorluk derecesine göre düşünme süresini dinamik olarak ayarlar
- Basit isteklere hızlı yanıt verir; büyük ölçekli işlerde ise saatler boyunca bağımsız çalışıp sonucu iyileştirir
Kod incelemesi için optimize edilmiştir; kod tabanını gezerek, bağımlılık analizi yaparak ve test çalıştırarak doğru doğrulama gerçekleştirir
- Açık kaynak proje commit'lerinin doğrulanmasında GPT-5-Codex incelemeleri daha güvenilir olarak değerlendirildi
Frontend işlerinde de güçlüdür; bulutta görsel girdi kullanarak ilerlemeyi görsel olarak inceleyebilir ve sonuçları ekran görüntüsü olarak paylaşabilir
GPT-5 genel amaçlı bir modelken, GPT-5-Codex yalnızca Codex ortamına yönelik ajan tabanlı kodlama işleri için tasarlanmıştır

Codex güncellemeleri

Codex CLI ve IDE eklentileri, ajan tabanlı kodlama deneyimi odağında yeniden tasarlandı
- CLI tarafında görsel ekleme, iş ilerleyişi için To-Do yönetimi, dış sistem bağlantısı mümkün hale geldi
- Terminal arayüzü, araç çağrıları ve diff'lerin daha kolay görülmesini sağlayacak şekilde iyileştirildi
- Onay modu sadeleştirilerek aynı anda hem güvenlik hem kullanım kolaylığı sağlandı
IDE eklentisi VS Code, Cursor gibi ortamlarda çalışır; dosyalar ve seçili kod temelinde daha kısa prompt'larla daha hızlı sonuç verir
- Yerel ve bulut ortamları arasında sorunsuz geçiş yapar; devam eden işleri izlemeyi ve tamamlanan işleri gözden geçirmeyi destekler
Bulut ortamında önbellekleme ile hız artışı (%90 kısalma), otomatik ortam kurulumu ve internet erişim denetimi güçlendirildi
- UI tasarım spesifikasyonları veya hata bildirimlerinde görseller kullanılabilir; Codex kendi tarayıcısını açıp çıktıyı doğrulayabilir ve PR'ye ekran görüntüsü ekleyebilir
GitHub entegrasyonu ile PR otomatik inceleme ve düzeltme önerileri desteklenir
- Belirli bir inceleme isteği için @codex review komutu kullanılabilir
- OpenAI içinde de PR'lerin çoğu Codex tarafından ön incelemeden geçirilir ve yüzlerce sorun erken aşamada tespit edilir
Reklam

Güvenlik ve emniyet

Codex varsayılan olarak sandbox ortamında çalışır; ağ erişimi kısıtlıdır
- Onay temelli olarak riskli komutların çalıştırılması denetlenebilir ve yalnızca güvenilen domain'lere izin verilebilir
Geliştiriciler güvenlik seviyesini kendi ortamlarına göre ayarlayabilir; Codex ise doğrulamayı desteklemek için her işte log'lar ve test sonuçları sunar
İnsan incelemesinin yerini alması yerine yardımcı bir inceleyici olarak kullanılması önerilir
GPT-5-Codex, biyoloji ve kimya alanlarında yüksek yetenekli bir model olarak sınıflandırıldığı için güvenlik önlemleri uygulanır

Fiyatlandırma ve sunum

Codex, ChatGPT Plus, Pro, Business, Edu, Enterprise planlarına dahildir
- Plus/Edu/Business haftada 1-2 oturum için uygundur; Pro ise tam zamanlı haftalık geliştirme çalışmasını destekler
Business planında ek kredi satın alınabilir, Enterprise ise paylaşımlı kredi havuzu ile çalışır
Codex CLI API anahtarı kullananlara da yakında GPT-5-Codex sunulacak
Codex, daha hızlı ve daha güvenilir bir kodlama partneri olarak gelişmeye devam edecek ve ekiplerin iddialı projeleri hayata geçirmesine yardımcı olan bir araç haline gelecek

6 yorum

aeolian21 2025-09-18

Birden fazla bağlamın dikkate alınması gereken sorunlarda problem çözme yeteneği zayıf ve genel olarak gereksiz tasarım kalıbı kodlarını çok kullanıyor. Eğitimde gerçek dünya kodundan ziyade çoğunlukla öğretici örnek kodların kullanıldığı izlenimini güçlü biçimde veriyor.
Genel olarak Gemini ile arasında oldukça belirgin bir performans farkı var.

bluekai17 2025-09-18

Claude Code ile karşılaştırınca, şimdilik Claude Code biraz daha kullanışlı mı?

kuthia 2025-09-18

Sonuçta iyi bir AI aracı, kullanıcının kültürel birikim(?) düzeyini hesaba katarken aynı zamanda ortaya çıkan sonucun kalitesini de belli bir seviyede garanti edebiliyorsa, iyi bir kullanıcı deneyimi mi sunmuş olur?
Her seviyeden kullanıcının istisnasız şekilde AI araçlarından daha iyi bir şeyler bekliyor olması ilginç.

slowandsnow 2025-09-17

Claude çok kullanışsız olduğu için ona geçmeyi düşünüyorum.

shakespeares 2025-09-18

Acaba hangi nokta sizi rahatsız ediyor?

GN⁺ 2025-09-17

Hacker News görüşleri

Yeni modelin prompt boyutunun öncekine göre neredeyse yarıya indiği doğrulanmış (10KB vs 23KB) (ilgili kaynaklar: önceki prompt örneği, daha eski prompt örneği)
SWE-bench performansı mevcut gpt-5 ile benzer, ancak gpt-5-codex özellikle kod refaktörü alanında güçlendirilmiş gibi görünüyor (iç benchmark’a göre 33.9% -> 51.3%)
Yakın zamanda Codex CLI(gpt-5-high) ile birkaç dahili kütüphaneyi paketlere ayıran büyük bir refaktör denedim; model dosyaları silip yeniden yazma sürecinde sık sık bug üretti (önemli dosyaların eksik kalması gibi)
Ben şahsen dosyaları doğrudan kopyalayıp paket bazında düzenleme yaklaşımını tercih ediyordum; bu iyileştirmede ise daha iyi tool calling uygulanmış gibi görünüyor
Ayrıca yeni modelin daha "steerable" (açık şekilde yönlendirilebilir) olduğu iddia ediliyor; benim deneyimimde Codex CLI(gpt-5) zaten Claude Code’dan çok daha kolay kontrol edilebiliyordu ve ek iyileştirmeler çok memnuniyet verici
- SWE-bench puanlarının gpt-5 ve gpt-5-codex için benzer olduğu konusunda hemfikirim, ancak SWE-bench değerlendirmesinin kendisi oldukça sınırlı bir test
  Aynı puan olsa bile gerçek kullanım deneyimi büyük ölçüde farklı olabilir
  SWE-bench’in ölçemediği unsurları ayrıntılı ele alan bir X(eski Twitter) flood’u da paylaşılmış: bağlantı
- "Daha steerable" olması aslında dezavantaj da olabilir
  Çünkü promptları bazen fazla harfiyen uygulayabiliyor
  Sonuç olarak daha iyi prompt yazma yöntemleri ve modelden nasıl yararlanılacağına dair anlayış gerekiyor
  Üst seviye yazılım mühendisleri için iyi olabilir ama sezgisel şekilde kod yazan geliştiriciler(vibe-coder) için zorlayıcı olabilir
- Birdenbire Codex CLI w/gpt-5-codex’in Claude Code’dan daha iyi hale geldiğini söyleyen çok görüş var ama buna kolayca inanmak zor
- Promptun bir kısmının daha üst katmanlara taşınmış ya da başka bir şekilde gömülmüş(bake edilmiş) olup olmadığını merak ediyorum
- Kod refaktöründe pakete taşırken dosyaları doğrudan elle taşıma yöntemini tavsiye ederim
  Codex’e sadece "eskiden dosya başka bir konumdaydı, çalışacak şekilde düzelt" demek yeterli
  Dosya taşıma kavramını Codex ve diğer CLI’lar hâlâ iyi yönetemiyor gibi görünüyor
  Özellikle dosya silme/taşıma işlemleri git commit oluşturulurken neredeyse hiç düzgün izlenmiyor
Uzun süredir claude-4-sonnet + Cursor kombinasyonunun ateşli bir kullanıcısıydım ama son 2 ayda kullanımım ciddi biçimde arttı
Cursor’un temel aboneliğinden Pro’ya yükselttim, ama yine sınıra takıldım ve sonunda Claude API anahtarını doğrudan kullanıp haftada yaklaşık 70 dolar harcamaya başladım (sürdürülebilir gelmiyor)
Sonra grok-code-fast-1 çıktı; bunu Cursor’a bağlayıp her gün kullanmaya başladım, hızlı, ucuz (şimdiye kadar ücretsiz) ve çok memnun kaldım
Yakın zamanda GPT-5’i de resmi Codex VSCode eklentisi üzerinden denedim ve gerçekten şaşırtıcı derecede iyi buldum
gpt-5-medium ile bir React Native uygulamasını büyük ölçüde refaktör edip uygulama yapısını ve performansını tek bir gecede iyileştirdim (bunu kendim yapsaydım en az 2 gün sürerdi)
Şu anda gpt-5-medium-codex ile uygulamanın routing yapısını baştan elden geçirtiyorum; çok sayıda tool call yapıyor, komutları anlama ve uygulama biçimi de çok sistematik
Bundan sonra kullanacağım stack muhtemelen Cursor + grok-code-fast-1(günlük işler için), gerektiğinde de Codex/GPT olacak
Bu arada gpt-5-mediumu gün boyu gerçekten çok zorladım ama ChatGPT Plus hesabıyla bir kez bile limite takılmadım; bu yüzden OpenAI ekibine minnettarım
- gpt-5-medium ile refaktör denediğin workflow’u merak ediyorum
  Kendim test edebileceğim uygun bir örnek olmadığı için, modele promptları nasıl verdiğini, ne tür öneriler aldığını ve geliştirici olarak kendi bilgimin ne kadar yardımcı olacağını merak ediyorum
  Senin empati kurulabilir deneyimin ortalama bir SWE ya da ortalama bir geliştirici için de mümkün mü, bunu öğrenmek isterdim
- Cursor’u 1 yıldır kullanıyorum ve ilk kez kullanım limitini aştım
  Claude, GPT ve Grok’un hepsinde limite takıldığım oldu
  Bu yüzden Cursor Pro aboneliği içinde ek kullanım ödemesini (ayda $25, yani $20+$5) seçip Claude kullanmaya devam ediyorum; çünkü Grok’tan daha hızlıydı
- Ben de neredeyse aynı kararı verdim
  grok-code-fast-1 çoğu kodlama görevinde iyi iş çıkarıyor
  Şu anda opencode içinde kullanıyorum; belli bir ücretsiz kota veriyor gibi görünüyor ve ayrıca bir grok anahtarı eklememiş olmama rağmen kullanabildim
Codex CLI IDE’nin kalitesinden çok etkilendim
Daha önce zayıf bulduysanız bile, vscode eklentisiyle tekrar denemenizi öneririm; Plus aboneliğinde cömertçe verilen kullanım miktarı buna değiyor
Claude code max aboneliğini bırakıp ChatGPT pro $200 planına geçtim
Çok daha hızlı ve şu ana kadar limite hiç takılmadım
- Proje geliştirmede aider ile gemini pro kombinasyonunu kullanıyorum
  Özellikle kendi araç projemi paylaşayım: aretecodex.tools
- Cursor’u 20 dolarlık planda kullanıyorum ama 15 günde limite ulaştım ve ayın kalanında ek ücret ödemek zorunda kaldım
  Önerilebilecek çözümleri merak ediyorum
- CLI IDE’nin tam olarak ne anlama geldiğini merak ediyorum
- Artık claude code gibi abonelik modeliyle de kullanılabiliyor mu, yoksa sadece API mi var, kafam karıştı
Bu başlıkta birçok kullanıcının Codex’e geçmesi ya da Claude Code’dan uzaklaşması ilgimi çekti
Claude Code’un en büyük sorunu, çok fazla iş yüklendiğinde mock implementasyonlar ya da sahte kod üretmeye sık sık başlaması ve bunun pratikte sorunları daha da kötüleştirmesiydi
Girdi promptunu ayarlayarak bunu düzeltmekte zorlandım ve sonunda Codex’e geçtim
Codex’in zaten tamamen kurulmuş bir codebase içinde çalışma avantajı var, ama gerçek deneyim açısından da Codex çok daha iyiydi
- Claude kullanırken en etkili yöntem genelde 1) plan-mode’da bir plan çıkarmak, 2) sonra bu planı uygulamasını istemek oluyor
  Diğer sistemlerde ayrı bir "planning" modu olmadığından, baştan doğrudan implementasyona geçmeye çalışıyorlar; bu yüzden promptu dikkatle ayarlamak gerekiyor
  Claude "plan > execute" yapısını ayrı desteklediği için yaklaşım farklı
Son 2 haftalık gözlemime göre Claude Code hem performans olarak çok geriledi hem de kullanım kotası ciddi biçimde düştü; buna karşılık OpenAI Codex hem performansını artırmış hem de kotası çok daha cömert hale gelmiş gibi hissettiriyor
Bir aydan uzun süredir denememiş olan varsa, Codex CLI’ı yeniden test etmesini öneririm
- Son kullanıcı açısından en önemli şeyin "istediğin an çıkabilmek" olduğunu düşünüyorum
  Servisleri sürekli karşılaştırıp fiyat/performans oranı en iyi olanı seçmek gerekiyor
  Geçen yıl boyunca farklı şirketler çeşitli artı ve eksilerle rekabet etti ama gerçekten çığır açıcı bir hizmet çıkmadı
  Belirli bir hizmette ısrar etmenin anlamı yok; kullanıcıyı elde tutmaya çalışanlar asıl SaaS şirketleri
- Codex CLI’ın projede git varsa otomatik olarak "YOLO(önce yap, sonra düşün)" tarzında davranma alışkanlığının sürüp sürmediğini merak ediyorum
  Bir kodlama yardımcısında mutlaka görmek istediğim şeyler şunlar:

komut çalıştırma için izin verilenler listesi(whitelist)
rm gibi tehlikeli komutlarda her seferinde onay istemesi
özel slash komutlarını desteklemesi
Build hook’ları ya da sub-agent özellikleri olmasa da çok sorun değil

Bir şeyi merak ediyorum: Codex CLI’da Claude’un "normal mode"una denk gelen modu nasıl kullanıyoruz?
Codex ya vibe coding ya da plan modu sunuyor gibi; ama arada "bu işi(a/b) yapmamı ister misin" diye soran etkileşimli bir mod olmayınca insanı sıkıştırıyor
Düzenlenmiş kodu kopyala-yapıştır ile almak ya da otomatik kabul etmek arasında seçim yapmak zorunda kalmayı anlamakta zorlanıyorum
- Ben genelde prompta açıkça "önce bir plan yap ve ben onay verene kadar kod yazma" diye yazıyorum
  Ardından plan döngüsünü birkaç kez gözden geçirip ancak sonra yürütmeye geçmesini istiyorum
  Bazen LLM planı "unutabiliyor", bu yüzden planı ayrı kopyalayıp saklıyorum
  Görevi adım adım bana teslim etmesini ya da build/unit test gibi her kilometre taşında doğrulama yapmasını da sağlıyorum
Oldukça etkileyici geldi
"Paylaşılan varlık" animasyonu üzerinde çalışırken (tüm kullanıcıların imleç konumuna göre arka planı değişen bir web uygulaması) hem Claude hem Codex ile denemeler yaptım
Düne kadar iki model de zorlanıyordu, ama Claude hafifçe öndeydi
Bir şeyi "yaratıcı" şekilde üretmesi gereken durumlarda iki model de biraz sıradan(stock) sonuçlar veriyordu ve simülasyon tarafını uygulamak zordu
Bugün aynı görevi Codex ile yaptığımda tasarım tarafı hâlâ zayıftı ama simülasyon kısmı çok daha iyi performans gösterdi
- LLM’in ürettiği UI’ların, özel olarak ayrıntılı promptlar (tasarım/renk şeması/tercih edilen tasarım talimatları vb.) verilmediğinde her zaman sıradan ve klişe sonuçlar üretmesinin nedeni bu
  Ek UI özellikleri ya da "mevcut uygulama tasarımını referans alıp buna uydur" gibi talimatlar verirsen sonuçlar çok daha iyi olur
Yapay zeka ile kodlamaya yeniden şans vermek için ChatGPT’ye abone olup Codex’i denedim ama hız bana aşırı yavaş geldi
Neredeyse boş bir repository’de çok basit bir görev olmasına rağmen model 20 dakika boyunca sadece "düşünüyor"
Mühendisin yalnızca beklediği bu deneyimin gerçek üretkenliğe katkısı konusunda şüpheliyim
Asenkron bir ajan ise birkaç tanesini paralel çalıştırmak mümkün olabilir, ama bunun için yapılandırılmış bir codebase gerekiyor ve ben saatler harcamama rağmen daha bir iskelet bile çıkaramadım
Dokümanları ve videoları da okuyup izledim ama bu gidişle bunu elle yapmak çok daha hızlı olacak gibi geliyor
Yanlış yaptığım bir şey mi var, sadece sunucu yükü mü fazla, yoksa mevcut yapay zeka seviyesi zaten bu mu, merak ediyorum
- Gördüğüm birçok mühendis daha çok paralel çalıştırma yöntemini deniyor
  Birden fazla ajanı aynı anda çalıştırmaya alışınca oldukça işe yarar hale geliyor diye düşünüyorum
  Bununla ilgili bir yazı okumuştum ama şu an bulmak zor
Hafta sonu ilk kez Codex’i denedim ve sonuç biraz tuhaftı
Oldukça basit bir örnekte bile (bir Rails uygulamasını Docker Compose ile ayağa kaldırmak ve ana sayfa/Devise eklemek) gerçek dosyaları oluşturmak yerine tüm dosya içeriklerini bootstrap.sh içine hardcode etti
İleride farklı davranıp davranmayacağını görmek için biraz daha izlemek istiyorum
Geçen ay satın alıp ChatGPT kullanıyorum; OpenAI’ın son zamanlarda kullanıcı deneyimini epey iyileştirdiğini düşünüyorum
Örneğin voice modu Claude’dan çok daha iyi ve model adları da eskiden kafa karıştırıcıyken şimdi sadeleştiği için kullanımı kolaylaştı
Genel amaçlı asistan olarak da Claude’dan daha iyi performans verdi ve OpenAI yeni araçları sürekli çıkardığı için güvenilirlik açısından da önde görünüyor

GPT-5-Codex

GPT-5-Codex

Codex güncellemeleri

Güvenlik ve emniyet

Fiyatlandırma ve sunum

İlgili okumalar

6 yorum

Hacker News görüşleri