16 puan yazan GN⁺ 2025-09-17 | 6 yorum | WhatsApp'ta paylaş
  • GPT-5-Codex, gerçek yazılım mühendisliği için optimize edilmiş bir model olup kısa etkileşimli oturumlardan uzun süreli bağımsız çalışmalara kadar her ikisini de destekler
  • Yeni modelde kod inceleme yetenekleri güçlendirildi; bağımlılık keşfi, test çalıştırma ve niyet ile uygulamayı karşılaştırma yoluyla kritik hataları erken yakalar
  • Büyük ölçekli kod refaktöringi gibi işlerde üstün performans gösterir ve kullanıcı gereksinimlerine göre çalışma süresini dinamik olarak ayarlar
  • Codex CLI ve IDE eklentileri yenilenerek görsel ekleme, iş ilerleyişi takibi, web araması ve MCP entegrasyonu gibi ajan tabanlı iş akışlarına uygun hale getirildi
  • GitHub entegrasyonu sayesinde PR'leri otomatik inceleyip düzeltme önerileri sunabilir; böylece ekibin inceleme yükünü azaltır ve sürüm güvenilirliğini artırır
  • Codex artık ChatGPT Plus, Pro, Business, Edu, Enterprise planlarına dahil

GPT-5-Codex

  • GPT-5-Codex, karmaşık gerçek dünya mühendislik işlerine (proje derleme, özellik ekleme, büyük ölçekli refaktöring, hata ayıklama, kod inceleme) odaklanmış bir modeldir
    • AGENTS.md yönergelerine uyma becerisi geliştirildiği için kod stili veya temizlik hakkında uzun açıklamalar olmadan da istenen sonuç alınabilir
  • İşin zorluk derecesine göre düşünme süresini dinamik olarak ayarlar
    • Basit isteklere hızlı yanıt verir; büyük ölçekli işlerde ise saatler boyunca bağımsız çalışıp sonucu iyileştirir
  • Kod incelemesi için optimize edilmiştir; kod tabanını gezerek, bağımlılık analizi yaparak ve test çalıştırarak doğru doğrulama gerçekleştirir
    • Açık kaynak proje commit'lerinin doğrulanmasında GPT-5-Codex incelemeleri daha güvenilir olarak değerlendirildi
  • Frontend işlerinde de güçlüdür; bulutta görsel girdi kullanarak ilerlemeyi görsel olarak inceleyebilir ve sonuçları ekran görüntüsü olarak paylaşabilir
  • GPT-5 genel amaçlı bir modelken, GPT-5-Codex yalnızca Codex ortamına yönelik ajan tabanlı kodlama işleri için tasarlanmıştır
Reklam

Codex güncellemeleri

  • Codex CLI ve IDE eklentileri, ajan tabanlı kodlama deneyimi odağında yeniden tasarlandı
    • CLI tarafında görsel ekleme, iş ilerleyişi için To-Do yönetimi, dış sistem bağlantısı mümkün hale geldi
    • Terminal arayüzü, araç çağrıları ve diff'lerin daha kolay görülmesini sağlayacak şekilde iyileştirildi
    • Onay modu sadeleştirilerek aynı anda hem güvenlik hem kullanım kolaylığı sağlandı
  • IDE eklentisi VS Code, Cursor gibi ortamlarda çalışır; dosyalar ve seçili kod temelinde daha kısa prompt'larla daha hızlı sonuç verir
    • Yerel ve bulut ortamları arasında sorunsuz geçiş yapar; devam eden işleri izlemeyi ve tamamlanan işleri gözden geçirmeyi destekler
  • Bulut ortamında önbellekleme ile hız artışı (%90 kısalma), otomatik ortam kurulumu ve internet erişim denetimi güçlendirildi
    • UI tasarım spesifikasyonları veya hata bildirimlerinde görseller kullanılabilir; Codex kendi tarayıcısını açıp çıktıyı doğrulayabilir ve PR'ye ekran görüntüsü ekleyebilir
  • GitHub entegrasyonu ile PR otomatik inceleme ve düzeltme önerileri desteklenir
    • Belirli bir inceleme isteği için @codex review komutu kullanılabilir
    • OpenAI içinde de PR'lerin çoğu Codex tarafından ön incelemeden geçirilir ve yüzlerce sorun erken aşamada tespit edilir
    Reklam

Güvenlik ve emniyet

  • Codex varsayılan olarak sandbox ortamında çalışır; ağ erişimi kısıtlıdır
    • Onay temelli olarak riskli komutların çalıştırılması denetlenebilir ve yalnızca güvenilen domain'lere izin verilebilir
  • Geliştiriciler güvenlik seviyesini kendi ortamlarına göre ayarlayabilir; Codex ise doğrulamayı desteklemek için her işte log'lar ve test sonuçları sunar
  • İnsan incelemesinin yerini alması yerine yardımcı bir inceleyici olarak kullanılması önerilir
  • GPT-5-Codex, biyoloji ve kimya alanlarında yüksek yetenekli bir model olarak sınıflandırıldığı için güvenlik önlemleri uygulanır

Fiyatlandırma ve sunum

  • Codex, ChatGPT Plus, Pro, Business, Edu, Enterprise planlarına dahildir
    • Plus/Edu/Business haftada 1-2 oturum için uygundur; Pro ise tam zamanlı haftalık geliştirme çalışmasını destekler
  • Business planında ek kredi satın alınabilir, Enterprise ise paylaşımlı kredi havuzu ile çalışır
  • Codex CLI API anahtarı kullananlara da yakında GPT-5-Codex sunulacak
  • Codex, daha hızlı ve daha güvenilir bir kodlama partneri olarak gelişmeye devam edecek ve ekiplerin iddialı projeleri hayata geçirmesine yardımcı olan bir araç haline gelecek

6 yorum

 
aeolian21 2025-09-18

Birden fazla bağlamın dikkate alınması gereken sorunlarda problem çözme yeteneği zayıf ve genel olarak gereksiz tasarım kalıbı kodlarını çok kullanıyor. Eğitimde gerçek dünya kodundan ziyade çoğunlukla öğretici örnek kodların kullanıldığı izlenimini güçlü biçimde veriyor.
Genel olarak Gemini ile arasında oldukça belirgin bir performans farkı var.

 
bluekai17 2025-09-18

Claude Code ile karşılaştırınca, şimdilik Claude Code biraz daha kullanışlı mı?

 
kuthia 2025-09-18

Sonuçta iyi bir AI aracı, kullanıcının kültürel birikim(?) düzeyini hesaba katarken aynı zamanda ortaya çıkan sonucun kalitesini de belli bir seviyede garanti edebiliyorsa, iyi bir kullanıcı deneyimi mi sunmuş olur?
Her seviyeden kullanıcının istisnasız şekilde AI araçlarından daha iyi bir şeyler bekliyor olması ilginç.

 
slowandsnow 2025-09-17

Claude çok kullanışsız olduğu için ona geçmeyi düşünüyorum.

 
shakespeares 2025-09-18

Acaba hangi nokta sizi rahatsız ediyor?

 
GN⁺ 2025-09-17
Hacker News görüşleri
  • Yeni modelin prompt boyutunun öncekine göre neredeyse yarıya indiği doğrulanmış (10KB vs 23KB) (ilgili kaynaklar: önceki prompt örneği, daha eski prompt örneği)
    SWE-bench performansı mevcut gpt-5 ile benzer, ancak gpt-5-codex özellikle kod refaktörü alanında güçlendirilmiş gibi görünüyor (iç benchmark’a göre 33.9% -> 51.3%)
    Yakın zamanda Codex CLI(gpt-5-high) ile birkaç dahili kütüphaneyi paketlere ayıran büyük bir refaktör denedim; model dosyaları silip yeniden yazma sürecinde sık sık bug üretti (önemli dosyaların eksik kalması gibi)
    Ben şahsen dosyaları doğrudan kopyalayıp paket bazında düzenleme yaklaşımını tercih ediyordum; bu iyileştirmede ise daha iyi tool calling uygulanmış gibi görünüyor
    Ayrıca yeni modelin daha "steerable" (açık şekilde yönlendirilebilir) olduğu iddia ediliyor; benim deneyimimde Codex CLI(gpt-5) zaten Claude Code’dan çok daha kolay kontrol edilebiliyordu ve ek iyileştirmeler çok memnuniyet verici

    • SWE-bench puanlarının gpt-5 ve gpt-5-codex için benzer olduğu konusunda hemfikirim, ancak SWE-bench değerlendirmesinin kendisi oldukça sınırlı bir test
      Aynı puan olsa bile gerçek kullanım deneyimi büyük ölçüde farklı olabilir
      SWE-bench’in ölçemediği unsurları ayrıntılı ele alan bir X(eski Twitter) flood’u da paylaşılmış: bağlantı

    • "Daha steerable" olması aslında dezavantaj da olabilir
      Çünkü promptları bazen fazla harfiyen uygulayabiliyor
      Sonuç olarak daha iyi prompt yazma yöntemleri ve modelden nasıl yararlanılacağına dair anlayış gerekiyor
      Üst seviye yazılım mühendisleri için iyi olabilir ama sezgisel şekilde kod yazan geliştiriciler(vibe-coder) için zorlayıcı olabilir

    • Birdenbire Codex CLI w/gpt-5-codex’in Claude Code’dan daha iyi hale geldiğini söyleyen çok görüş var ama buna kolayca inanmak zor

    • Promptun bir kısmının daha üst katmanlara taşınmış ya da başka bir şekilde gömülmüş(bake edilmiş) olup olmadığını merak ediyorum

    • Kod refaktöründe pakete taşırken dosyaları doğrudan elle taşıma yöntemini tavsiye ederim
      Codex’e sadece "eskiden dosya başka bir konumdaydı, çalışacak şekilde düzelt" demek yeterli
      Dosya taşıma kavramını Codex ve diğer CLI’lar hâlâ iyi yönetemiyor gibi görünüyor
      Özellikle dosya silme/taşıma işlemleri git commit oluşturulurken neredeyse hiç düzgün izlenmiyor

  • Uzun süredir claude-4-sonnet + Cursor kombinasyonunun ateşli bir kullanıcısıydım ama son 2 ayda kullanımım ciddi biçimde arttı
    Cursor’un temel aboneliğinden Pro’ya yükselttim, ama yine sınıra takıldım ve sonunda Claude API anahtarını doğrudan kullanıp haftada yaklaşık 70 dolar harcamaya başladım (sürdürülebilir gelmiyor)
    Sonra grok-code-fast-1 çıktı; bunu Cursor’a bağlayıp her gün kullanmaya başladım, hızlı, ucuz (şimdiye kadar ücretsiz) ve çok memnun kaldım
    Yakın zamanda GPT-5’i de resmi Codex VSCode eklentisi üzerinden denedim ve gerçekten şaşırtıcı derecede iyi buldum
    gpt-5-medium ile bir React Native uygulamasını büyük ölçüde refaktör edip uygulama yapısını ve performansını tek bir gecede iyileştirdim (bunu kendim yapsaydım en az 2 gün sürerdi)
    Şu anda gpt-5-medium-codex ile uygulamanın routing yapısını baştan elden geçirtiyorum; çok sayıda tool call yapıyor, komutları anlama ve uygulama biçimi de çok sistematik
    Bundan sonra kullanacağım stack muhtemelen Cursor + grok-code-fast-1(günlük işler için), gerektiğinde de Codex/GPT olacak
    Bu arada gpt-5-mediumu gün boyu gerçekten çok zorladım ama ChatGPT Plus hesabıyla bir kez bile limite takılmadım; bu yüzden OpenAI ekibine minnettarım

    • gpt-5-medium ile refaktör denediğin workflow’u merak ediyorum
      Kendim test edebileceğim uygun bir örnek olmadığı için, modele promptları nasıl verdiğini, ne tür öneriler aldığını ve geliştirici olarak kendi bilgimin ne kadar yardımcı olacağını merak ediyorum
      Senin empati kurulabilir deneyimin ortalama bir SWE ya da ortalama bir geliştirici için de mümkün mü, bunu öğrenmek isterdim

    • Cursor’u 1 yıldır kullanıyorum ve ilk kez kullanım limitini aştım
      Claude, GPT ve Grok’un hepsinde limite takıldığım oldu
      Bu yüzden Cursor Pro aboneliği içinde ek kullanım ödemesini (ayda $25, yani $20+$5) seçip Claude kullanmaya devam ediyorum; çünkü Grok’tan daha hızlıydı

    • Ben de neredeyse aynı kararı verdim
      grok-code-fast-1 çoğu kodlama görevinde iyi iş çıkarıyor
      Şu anda opencode içinde kullanıyorum; belli bir ücretsiz kota veriyor gibi görünüyor ve ayrıca bir grok anahtarı eklememiş olmama rağmen kullanabildim

  • Codex CLI IDE’nin kalitesinden çok etkilendim
    Daha önce zayıf bulduysanız bile, vscode eklentisiyle tekrar denemenizi öneririm; Plus aboneliğinde cömertçe verilen kullanım miktarı buna değiyor
    Claude code max aboneliğini bırakıp ChatGPT pro $200 planına geçtim
    Çok daha hızlı ve şu ana kadar limite hiç takılmadım

    • Proje geliştirmede aider ile gemini pro kombinasyonunu kullanıyorum
      Özellikle kendi araç projemi paylaşayım: aretecodex.tools

    • Cursor’u 20 dolarlık planda kullanıyorum ama 15 günde limite ulaştım ve ayın kalanında ek ücret ödemek zorunda kaldım
      Önerilebilecek çözümleri merak ediyorum

    • CLI IDE’nin tam olarak ne anlama geldiğini merak ediyorum

    • Artık claude code gibi abonelik modeliyle de kullanılabiliyor mu, yoksa sadece API mi var, kafam karıştı

  • Bu başlıkta birçok kullanıcının Codex’e geçmesi ya da Claude Code’dan uzaklaşması ilgimi çekti
    Claude Code’un en büyük sorunu, çok fazla iş yüklendiğinde mock implementasyonlar ya da sahte kod üretmeye sık sık başlaması ve bunun pratikte sorunları daha da kötüleştirmesiydi
    Girdi promptunu ayarlayarak bunu düzeltmekte zorlandım ve sonunda Codex’e geçtim
    Codex’in zaten tamamen kurulmuş bir codebase içinde çalışma avantajı var, ama gerçek deneyim açısından da Codex çok daha iyiydi

    • Claude kullanırken en etkili yöntem genelde 1) plan-mode’da bir plan çıkarmak, 2) sonra bu planı uygulamasını istemek oluyor
      Diğer sistemlerde ayrı bir "planning" modu olmadığından, baştan doğrudan implementasyona geçmeye çalışıyorlar; bu yüzden promptu dikkatle ayarlamak gerekiyor
      Claude "plan > execute" yapısını ayrı desteklediği için yaklaşım farklı
  • Son 2 haftalık gözlemime göre Claude Code hem performans olarak çok geriledi hem de kullanım kotası ciddi biçimde düştü; buna karşılık OpenAI Codex hem performansını artırmış hem de kotası çok daha cömert hale gelmiş gibi hissettiriyor
    Bir aydan uzun süredir denememiş olan varsa, Codex CLI’ı yeniden test etmesini öneririm

    • Son kullanıcı açısından en önemli şeyin "istediğin an çıkabilmek" olduğunu düşünüyorum
      Servisleri sürekli karşılaştırıp fiyat/performans oranı en iyi olanı seçmek gerekiyor
      Geçen yıl boyunca farklı şirketler çeşitli artı ve eksilerle rekabet etti ama gerçekten çığır açıcı bir hizmet çıkmadı
      Belirli bir hizmette ısrar etmenin anlamı yok; kullanıcıyı elde tutmaya çalışanlar asıl SaaS şirketleri

    • Codex CLI’ın projede git varsa otomatik olarak "YOLO(önce yap, sonra düşün)" tarzında davranma alışkanlığının sürüp sürmediğini merak ediyorum
      Bir kodlama yardımcısında mutlaka görmek istediğim şeyler şunlar:

  1. komut çalıştırma için izin verilenler listesi(whitelist)
  2. rm gibi tehlikeli komutlarda her seferinde onay istemesi
  3. özel slash komutlarını desteklemesi
    Build hook’ları ya da sub-agent özellikleri olmasa da çok sorun değil
  • Bir şeyi merak ediyorum: Codex CLI’da Claude’un "normal mode"una denk gelen modu nasıl kullanıyoruz?
    Codex ya vibe coding ya da plan modu sunuyor gibi; ama arada "bu işi(a/b) yapmamı ister misin" diye soran etkileşimli bir mod olmayınca insanı sıkıştırıyor
    Düzenlenmiş kodu kopyala-yapıştır ile almak ya da otomatik kabul etmek arasında seçim yapmak zorunda kalmayı anlamakta zorlanıyorum

    • Ben genelde prompta açıkça "önce bir plan yap ve ben onay verene kadar kod yazma" diye yazıyorum
      Ardından plan döngüsünü birkaç kez gözden geçirip ancak sonra yürütmeye geçmesini istiyorum
      Bazen LLM planı "unutabiliyor", bu yüzden planı ayrı kopyalayıp saklıyorum
      Görevi adım adım bana teslim etmesini ya da build/unit test gibi her kilometre taşında doğrulama yapmasını da sağlıyorum
  • Oldukça etkileyici geldi
    "Paylaşılan varlık" animasyonu üzerinde çalışırken (tüm kullanıcıların imleç konumuna göre arka planı değişen bir web uygulaması) hem Claude hem Codex ile denemeler yaptım
    Düne kadar iki model de zorlanıyordu, ama Claude hafifçe öndeydi
    Bir şeyi "yaratıcı" şekilde üretmesi gereken durumlarda iki model de biraz sıradan(stock) sonuçlar veriyordu ve simülasyon tarafını uygulamak zordu
    Bugün aynı görevi Codex ile yaptığımda tasarım tarafı hâlâ zayıftı ama simülasyon kısmı çok daha iyi performans gösterdi

    • LLM’in ürettiği UI’ların, özel olarak ayrıntılı promptlar (tasarım/renk şeması/tercih edilen tasarım talimatları vb.) verilmediğinde her zaman sıradan ve klişe sonuçlar üretmesinin nedeni bu
      Ek UI özellikleri ya da "mevcut uygulama tasarımını referans alıp buna uydur" gibi talimatlar verirsen sonuçlar çok daha iyi olur
  • Yapay zeka ile kodlamaya yeniden şans vermek için ChatGPT’ye abone olup Codex’i denedim ama hız bana aşırı yavaş geldi
    Neredeyse boş bir repository’de çok basit bir görev olmasına rağmen model 20 dakika boyunca sadece "düşünüyor"
    Mühendisin yalnızca beklediği bu deneyimin gerçek üretkenliğe katkısı konusunda şüpheliyim
    Asenkron bir ajan ise birkaç tanesini paralel çalıştırmak mümkün olabilir, ama bunun için yapılandırılmış bir codebase gerekiyor ve ben saatler harcamama rağmen daha bir iskelet bile çıkaramadım
    Dokümanları ve videoları da okuyup izledim ama bu gidişle bunu elle yapmak çok daha hızlı olacak gibi geliyor
    Yanlış yaptığım bir şey mi var, sadece sunucu yükü mü fazla, yoksa mevcut yapay zeka seviyesi zaten bu mu, merak ediyorum

    • Gördüğüm birçok mühendis daha çok paralel çalıştırma yöntemini deniyor
      Birden fazla ajanı aynı anda çalıştırmaya alışınca oldukça işe yarar hale geliyor diye düşünüyorum
      Bununla ilgili bir yazı okumuştum ama şu an bulmak zor
  • Hafta sonu ilk kez Codex’i denedim ve sonuç biraz tuhaftı
    Oldukça basit bir örnekte bile (bir Rails uygulamasını Docker Compose ile ayağa kaldırmak ve ana sayfa/Devise eklemek) gerçek dosyaları oluşturmak yerine tüm dosya içeriklerini bootstrap.sh içine hardcode etti
    İleride farklı davranıp davranmayacağını görmek için biraz daha izlemek istiyorum

  • Geçen ay satın alıp ChatGPT kullanıyorum; OpenAI’ın son zamanlarda kullanıcı deneyimini epey iyileştirdiğini düşünüyorum
    Örneğin voice modu Claude’dan çok daha iyi ve model adları da eskiden kafa karıştırıcıyken şimdi sadeleştiği için kullanımı kolaylaştı
    Genel amaçlı asistan olarak da Claude’dan daha iyi performans verdi ve OpenAI yeni araçları sürekli çıkardığı için güvenilirlik açısından da önde görünüyor