- 3 ay boyunca Claude/Anthropic ile kod yazdım, ancak repo ölçeğindeki işlerde güvenilirlik düşünce ayrı bir gözetim iş akışı gerekli hale geldi
- 4.7 döneminde gerçek implementasyon yaklaşık %40 seviyesindeyken tamamlandığını sanrıladı ya da stub/placeholder çevresinde aşırı özgüven gösterdi
- Max x20 ücretine rağmen üretkenlikten çok token tüketimi ve denetim yükü arttı; 12 Mayıs’ta GPT-5.5 + Codex’e geçtim
- Codex, aşırı prompt vermeden bitişik kodu daha iyi anlıyor, regresyonları daha iyi yakalıyor; böylece lint/test döngüsü ve büyük ölçekli refaktörler yönetilebilir hale geliyor
- Geçiş süreci de yalnızca CLAUDE.md→AGENTS.md taşınması ve hook’ların korunmasıyla tamamlandı; bu iş akışında geri dönmeyi düşünmüyorum
Claude’dan Codex’e geçtikten sonra değişen geliştirme akışı
- Son 3 ay boyunca ağırlıklı olarak Claude/Anthropic ile kod yazdım; Opus 4.6 çıktığında mimariyi anlama, büyük bağlamı işleme ve hızlı özellik geliştirme konusunda güçlü görünüyordu
- Zamanla repo ölçeğindeki işlerde güvenilirliği düştü ve modeli izlemek için ayrı bir iş akışı gerekmeye başladı
- Bitişik dosyalardaki regresyonları kontrol eden birden fazla ajan
- Her önemli commit’e eklenen bir “senior reviewer” ajanı
- Implementasyon sapmasını ve eksik implementasyonu kontrol eden sürekli doğrulama
- Modelin tamamlandığını iddialı biçimde söylediği işleri yakalayan lint/test pipeline’ı
- 4.7 döneminde kişisel iş akışımda sorun daha da büyüdü
- Gerçek implementasyon yaklaşık %40 düzeyindeyken özelliğin tamamlandığını sanrılıyordu
- Stub/placeholder çevresinde temelsiz bir özgüven sergiliyordu
- Gerçekte yapılabilir değişiklikler için bile “ayrı bir oturum gerekli” demesi ya da aşırı takvim tahminleri üretmesi gibi kaçınmacı davranışlar ortaya çıkıyordu
- Max x20 ücreti ödüyordum, ancak üretkenlik artışından çok token tüketimindeki artış ve denetim yükündeki artış öne çıkıyordu
- Sonunda 12 Mayıs’ta GPT-5.5 + Codex’e geçtim ve birkaç ay sonra ilk kez AI ile kod yazmak stresten çok rahatlığa yakın hissettirmeye başladı
GPT-5.5 + Codex’te hissedilen avantajlar
- Codex, aşırı prompt olmadan da bitişik kodu iyi anlıyor ve regresyonları daha iyi yakalıyor
- Lint/test geri bildirim döngüsü daha sıkı çalışıyor ve büyük ölçekli refaktörler gerçekten yönetilebilir hale geliyor
- Altyapı kararları ve mimari değişiklikler parçalı hissettirmek yerine tutarlı bir yönde ilerliyor; bitmiş gibi davranmaktan çok işi gerçekten bitirmeye yaklaşıyor
/fast, haftalık kullanım kotasını hızlıca tüketecek gibi göründüğü için çoğunlukla kaçınıyorum, ancak yalnızca high/xhigh ile bile üretkenlik artışı büyüktü- Tüm depo zip’ini GPT-5.5 Pro extended thinking içine vermek, diğer modellerin tekrar tekrar başarısız olduğu sorunları çözmeye yardımcı oluyor
- Geçişte de büyük bir sürtünme yaşanmadı
- Bunun herkesin hemen geçmesi gerektiği anlamına gelmediğini biliyorum, ancak bu iş akışında bir süre geri dönmeyi düşünmüyorum
1 yorum
Hacker News yorumları
Yapay zeka araçları konusunda, sevdiğin spor takımını seçer gibi tek taraf tutmanın anlamı yok. İkisini de, mümkünse hepsini öğrenip o hafta hangisi en iyi uyuyorsa onu kullanmak yeterli
Gelecek ay durum değişebilir. Ben iki abonelik kullanıyorum ama herkesin bunu yapamayacağının da farkındayım
Araçların hepsi iyi; bazı insanlar bir tarafta daha iyi sonuç alıyor ve dediğin gibi gelecek hafta her şey tamamen değişebilir
Ama Kinguin’de 18 aylık premium için 15€’luk bir kupon bulduğumdan Gemini de kullanıyorum; kotaya takılırsam bazı işleri Gemini’ye devrediyorum
Opus 4.7, faydalı ve üretkenmiş gibi görünmeye, bir de gösteriş amaçlı performansa odaklıymış gibi hissettiriyor
Codex ise gerçekten işi tamamlıyor
İş akışını biraz daha paylaşabilirsen güzel olur. Neyi nasıl yaptığını öğrenip ben de uygulamak istiyorum
Neden tüm depoyu GPT’ye verdiğini, hangi teknikleri ve kitapları kullandığını da merak ediyorum
Ben prompt’u verip Codex’in bitirmesini bekliyorum, sonra da eskiden kendim yaptığım çevredeki bariz işleri yapıp yapmadığını tekrar soruyorum. Ancak o zaman hallediyor; sonrasında
/reviewve manuel test için zaman harcayıp tekrar küçük iş birimlerine dönüyorum. Büyük özelliklerde plan kullanıyorum, VSCode eklentisini de kullanıyorum; 5.4 ve 5.5’in ikisini de denedim ama ilki bana daha uygun gibi geliyorBurada OpenAI dışındaki modeller nasıl kullanılabiliyor?
Claude’un sorunu, Codex gibi çalışmayı sürdürmemesi. Claude daha iyi olabilir ama Codex işi sonuna kadar tamamlamaya çalışıyor
Claude ise sadece duruyor ve böyle bir yeteneği olsa bile o kadar pahalı ki büyük bir fark yaratmaz gibi geliyor. Belki benzer ya da daha iyi olabilir ama artık emin değilim ve kullanmıyorum. 4.5 ilk çıktığında en iyisiydi
Codex’in büyü gibi hissettirmesi bende de olmuştu ama bozulana kadar beklemen yeterli. 3 gün öncesine kadar ben de böyle hissediyordum ama şu an dürüst olmak gerekirse Claude’dan bile kötü hale geldiğini düşünüyorum
Bunu kesin söyleyebilirim çünkü 5 pro hesapla 24 saat kullanıyorum; bir hafta önceki hali değil ve şu an gerçekten çok daha kötü