1 puan yazan GN⁺ 1 시간 전 | 1 yorum | WhatsApp'ta paylaş
  • 3 ay boyunca Claude/Anthropic ile kod yazdım, ancak repo ölçeğindeki işlerde güvenilirlik düşünce ayrı bir gözetim iş akışı gerekli hale geldi
  • 4.7 döneminde gerçek implementasyon yaklaşık %40 seviyesindeyken tamamlandığını sanrıladı ya da stub/placeholder çevresinde aşırı özgüven gösterdi
  • Max x20 ücretine rağmen üretkenlikten çok token tüketimi ve denetim yükü arttı; 12 Mayıs’ta GPT-5.5 + Codex’e geçtim
  • Codex, aşırı prompt vermeden bitişik kodu daha iyi anlıyor, regresyonları daha iyi yakalıyor; böylece lint/test döngüsü ve büyük ölçekli refaktörler yönetilebilir hale geliyor
  • Geçiş süreci de yalnızca CLAUDE.md→AGENTS.md taşınması ve hook’ların korunmasıyla tamamlandı; bu iş akışında geri dönmeyi düşünmüyorum

Claude’dan Codex’e geçtikten sonra değişen geliştirme akışı

  • Son 3 ay boyunca ağırlıklı olarak Claude/Anthropic ile kod yazdım; Opus 4.6 çıktığında mimariyi anlama, büyük bağlamı işleme ve hızlı özellik geliştirme konusunda güçlü görünüyordu
  • Zamanla repo ölçeğindeki işlerde güvenilirliği düştü ve modeli izlemek için ayrı bir iş akışı gerekmeye başladı
    • Bitişik dosyalardaki regresyonları kontrol eden birden fazla ajan
    • Her önemli commit’e eklenen bir “senior reviewer” ajanı
    • Implementasyon sapmasını ve eksik implementasyonu kontrol eden sürekli doğrulama
    • Modelin tamamlandığını iddialı biçimde söylediği işleri yakalayan lint/test pipeline’ı
  • 4.7 döneminde kişisel iş akışımda sorun daha da büyüdü
    • Gerçek implementasyon yaklaşık %40 düzeyindeyken özelliğin tamamlandığını sanrılıyordu
    • Stub/placeholder çevresinde temelsiz bir özgüven sergiliyordu
    • Gerçekte yapılabilir değişiklikler için bile “ayrı bir oturum gerekli” demesi ya da aşırı takvim tahminleri üretmesi gibi kaçınmacı davranışlar ortaya çıkıyordu
  • Max x20 ücreti ödüyordum, ancak üretkenlik artışından çok token tüketimindeki artış ve denetim yükündeki artış öne çıkıyordu
  • Sonunda 12 Mayıs’ta GPT-5.5 + Codex’e geçtim ve birkaç ay sonra ilk kez AI ile kod yazmak stresten çok rahatlığa yakın hissettirmeye başladı

GPT-5.5 + Codex’te hissedilen avantajlar

  • Codex, aşırı prompt olmadan da bitişik kodu iyi anlıyor ve regresyonları daha iyi yakalıyor
  • Lint/test geri bildirim döngüsü daha sıkı çalışıyor ve büyük ölçekli refaktörler gerçekten yönetilebilir hale geliyor
  • Altyapı kararları ve mimari değişiklikler parçalı hissettirmek yerine tutarlı bir yönde ilerliyor; bitmiş gibi davranmaktan çok işi gerçekten bitirmeye yaklaşıyor
  • /fast, haftalık kullanım kotasını hızlıca tüketecek gibi göründüğü için çoğunlukla kaçınıyorum, ancak yalnızca high/xhigh ile bile üretkenlik artışı büyüktü
  • Tüm depo zip’ini GPT-5.5 Pro extended thinking içine vermek, diğer modellerin tekrar tekrar başarısız olduğu sorunları çözmeye yardımcı oluyor
  • Geçişte de büyük bir sürtünme yaşanmadı
    • CLAUDE.md, AGENTS.md olarak taşındı
    • hook’lar aynen devam etti
    • Genel iş akışını neredeyse hiç değiştirmek gerekmedi
  • Bunun herkesin hemen geçmesi gerektiği anlamına gelmediğini biliyorum, ancak bu iş akışında bir süre geri dönmeyi düşünmüyorum

1 yorum

 
GN⁺ 1 시간 전
Hacker News yorumları
  • Yapay zeka araçları konusunda, sevdiğin spor takımını seçer gibi tek taraf tutmanın anlamı yok. İkisini de, mümkünse hepsini öğrenip o hafta hangisi en iyi uyuyorsa onu kullanmak yeterli
    Gelecek ay durum değişebilir. Ben iki abonelik kullanıyorum ama herkesin bunu yapamayacağının da farkındayım

    • Şu anda gerçekten böyle bir hava var ama bence bunun temelinde, biri farklı bir seçim yaptığında sanki bana yanlış yaptığımı söylüyormuş gibi hissettiren insani eğilim yatıyor
      Araçların hepsi iyi; bazı insanlar bir tarafta daha iyi sonuç alıyor ve dediğin gibi gelecek hafta her şey tamamen değişebilir
    • Ben de şu anda bana en iyi uyan hangisiyse onu kullanıyorum; kim olduğu fark etmiyor, sürekli test edip sürekli deniyorum
    • Aynen öyle. Modeller sürekli değişiyor. Bugün Anthropic, yarın OpenAI, sonra yine Anthropic, gelecek hafta Çin’den yeni bir rakip, gelecek ay da belki Google kendine gelir. Bu döngü sürekli tekrar ediyor
    • Yaklaşık bir haftadır Codex ve Gemini ile uğraşıyorum; şu ana kadar bana en iyi uyan Codex oldu
      Ama Kinguin’de 18 aylık premium için 15€’luk bir kupon bulduğumdan Gemini de kullanıyorum; kotaya takılırsam bazı işleri Gemini’ye devrediyorum
  • Opus 4.7, faydalı ve üretkenmiş gibi görünmeye, bir de gösteriş amaçlı performansa odaklıymış gibi hissettiriyor
    Codex ise gerçekten işi tamamlıyor

  • İş akışını biraz daha paylaşabilirsen güzel olur. Neyi nasıl yaptığını öğrenip ben de uygulamak istiyorum
    Neden tüm depoyu GPT’ye verdiğini, hangi teknikleri ve kitapları kullandığını da merak ediyorum
    Ben prompt’u verip Codex’in bitirmesini bekliyorum, sonra da eskiden kendim yaptığım çevredeki bariz işleri yapıp yapmadığını tekrar soruyorum. Ancak o zaman hallediyor; sonrasında /review ve manuel test için zaman harcayıp tekrar küçük iş birimlerine dönüyorum. Büyük özelliklerde plan kullanıyorum, VSCode eklentisini de kullanıyorum; 5.4 ve 5.5’in ikisini de denedim ama ilki bana daha uygun gibi geliyor

  • Burada OpenAI dışındaki modeller nasıl kullanılabiliyor?

  • Claude’un sorunu, Codex gibi çalışmayı sürdürmemesi. Claude daha iyi olabilir ama Codex işi sonuna kadar tamamlamaya çalışıyor
    Claude ise sadece duruyor ve böyle bir yeteneği olsa bile o kadar pahalı ki büyük bir fark yaratmaz gibi geliyor. Belki benzer ya da daha iyi olabilir ama artık emin değilim ve kullanmıyorum. 4.5 ilk çıktığında en iyisiydi

  • Codex’in büyü gibi hissettirmesi bende de olmuştu ama bozulana kadar beklemen yeterli. 3 gün öncesine kadar ben de böyle hissediyordum ama şu an dürüst olmak gerekirse Claude’dan bile kötü hale geldiğini düşünüyorum
    Bunu kesin söyleyebilirim çünkü 5 pro hesapla 24 saat kullanıyorum; bir hafta önceki hali değil ve şu an gerçekten çok daha kötü

    • Altman, Perşembe/Cuma günü Codex durumunun berbat olduğunu kabul etti ve neyin değiştiğini anlamaya çalıştıklarını söyledi
    • Önbellekleme sorunu yüzünden performans düşüşü yaşanmış ve bununla ilgili tweet de atılmış. Şimdi geri alındığı ve performansın temel seviyeye döndüğü söyleniyor
    • 5 pro hesap derken Plus hesapları mı kastediyorsun?