24 puan yazan GN⁺ 3 일 전 | 16 yorum | WhatsApp'ta paylaş
  • Reddit r/codex topluluğunda iki modelin kodlama performansını karşılaştıran bir tartışma sürüyor; kullanıcıların büyük çoğunluğu şu anda GPT 5.5’in üstünlüğünü destekliyor
  • GPT 5.5, istikrar ve hassasiyet açısından öne çıkarken, Opus 4.7 için son dönemdeki performans düşüşü ve kullanım kısıtları nedeniyle memnuniyetsizlik yüksek
  • Opus 4.7’nin frontend/UI tasarımı alanında hâlâ az da olsa üstün olduğu yönünde değerlendirmeler de var
  • Birden fazla kullanıcı, Claude(Opus)’un yetersiz hesaplama kaynağı nedeniyle performansının aşağı çekildiğini (lobotomize) belirterek güvenilirlik sorunu gündeme getiriyor
  • Yapay zeka modellerinin performansı sürekli geliştiği için, mevcut üstünlükten ziyade erişilebilirlik, fiyat, kullanım sınırları ve sansür politikaları uzun vadede daha önemli seçim kriterleri olabilir görüşü de dile getiriliyor

Genel kodlama performansı karşılaştırması

  • Yorumların çoğu, GPT 5.5’in kodlama/programlama genelinde üstün olduğu konusunda hemfikir
  • GPT 5.5 hızlı ve yetkin; ayrıntılara gösterdiği dikkat Opus 4.7’den daha iyi
  • GPT 5.5, hata düzeltme ve eksik bağımlılıkları tespit etmede etkili
  • Opus 4.7 için saf kodlama yeteneğinin benzer olduğu yönünde değerlendirmeler olsa da, "tembel(lazy)" bir eğilim gösterip yalnızca minimum işi yaptığı durumlar olabiliyor
  • GPT 5.5, kodun etki alanını değerlendirip dikkate alınması gereken noktaları anladıktan sonra harekete geçerken, Opus 4.7 daha hızlı biçimde orta seviyede bir çözüm üretmeye yöneliyor

UI/frontend tasarımı

  • Tasarım ve frontend işlerinde Opus 4.7 biraz daha iyi sonuç veriyor
  • Ancak GPT 5.5’in de yalnızca logodan yola çıkarak bir grup web sitesi tasarımını tek seferde(one-shot) neredeyse kusursuz şekilde hayata geçirdiği bir örnek bulunuyor
  • Codex’in UI/UX çalışmaları, prompt kalitesine ve görsel ipuçları verilip verilmediğine göre değişiyor
  • Önerilen strateji, GPT 5.5 ile temeli ve yapıyı kurup, Opus 4.7 ile frontend tasarımını cilalamak
  • UI tarafını desteklemek için Meta Muse Spark gibi ücretsiz araçların kullanılabileceği de öneriliyor

Opus 4.7’nin istikrar ve kullanım kısıtı sorunları

  • Opus 4.7 için, yeni kullanıcıların hızla artmasıyla hesaplama kaynaklarının yetersiz kaldığı ve bu yüzden performansının aşağı çekildiği yönünde yaygın bir algı var
  • 4.7’nin (ve 4.6’nın) tekrar tekrar zayıflatıldığı(nerfed) yönünde çok sayıda şikâyet bulunuyor
  • Opus 4.7’nin max effort modunda halüsinasyon(hallucination) ürettiğine dair bildirimler var
  • 18 dakikalık bir oturumda tamamlanmayan tek bir prompt’un 5 saatlik kullanım kotasını tükettiği bir örnek paylaşıldı
  • $20 Claude Pro aboneliğinde Opus kullanım sınırlarının oldukça sıkı olduğu değerlendiriliyor

GPT 5.5’in artıları ve eksileri

  • GPT 5.5, istikrarlı ve performans gerilemesi(regress) olmadan tutarlı kalite sunuyor
  • Henüz yanlış bilgi ürettiğinin görülmediğini söyleyen kullanıcılar var
  • Buna karşın, prompt’ta açıkça yazılanı asgari düzeyde yerine getiren "tembel" bir eğilim gösterebildiği için ayrıntılı prompt’lar ya da önceden planlama ve Soru-Cevap süreci gerekebiliyor
  • Token tüketimi daha yüksek olabiliyor
  • GPT 5.4($20 abonelik) ile karşılaştırıldığında 5.5’in kullanım limitini 2 kat tüketmesine rağmen benchmark artışının %2~5 seviyesinde kaldığı, dolayısıyla fiyat/performans açısından soru işareti yarattığı da söyleniyor

Fiyat ve abonelik karşılaştırması

  • Bireysel kullanım için $100 ChatGPT Pro aboneliğinin fiyat/performans açısından çok iyi olduğu görüşü var
  • Codex + $10 Kimi veya $22 Gemini kombinasyonuyla UI işlerini destekleme stratejisi öneriliyor
  • Zaten Google depolama kullanılıyorsa Gemini fiilen $10~15 seviyesine geliyor
  • Claude Max hesabından tamamen GPT Plus’a geçmeyi düşünen kullanıcılar da var

Uzun vadeli bakış

  • Birkaç ay içinde Çin modelleri dahil tüm modellerin Opus 4.6 seviyesine veya üstüne çıkacağı ve daha düşük fiyata sunulabileceği öngörülüyor
  • Model performansının kendisinden çok erişilebilirlik, fiyat, kullanım sınırları, sansür ve bağlam farkındalığı daha önemli farklılaştırıcılar hâline gelebilir
  • Şu anda GPT 5.5 önde olsa da, geçmişte Claude’un zirve döneminden sonra performans kaybetmesi gibi Codex’in de yakında zayıflatılabileceği yönünde kaygılar var
  • Kimi 2.6, GLM, MiniMax gibi diğer modellerle karşılaştırma konusuna da ilgi bulunuyor

16 yorum

 
dicebattle 1 일 전

Performansı gizli bir yamayla düşürseler de fark edilmeyeceğini sanıyorlar ama aslında insanların sezgileri düşündüğünüzden daha keskin; benim sezgimle topluluktaki insanların söylediklerini birleştirince cevap hemen ortaya çıkıyor.

"Eee, peki sen ne yapabiliyorsun ki haha" olduğu için mecburen kullanıyoruz....

 
funnycat 2 일 전

3.5'ten beri ana model olarak hep Claude'u kullandım ama 5.5'ten itibaren ana model olarak GPT kullanmaya başladım. Oldukça iyi geldi.

 
tkddls8848 2 일 전

Claude ile sadece plan yapıp Codex ile sadece uygulama yapmak nasıl olur?

 
cosine20 2 일 전

Ben de son zamanlarda bunu yapıyorum. Ancak Codex CLI’nin sandbox politikası fazla katı olduğu için build ve test işini de ona bırakmaya çalışınca oldukça kullanışsız oluyor.

 
kaydash 2 일 전

İkisinin de konuşma tarzı sinir bozucu derecede kötü. Bu arada ikisi de tembel; istediklerimi yaparken bile bazı şeyleri atlıyorlar.

 
jimmy2056 2 일 전

Bu tam olarak benim hissettiğimle neredeyse aynı, o yüzden 100 dolarlık GPT aboneliğine para ödeyip kullanıyorum.
Claude'un 200 dolarlık planını da 100 dolara düşürmeyi düşünüyorum

 
mse9000 2 일 전

codex 5.4’ün Korece konuşması tuhaftı ama performans olarak opus 4.6 ve opus 4.7’ye karşı zaten üstün durumdaydı (garip konuşma tarzı giriş bariyeriydi / 열었습니다 닫았습니다 밀겠습니다 falan)

codex 5.5’in konuşma tarzı da normale dönmüş ve çok daha dikkatli, çok daha akıllı olmuş; opus 4.7 = tembel ve çıkarım maliyetinden kısmaya çalıştığı çok belli, hissiyat olarak opus 4.6’ya göre gerilemiş gibi de geliyor

 
dicebattle 1 일 전

codex odaklı 5.3 modelinde, gerçekten giriş cümlesi bile olmadan sadece kod yazmayı iyi bilen bir yardımcı çalışanla konuşuyormuşum gibi hissettiriyordu.
5.4’ten itibaren biraz biraz konuşmaya başladı, 5.5’ten sonra ise sanki yarı yarıya kendine gelmiş gibi.
Hâlâ bazen API’ye sözleşme diyor, arada İngilizceyle Koreceyi çılgınca karıştırıp konuşuyor; bu yüzden bazen "anlaması kolay olacak şekilde, mümkün olduğunca İngilizce kullanmadan anlat" diye yazmam gerekiyor.

Buna rağmen, kod üretme performansının benim hissiyatıma göre 5.4’le birlikte opus’u geçtiğini düşünüyorum. Opus 4.7 çıktı ama tadına bile bakmadım. Yine "Anthropic" tarzı bir pazarlama olacağı çok belli görünüyor.

 
cosine20 2 일 전

Hatta Opus 4.6 ve 4.7’de Korece garipleşmeye başlamıştı bile lol

 
bungker 2 일 전

Daha önce Claude ile harness kuranlar için Claude daha iyi; ilk kez kullanıyorsanız ise GPT daha iyi oluyor. Fiyat/performans tarafında GPT ezici biçimde üstün, 20 dolarlık olanı bile yeterli.

 
memevibe82 2 일 전

Zaten geliştirme yapanlar için GPT 5.5 daha iyi,

Geliştirici olmayanlar içinse Claude'un daha iyi olduğunu düşünüyorum.

Ama bence bunu fazla tartışmaya gerek yok,

En iyisi faydalı şeyler üretmek..

 
rkjun 2 일 전

Genel olarak GPT 5.5'in daha üstün olduğu yönünde bir hava oluşuyor. Şimdiye kadar sadece Claude Code (Opus 4.7) kullanıyordum ama.. Sanırım Codex'i de ciddi şekilde denemeye başlamam gerekecek.

 
brainer 2 일 전

Aslında GPT-5'ten itibaren planlama konusunda, front-end tasarımı dışında zaten daha üstündü.

Topluluk biraz fazla yavaş kalıyor..

 
unknowncyder 1 일 전

Katılıyorum
Şimdiye kadar benim gerçek kullanımda hissettiğimle topluluğun tepkisi birbirine zıt olduğu için bir kopukluk hissediyordum.

 
love7peace 2 일 전

Aynen öyle.

 
treestae 1 일 전

1 yıl öncesine kadar Claude'u şiddetle tavsiye ederdim, ama bugünlerde Codex app'i şiddetle tavsiye ediyorum.