GPT-5: Gecikmeli, Aşırı Pazarlanmış ve Yetersiz; Daha da Ciddi Bir Sorun

(garymarcus.substack.com)

6 puan yazan GN⁺ 2025-08-11 | 5 yorum | WhatsApp'ta paylaş

GPT-5 ile ilgili beklentilere rağmen gerçek açılıştan sonra topluluk düzeyinde hayal kırıklığı ciddi şekilde arttı
GPT-5, önceki modellere kıyasla gerçek anlamda büyük bir fark sunmuyor ve bazı benchmarklarda performansın tersine kötüleştiği bile görüldü
Son araştırmalarda büyük dil modellerinin (LLM) genelleme sınırları ve dağılım kayması sorunlarının hala ciddi olduğu kanıtlandı
OpenAI'nin teknoloji liderliğini kaybetmesi, kilit personel ayrılışı ve rakiplerin yaklaşıyı nedeniyle şirketin değerini koruma durumu belirsizleşti
AGI gerçekleştiği iddiasına karşı şüphe artarken sektör genelinde “salt ölçekleme” yaklaşımının sınırları daha görünür hâle geliyor

GPT-5 Açılışı ve Beklenti

OpenAI’nın uzun süredir haberleştirdiği GPT-5 açılışı nihayet gerçekleşti
CEO Sam Altman, açılımdan önce ve sonra kendinden emin söylemleri ve pazarlama imajını aktif biçimde öne çıkardı
Ancak GPT-5’in yayına girmesinin ardından, bazı influencerlar dışında, topluluklarda hayal kırıklığı baskın kaldı
Kullanıcılar yeni modele karşı ciddi derecede hayal kırıklığı yaşadı ve eski sürüm isteme yönlü kampanyalar bile sonuç verdi
Altman’ın pazarlama söylemi ve iddialarının aksine, gerçek kullanıcı geri bildirimleri belirgin biçimde olumsuz oldu

Topluluk ve Medya Tepkisi

OpenAI Reddit, Hacker News ve benzeri birçok toplulukta hata, halüsinasyon (hallucination) gibi GPT-5 sorunları yoğun biçimde gündeme geldi
Bazı kritik benchmarklarda, GPT-5 Grok 4 gibi rakip modellere karşı geride kaldı
Otomatik yönlendirme gibi yeni özellikler de karışıklık ve yetersizliklerini gösterdi
Topluluğun beklentisi hızla arttığı bir ortamda, GPT-5 tam tersine büyük bir hayal kırıklığı yarattı
Lansman gününde Polymarket anketinde OpenAI'nin yapay zeka liderliğine duyulan güven 1 saat içinde %75’ten %14’e düştü

Yapısal Sınırlar: Satranç, Görsel Anlama ve Akıl Yürütme

Yazarın ve birçok uzmanın vurguladığı temel akıl yürütme hatası ve satranç kurallarına uyum eksikliği problemi hâlâ ortada
Görüntü üretimi gibi alanlarda parça-bütün ilişkileri, görsel tutarlılık gibi konularda belirgin sınırlar ortaya çıktı
Mekanik mühendisliği alanındaki doktora seviyesindeki biriyle sıradan biri arasında bile yanılgı oluşmaması beklenen sorunlarda GPT-5 yine hata yaptı
Özetleme ve anlama gibi temel görevlerde de çok sayıda hata örneği raporlandı
GPT-5, kademeli bir iyileşme modelidir; ancak geçen yıla göre belirgin bir sıçrama göstermiyor

OpenAI’nın Güncel Durumu ve Geleceği

GPT-5, önceki modellerin yanında yalnızca kademeli bir ilerleme düzeyinde kaldı ve kritik eksiklikler tekrarlandı
Piyasa ve sektörde OpenAI'nın teknoloji liderliğine dair güven azalmaya devam ediyor
Birçok kilit çalışan firmayı terk ederek rakip şirket kurmuş ya da transfer olmuş; Anthropic, Google, Elon Musk gibi oyuncular hızlıca takipte
Fiyat düşürme baskısı, kârlılık sorunları ve Microsoft’la ilişkilerin bozulması gibi yapısal riskler büyüyor
LLM tabanlı AGI’ye dair inançsızlık ve CEO Sam Altman’a güven azalması derinleşiyor

LLM’lerin Temel Sınırları: Genelleme ve Dağılım Kayması

Arizona State University’den çıkan son bir çalışmada, Chain of Thought akıl yürütmenin bile eğitim dağılımının dışına çıkınca çöktüğü doğrulandı
Apple ve diğerlerinin daha önce işaret ettiği, dağılım kaymasına (distribution shift) hassas yapı en son modellere de aynı şekilde yansıyor
Bu durum, LLM’lerin sürekli niteliksel sınırlara çarpmasının temel nedeni olup, yalnızca büyük parametre sayısıyla aşılmasının mümkün olmadığını gösteriyor
Milyarlarca dolarlık yatırım alan ölçekleme stratejisi, temel meselelerin çözümünde başarısız kaldığını ortaya koyuyor
Yeni bir paradigma arayışının gerektiği yönündeki farkındalık yayılıyor

Genel AI Sektörü ve “Ölçekleme”nin Sınırları

AGI, otomatik sürüş, gerçek dışı zaman çizelgeleri gibi konularda abartılı pazarlama yaygın
Performansı çarpıtan benchmarklar, kara kutu tarzı değerlendirmeler ve düşük şeffaflık önemli sorunlar olarak öne çıkıyor
Pek çok kişi, AGI teriminin yatırımcılar ile genel kamuoyu üzerinde etki bırakmak için bir araç olduğunu fark etmeye başladı
Yapay zeka için hem iyimser beklenti hem de eleştirel baskı birlikte artıyor
Gerçeklik, saf ölçekleme yaklaşımının bir tavana çarptığını gösteriyor

Alternatifler ve Sonuç

GPT-5 daha ucuzlayabilmiş olsa da satranç, akıl yürütme, görsel ve matematiksel beceri gibi alanlardaki nitel sınırlamalar devam ediyor
Grok, Claude, Gemini gibi rakip modeller de benzer sorunları tekrar ediyor
Dağılım kayması (distribution shift) sorunu hâlâ çözülmemiş durumda
Artık neuro-symbolic AI ve world model tabanlı yaklaşımlar gibi yeni yönelimlerin gerekliliği savunuluyor
Salt ölçekleme yerine karmaşık algoritmik yeniliklerin, AGI’nin gerçekleşmesi için zorunlu olduğunu teyit ediyor

İlerideki Konular ve Not

Bu haftaki LLM sınırlarına ek olarak, bu hafta içinde başka kritik bir bilimsel konunun da ortaya çıkacağı öngörülüyor
Sonraki takip yazısında ayrıca bu konuyla ilgili içerik paylaşılacağı duyuruluyor

Özet

GPT-5’in açılmasından önce ve sonra sektör ile topluluğun beklentileri, LLM’lerin yapısal kısıtları, OpenAI’nın geleceği ve AGI çerçevesinin gerçekliği geniş çapta tartışıldı
Bütün metin, LLM’ler, GPT-5’in pratik sınırlamaları, yapay zeka yatırım/beklenti/hayal kırıklığı, yenilik sorunları, araştırma trendleri gibi konularda girişimcilere ve BT profesyonellerine önemli çıkarımlar sunuyor

5 yorum

gnsdl116 2025-08-12

Aşırı kötümser bir bakış gibi.
Endişeleri anlıyorum, ancak teknoloji gelişiminin her zaman tek yönlü yukarıdan gitmesi gerekmez.

mammal 2025-08-11

Üstelik yazıyı kaleme alan kişinin, sadece saçma sapan şeyler söyleyen Gary Marcus olması nedeniyle...

dongho42 2025-08-11

Google gibi sessizce show&prove yapsaydı bu noktaya gelmezdi. O zamana kadar 'çok korkunç', 'ölüm yıldızı', 'nükleer bomba yapmışlar gibi' diye o kadar da abartılı konuşup, yüksek ses çıkarmış olmamız da bence biraz kendimizin yüzünden oldu.