3 puan yazan GN⁺ 2025-08-08 | Henüz yorum yok. | WhatsApp'ta paylaş
  • GPT-5, sohbet bağlamına göre modeli değiştirerek çalışan bir gerçek zamanlı yönlendiriciye sahip bütünleşik bir sistem olarak işlev görür ve API'de Regular·Mini·Nano olmak üzere 3 model ve Minimal·Low·Medium·High olmak üzere 4 akıl yürütme seviyesi sunar
  • Girdi için 272.000 token ve çıktı için 128.000 token sınırını destekler; girdi metin·görüntü, çıktı ise yalnızca metindir
  • Fiyatlandırma agresiftir: GPT-4o ile karşılaştırıldığında girdi birim fiyatı yarı yarıya düşüktür ve yakın zamanda yeniden gönderilmiş girdilerde %90 token önbellekleme indirimi uygulanır
  • Sistem kartı, halüsinasyon azaltma, talimatları yerine getirmede artış ve beğenme davranışını azaltma ile birlikte Safe‑Completions eğitimi sayesinde ikili ret yerine daha güvenli yanıt aralığını hedeflediğini vurgular
  • Güvenlik tarafında prompt enjectiona karşı iyileşme olsa da k=10 denemede %56.8 başarı oranı, hala çözülmemiş bir alanı gösteriyor; API'de reasoning özeti ve reasoning_effort=minimal seçeneğiyle akıl yürütme token akışı kontrol edilebiliyor

GPT-5: Ana Özellikler, Fiyatlandırma ve Sistem Kartı Analizi

  • Yazar Simon Willison, 2 haftalık önizleme erişimi ile GPT‑5'i günlük olarak denedi; dramatik bir sıçrama olmamakla birlikte genel olarak çok yetkin olduğunu, hata sıklığının düşük ve tutarlı bir varsayılan model olarak iyi kullanıldığını hissetti
  • Bu yazı, bir seri yazının ilk bölümü olarak temel özellikler, fiyat, sistem kartı üzerinden çıkarılabilen noktaları derliyor

Ana model özellikleri

  • ChatGPT ortamında GPT‑5, hızlı genel model ve derin akıl yürütme modelini birleştiriyor; sohbet türü, zorluk, araç ihtiyacı ve açık niyet sinyalleri (ör. “think hard”) doğrultusunda uygun modeli seçen bir gerçek zamanlı yönlendirici ile hibrit bir yapı içinde çalışıyor

    real‑time router, konuşma türüne, karmaşıklığına, araç ihtiyacına ve ‘think hard’ gibi niyet sinyallerine göre modeli seçip kullanır; kullanım kotası tükenirse her modelin mini sürümü devreye girer” ifadesi sistem kartında yer alır

  • API'de yapı Regular·Mini·Nano olmak üzere 3 modele indirgenirken, her biri Minimal·Low·Medium·High olmak üzere 4 akıl yürütme seviyesi sunar
  • Bağlam sınırı 272.000 girdi ve 128.000 çıktı token olup, görünmez akıl yürütme tokenları da çıktı tokenları içinde hesaplanır
  • Girdi/çıktı; metin·görüntü girişi, yalnızca metin çıktısı olarak yapılandırılmıştır ve bilgi kesim tarihi GPT‑5: 2024‑09‑30, Mini/Nano: 2024‑05‑30’dur
  • Tam GPT‑5 kullanımında net ve tutarlı yanıt verme eğilimi hissedildi ve başka bir modele yeniden deneme isteği neredeyse oluşmadı

OpenAI model ailesindeki konum

  • Sistem kartındaki eşleme tablosuna göre mevcut lineup, GPT‑5 hattı ile ikame edecek şekilde konumlandırılmıştır
    • GPT‑4o → gpt‑5‑main, GPT‑4o‑mini → gpt‑5‑main‑mini
    • OpenAI o3 → gpt‑5‑thinking, o4‑mini → gpt‑5‑thinking‑mini
    • GPT‑4.1‑nano → gpt‑5‑thinking‑nano, o3 Pro → gpt‑5‑thinking‑pro
  • thinking‑pro şu anda ChatGPT’de “GPT‑5 Pro” olarak gösteriliyor ve yalnızca $200/ay katmanında sunuluyor; parallel test‑time compute kullanıyor
  • Ses ve görüntü üretimi yetenek sınırları korunuyor: bunlar hâlâ GPT‑4o Audio/Realtime ve GPT Image 1/DALL‑E tarafından yönetiliyor

Fiyatlandırma oldukça rekabetçi

  • Fiyatlandırma agresif
    • GPT‑5: girdi $1.25/milyon, çıktı $10/milyon
    • GPT‑5 Mini: girdi $0.25/milyon, çıktı $2.00/milyon
    • GPT‑5 Nano: girdi $0.05/milyon, çıktı $0.40/milyon
  • GPT‑4o'ya kıyasla girdi birim fiyatı yarı yarıya düşerken, çıktı birim fiyatı eşittir
  • Akıl yürütme tokenları, çıktı tokenları ile faturalandırıldığından, aynı istemde bile akıl yürütme seviyesine göre toplam maliyet değişir
  • %90 token önbellekleme indirimi sağlanıyor; bu da bağlamın sık yeniden gönderildiği chat UIlarda ciddi bir maliyet tasarrufu etkisi yaratır
  • Rakip karşılaştırma tablosunda Claude Opus 4.1, Claude Sonnet 4, Grok 4, Gemini 2.5 Pro gibi modellerin girdi $2.5~$15/milyon, çıktı $10~$75/milyon aralığında olduğu belirtilerek GPT‑5 ailesinin fiyat avantajı öne çıkıyor
  • Yazar, fiyat karşılaştırma tablosunu GPT‑5’e otomatik sıralatıp karşılaştırmada bazı satırları yanlış sıraladığını ve ardından tabloyu Python ile düzenleyip sıralayınca hatanın düzeldiğini aktarıyor

Sistem kartından ek notlar

  • Eğitim verisi, açık web, iş ortaklığı verileri, kullanıcı ve insan eğitmen tarafından oluşturulan verilerden oluşuyor ve kişisel verileri azaltmak için filtreleme uygulandığına dair ilke düzeyinde bir açıklama var
  • Öne çıkan geliştirme alanları olarak halüsinasyon azaltma, talimat uygulanmasının iyileştirilmesi ve sahte övgü davranışının azaltılması işaretleniyor; ChatGPT’nin en yaygın 3 kullanım alanı olarak writing·coding·health seçilmiş ve bu alanlarda performansın artırıldığı belirtilmiş
  • Safe‑Completions, ikili red yerine çıktı güvenliğine odaklı bir çıktı odaklı güvenlik eğitimidir; biyoloji·güvenlik gibi çift kullanımlı sorgularda kullanıcı niyetini ayırt etmenin zor olduğu durumlarda ayrıntılı riski azaltıp yararlılığı korumayı hedefliyor
  • Sycophancy için, üretim sohbet dağılımını yansıtan değerlendirme ve ödül sinyalleriyle onaylama eğilimlerini azaltmaya dönük sonraki eğitim uygulanıyor
  • Doğruluk tarafında, tarayıcının varsayılan olarak açık olmasıyla birlikte, araç olmadan sadece dahili bilgiye dayanarak yanıt verirken halüsinasyon sıklığını azaltmayı hedefleyen bir eğitim yapılıyor
  • Aldatma/uydurma önleme için, imkânsız görevlerde ‘yapılamaz’ı açıkça kabul etmeyi hedefleyen bir ödül tasarımı uygulanmış; ayrıca tarayıcı gibi araçların kasten devre dışı bırakıldığı simülasyon değerlendirmeleri ile yanıltıcı yanıt baskılanmış

Sistem kartında prompt injection

  • İki dış red takımın, sistem seviyesi zayıflıkları ve bağlayıcı yollarna odaklanan prompt injection değerlendirmeleri yaptırıldığı belirtiliyor
  • Karşılaştırma grafiğinde gpt‑5‑thinking için k=10 deneme başına saldırı başarılılık oranı %56.8 olarak gözüküyor; bu, Claude 3.7 ve diğer bazı modellerin %60~90 aralığına kıyasla daha düşük olsa da, halen yarıdan fazlası aşılabildiğinden “tamamı çözülen” bir durum değildir
  • Sonuç olarak, modelin geliştirilmesine rağmen ürün tasarımındaki savunmalar ve guardrail katmanlarının zorunlu bir önkoşul olarak korunması önerilir

API'de akıl yürütme izleri

  • Başlangıçta yazar, akıl yürütme izi görünmüyor sanıyordu, ancak Responses API içinde reasoning: { "summary": "auto" } ile reasoning özeti alınıbileceğini gördü
  • Bu seçenek olmadan derin akıl yürütme seviyelerinde, görünür çıkıştan önce ciddi miktarda akıl yürütme tokenı harcanabilir ve gecikme hissedilebilir; reasoning_effort=minimal ayarıyla daha hızlı bir akışta yanıt alma mümkün olabilir

Ve bazı pelikan SVG'leri

  • Yazarın günlük SVG karşılaştırma testi olan “bisiklet süren pelikan” üretiminde, GPT‑5 (varsayılan Medium akıl yürütme) çıktısı bisiklet detaylarında ve form doğruluğunda güçlü, okunabilir bir vektör sağladı
  • GPT‑5 Mini renk ve gradyan ifadesi bakımından zengin; ancak pelikanın iki boyunla oluşturulması gibi bir yapısal hata gösteriyor
  • GPT‑5 Nano ise bisiklet ve pelikan biçimini basitleştirerek işlevsel bir özet seviyesinde sonuç üretiyor

Uygulamada önemli noktalar özeti

  • Model seçimi: Regular ile başlayıp, gerekirse Mini/Nanoya aşağıya geçiş önerilir; derin problemlerde thinking serileri ve yüksek akıl yürütme seviyesi düşünülmeli
  • Maliyet kontrolü: %90 token önbellekleme, reasoning_effort=minimal, kısa sistem istemi·özetli bağlam ile çıktı tokenları ve akıl yürütme tokenlarını azaltmaya dönük stratejiler etkilidir
  • Güvenlik tasarımı: Prompt injection halen riskli olduğundan bağlayıcı yetkilerinin azaltılması, çıktı doğrulaması, güvenli çıktı şablonları gibi sistemsel savunmalar eşzamanlı kullanılmalı
  • Alan bazlı kullanım: writing·coding·health alanlarında halüsinasyon·sycophancy azaltımı hissedildiği bildirilerek, dokümantasyon yazımı·kod inceleme·sağlık QA gibi yüksek riskli anlatı işlerinde tarama + kanıt destekli akışın temel akış olarak tasarlanması önerilir

Henüz yorum yok.

Henüz yorum yok.