4 puan yazan xguru 2025-02-28 | 4 yorum | WhatsApp'ta paylaş
  • GPT-4.5, OpenAI’nin en yeni modeli olup ön eğitim (pre-training) ve sonrasındaki eğitim (post-training) aşamalarında ölçeklenebilirliği iyileştiren bir sürümdür
  • Denetimsiz öğrenmenin (unsupervised learning) ölçeği büyütülerek örüntü tanıma ve yaratıcı içgörü güçlendirilmiştir
  • Daha doğal sohbetler mümkündür; kullanıcı niyetini daha iyi anlar ve duygusal zeka (EQ) geliştirilmiştir
  • Yazma, programlama, problem çözme gibi çeşitli görevlerde faydalı şekilde kullanılabilir
  • Halüsinasyon (hallucination) oranının azalması beklenmektedir
  • Araştırma ön izlemesi olarak sunulmakta; modelin güçlü ve zayıf yönlerini keşfetmek ve çeşitli kullanım senaryoları toplamak hedeflenmektedir

Denetimsiz öğrenmenin ölçeklendirilmesi

  • Yapay zekanın gelişimi için denetimsiz öğrenme ve muhakeme (reasoning) olmak üzere iki eksen ölçeklendiriliyor
    • Muhakemenin güçlendirilmesi: Karmaşık STEM problemlerini çözebilmesi için model, sistematik düşünecek şekilde eğitildi
      • OpenAI o1 ve OpenAI o3-mini gibi modeller bu yaklaşımı geliştirdi
    • Denetimsiz öğrenmenin genişletilmesi: Daha fazla veriyle modelin sezgisi ve dünya bilgisi doğruluğu artırılıyor
  • GPT-4.5, Microsoft Azure AI süper bilgisayarı üzerinde eğitildi ve daha geniş bilgi ile daha derin kavrayış kazandı
    • Bunun sonucunda halüsinasyonlar azalıyor ve çeşitli konularda daha güvenilir sonuçlar sunuyor

GPT paradigmasının genişlemesi

  • GPT-4.5, önceki modellere kıyasla daha üstün bilgiye sahip
    • Dillerin kökeni gibi tarihsel sorular hakkında daha derin içgörüler sunuyor
    • "İlk dil neydi?" gibi bir soruya ilişkin olarak:
      • Tek bir ilk dil hiç var olmamış olabilir
      • Dilin Afrika’da 100 bin yıldan daha uzun süre önce ortaya çıktığı tahmin ediliyor
      • Proto-diller büyük olasılıkla jestler, sesler ve işaretlerden gelişti
      • Dilin kesin kökeni, kayıt bulunmadığı için bilinmiyor
  • Bu yönüyle GPT-4.5, dilbilim ve tarih alanlarında da derinlikli yanıtlar verebilir

Daha derin dünya bilgisi

  • SimpleQA değerlendirmesinde GPT-4.5, diğer modellere göre daha yüksek doğruluk elde etti
    • Doğruluk (Accuracy) karşılaştırması:
      • GPT-4.5: 62.5%
      • GPT-4o: 38.2%
      • OpenAI o1: 47%
      • OpenAI o3-mini: 15%
    • Halüsinasyon oranı (Hallucination Rate) karşılaştırması (düşük olması daha iyidir):
      • GPT-4.5: 37.1%
      • GPT-4o: 61.8%
      • OpenAI o1: 44%
      • OpenAI o3-mini: 80.3%
  • GPT-4.5, doğrulama gerektiren sorularda daha yüksek doğruluk sağlarken halüsinasyon oranını da düşürüyor

İnsanlarla iş birliği için eğitim

  • GPT-4.5, insan ihtiyaç ve niyetlerini daha iyi anlayacak şekilde eğitildi
    • Kullanıcı niyetini daha incelikli yorumlayabiliyor ve doğal sohbet kurabiliyor
    • Önceki modellere göre duygusal zekası (EQ) geliştirilmiş, ince nüansları daha iyi anlıyor
    • Yazı ve tasarım işlerinde yaratıcı sezgi ve estetik duyarlılığı öne çıkıyor
  • Karşılaştırmalı değerlendirme (GPT-4o’ya karşı kazanma oranı)
    • Yaratıcı işler: 56.8%
    • Profesyonel sorular: 63.2%
    • Günlük sorular: 57.0%
  • GPT-4.5, insanlarla iş birliğini doğal biçimde yürütür ve konuşma içinde kullanıcı niyetini daha doğru şekilde kavrar

Gelecek görünümü: daha güçlü muhakeme yeteneği

  • GPT-4.5, yanıt vermeden önce mantıksal olarak düşünen bir model değildir
  • OpenAI o1 ve OpenAI o3-mini gibi muhakeme odaklı modellerden farklı bir yaklaşım izler
  • Gelecekteki modellerde ön eğitim (pre-training) ile muhakemenin (reasoning) birleşimi temel unsur olacak gibi görünüyor

Güvenliğin güçlendirilmesi

  • GPT-4.5, mevcut SFT (denetimli ince ayar) ve RLHF (insan geri bildiriminden pekiştirmeli öğrenme) dahil yeni gözetim teknikleriyle eğitildi
  • Model dağıtıma alınmadan önce güvenlik testleri yapılarak potansiyel riskler değerlendirildi
  • Değerlendirme sonuçlarını içeren system card yayımlanarak araştırma ve geri bildirim teşvik ediliyor

ChatGPT’de GPT-4.5 nasıl kullanılır

  • Bugünden itibaren ChatGPT Pro kullanıcıları web, mobil ve masaüstünde GPT-4.5’i seçebilir
  • Gelecek hafta Plus ve Team kullanıcılarına sunulacak
  • Bir sonraki hafta Enterprise ve Edu kullanıcılarına sunulacak
  • Başlıca özellikler:
    • Güncel bilgi araması yapılabilir
    • Dosya ve görsel yükleme desteği
    • Canvas kullanılarak yazma ve kodlama çalışmaları yapılabilir
    • Ancak ses modu, video ve ekran paylaşımı desteklenmiyor

API’de GPT-4.5 nasıl kullanılır

  • Chat Completions API, Assistants API ve Batch API üzerinden geliştiricilere sunuluyor
  • Başlıca özellikler:
    • Fonksiyon çağırma (Function Calling)
    • Yapılandırılmış çıktılar (Structured Outputs)
    • Streaming
    • System Messages
    • Görsel girdiyle vision desteği
  • Geliştirici kullanım örnekleri:
    • Duygusal zeka ve yaratıcılığın önemli olduğu uygulamalar (ör. yazma asistanı, öğrenme koçluğu, beyin fırtınası)
    • Karmaşık kod işleri (ör. çok aşamalı kodlama iş akışları, otomasyon)
  • API sunumuna ilişkin değerlendirmeler:
    • GPT-4.5, hesaplama gereksinimi yüksek ve maliyeti fazla bir model olduğu için GPT-4o’nun yerini almıyor
    • Uzun vadede API’de sunulmaya devam edilip edilmeyeceği değerlendiriliyor; kullanıcı geri bildirimi önemli görülüyor

Sonuç

  • GPT-4.5, denetimsiz öğrenmenin sınırlarını genişleten bir model olarak yaratıcı ve yeni yeteneklerin keşfini mümkün kılıyor
  • Yapay zeka teknolojisinin yeni olasılıklarını araştırırken, kullanıcıların yenilikçi kullanım örnekleri bekleniyor.

4 yorum

 
GN⁺ 2025-02-28

Hacker News yorumları

  • GPT 4.5'in fiyatı çok yüksek

    • Girdi: 1 milyon token başına $75.00
    • Önbelleğe alınmış girdi: 1 milyon token başına $37.50
    • Çıktı: 1 milyon token başına $150.00
    • GPT 4o ile karşılaştırıldığında fiyat farkı büyük
    • GPT-4.5 çok büyük ve hesaplama açısından yoğun bir model; uzun vadede API'de sunulup sunulmayacağı değerlendiriliyor
    • Kullanıcı geri bildirimi önemli
  • GPT-4.5 kullanım izlenimleri

    • Çok yavaş, gerçek zamanlı etkileşim için uygun değil
    • Yazı yazma stili iyileşmiş; daha gündelik ve daha erişilebilir
    • Kitap taslağı karşılaştırmasında GPT4o ile GPT4.5 arasındaki fark belirgin
  • Duygusal zekaya (EQ) odaklanma

    • "Nazik bir yapay zeka arkadaşı"na dönüşme eğilimi görülüyor
    • Anthropic ve Grok da bu yöne gidiyor
    • Bu davranışların API yanıtlarına sızmaması umuluyor
  • Blog yazısı ve canlı yayın demosu hayal kırıklığı yarattı

    • Yeni model etkileyici değil
    • OpenAI'nin rakiplerinin önünde kalmasının zor göründüğü düşünülüyor
    • Fiyatın çok yüksek olması şaşırtıcı
  • OpenAI ve Anthropic'in farklı yaklaşımları

    • Anthropic, tek bir paradigmanın (muhakeme) tüm kullanım senaryolarına uygun olabileceğine inanıyor
    • OpenAI, farklı yeteneklere sahip modellerden oluşan bir ensemble gerektiğine inanıyor
    • GPT 4.5, daha fazla olgusal veriyi depolayabilecek kadar büyük
  • Kagi LLM benchmark'ında GPT-4.5'in performansı

    • Yüksek fiyatına ve yavaşlığına rağmen performansı çok iyi
    • Bazı görevlerde ise hâlâ yetersiz kalıyor
  • API üzerinden GPT-4.5 kullanma yöntemi

    • uvx aracı kullanılarak çalıştırılabiliyor
    • API anahtarının ayarlanması gerekiyor
  • Kodlama performansı karşılaştırması

    • ChatGPT 4.5, kodlamada ChatGPT 4o'dan biraz daha iyi
    • Anthropic Claude 3.7 daha iyi performans gösteriyor
  • OpenAI'nin bu denemesine dair anlayış

    • GPT 4.5, ön eğitim ölçekleme yasalarını keşfetmeye yönelik önemli bir girişimdi
    • Bilime yapılan bir katkı niteliğinde
 
xguru 2025-02-28

GPT-4.5'in fiyatı (1M token başına)

  • giriş için $75
  • önbelleğe alınmış giriş $37.50
  • çıkış için $150
    4o ile fiyatı karşılaştırınca giriş 30 kat, çıkış ise 15 kat daha pahalı görünüyor.

Ancak performans o kadar artmadığı için memnuniyetsizlik epey fazla gibi görünüyor.

Cursor'da GPT-4.5 kullanıldığında, diğer modellerin başarısız olduğu durumlarda bile verimli çalıştığı söyleniyor.
Tabii çok pahalı olduğu için kullanım bazlı ödeme yapmak gerekiyor. "Karmaşık kodlama yaptırırsak iflas ederiz" gibi tepkiler de var.
https://x.com/cursor_ai/status/1895210110714290302

 
bearmett 2025-02-28

Claude Code fiyatına bakarken ben de benzer bir şey düşünmüştüm sanırım. Maaşlı çalışan biri için saatlik ücretini aşarsa bu iflas sayılmaz mı 😵‍💫

 
botplaysdice 2025-02-28

Galiba bu iyi bir şey. Model fiyatına göre bizim değerimiz de...;;;