- GPT-4.5, OpenAI’nin en yeni modeli olup ön eğitim (pre-training) ve sonrasındaki eğitim (post-training) aşamalarında ölçeklenebilirliği iyileştiren bir sürümdür
- Denetimsiz öğrenmenin (unsupervised learning) ölçeği büyütülerek örüntü tanıma ve yaratıcı içgörü güçlendirilmiştir
- Daha doğal sohbetler mümkündür; kullanıcı niyetini daha iyi anlar ve duygusal zeka (EQ) geliştirilmiştir
- Yazma, programlama, problem çözme gibi çeşitli görevlerde faydalı şekilde kullanılabilir
- Halüsinasyon (hallucination) oranının azalması beklenmektedir
- Araştırma ön izlemesi olarak sunulmakta; modelin güçlü ve zayıf yönlerini keşfetmek ve çeşitli kullanım senaryoları toplamak hedeflenmektedir
Denetimsiz öğrenmenin ölçeklendirilmesi
- Yapay zekanın gelişimi için denetimsiz öğrenme ve muhakeme (reasoning) olmak üzere iki eksen ölçeklendiriliyor
- Muhakemenin güçlendirilmesi: Karmaşık STEM problemlerini çözebilmesi için model, sistematik düşünecek şekilde eğitildi
- OpenAI o1 ve OpenAI o3-mini gibi modeller bu yaklaşımı geliştirdi
- Denetimsiz öğrenmenin genişletilmesi: Daha fazla veriyle modelin sezgisi ve dünya bilgisi doğruluğu artırılıyor
- GPT-4.5, Microsoft Azure AI süper bilgisayarı üzerinde eğitildi ve daha geniş bilgi ile daha derin kavrayış kazandı
- Bunun sonucunda halüsinasyonlar azalıyor ve çeşitli konularda daha güvenilir sonuçlar sunuyor
GPT paradigmasının genişlemesi
- GPT-4.5, önceki modellere kıyasla daha üstün bilgiye sahip
- Dillerin kökeni gibi tarihsel sorular hakkında daha derin içgörüler sunuyor
- "İlk dil neydi?" gibi bir soruya ilişkin olarak:
- Tek bir ilk dil hiç var olmamış olabilir
- Dilin Afrika’da 100 bin yıldan daha uzun süre önce ortaya çıktığı tahmin ediliyor
- Proto-diller büyük olasılıkla jestler, sesler ve işaretlerden gelişti
- Dilin kesin kökeni, kayıt bulunmadığı için bilinmiyor
- Bu yönüyle GPT-4.5, dilbilim ve tarih alanlarında da derinlikli yanıtlar verebilir
Daha derin dünya bilgisi
- SimpleQA değerlendirmesinde GPT-4.5, diğer modellere göre daha yüksek doğruluk elde etti
- Doğruluk (Accuracy) karşılaştırması:
- GPT-4.5: 62.5%
- GPT-4o: 38.2%
- OpenAI o1: 47%
- OpenAI o3-mini: 15%
- Halüsinasyon oranı (Hallucination Rate) karşılaştırması (düşük olması daha iyidir):
- GPT-4.5: 37.1%
- GPT-4o: 61.8%
- OpenAI o1: 44%
- OpenAI o3-mini: 80.3%
- GPT-4.5, doğrulama gerektiren sorularda daha yüksek doğruluk sağlarken halüsinasyon oranını da düşürüyor
İnsanlarla iş birliği için eğitim
- GPT-4.5, insan ihtiyaç ve niyetlerini daha iyi anlayacak şekilde eğitildi
- Kullanıcı niyetini daha incelikli yorumlayabiliyor ve doğal sohbet kurabiliyor
- Önceki modellere göre duygusal zekası (EQ) geliştirilmiş, ince nüansları daha iyi anlıyor
- Yazı ve tasarım işlerinde yaratıcı sezgi ve estetik duyarlılığı öne çıkıyor
- Karşılaştırmalı değerlendirme (GPT-4o’ya karşı kazanma oranı)
- Yaratıcı işler: 56.8%
- Profesyonel sorular: 63.2%
- Günlük sorular: 57.0%
- GPT-4.5, insanlarla iş birliğini doğal biçimde yürütür ve konuşma içinde kullanıcı niyetini daha doğru şekilde kavrar
Gelecek görünümü: daha güçlü muhakeme yeteneği
- GPT-4.5, yanıt vermeden önce mantıksal olarak düşünen bir model değildir
- OpenAI o1 ve OpenAI o3-mini gibi muhakeme odaklı modellerden farklı bir yaklaşım izler
- Gelecekteki modellerde ön eğitim (pre-training) ile muhakemenin (reasoning) birleşimi temel unsur olacak gibi görünüyor
Güvenliğin güçlendirilmesi
- GPT-4.5, mevcut SFT (denetimli ince ayar) ve RLHF (insan geri bildiriminden pekiştirmeli öğrenme) dahil yeni gözetim teknikleriyle eğitildi
- Model dağıtıma alınmadan önce güvenlik testleri yapılarak potansiyel riskler değerlendirildi
- Değerlendirme sonuçlarını içeren system card yayımlanarak araştırma ve geri bildirim teşvik ediliyor
ChatGPT’de GPT-4.5 nasıl kullanılır
- Bugünden itibaren ChatGPT Pro kullanıcıları web, mobil ve masaüstünde GPT-4.5’i seçebilir
- Gelecek hafta Plus ve Team kullanıcılarına sunulacak
- Bir sonraki hafta Enterprise ve Edu kullanıcılarına sunulacak
- Başlıca özellikler:
- Güncel bilgi araması yapılabilir
- Dosya ve görsel yükleme desteği
- Canvas kullanılarak yazma ve kodlama çalışmaları yapılabilir
- Ancak ses modu, video ve ekran paylaşımı desteklenmiyor
API’de GPT-4.5 nasıl kullanılır
- Chat Completions API, Assistants API ve Batch API üzerinden geliştiricilere sunuluyor
- Başlıca özellikler:
- Fonksiyon çağırma (Function Calling)
- Yapılandırılmış çıktılar (Structured Outputs)
- Streaming
- System Messages
- Görsel girdiyle vision desteği
- Geliştirici kullanım örnekleri:
- Duygusal zeka ve yaratıcılığın önemli olduğu uygulamalar (ör. yazma asistanı, öğrenme koçluğu, beyin fırtınası)
- Karmaşık kod işleri (ör. çok aşamalı kodlama iş akışları, otomasyon)
- API sunumuna ilişkin değerlendirmeler:
- GPT-4.5, hesaplama gereksinimi yüksek ve maliyeti fazla bir model olduğu için GPT-4o’nun yerini almıyor
- Uzun vadede API’de sunulmaya devam edilip edilmeyeceği değerlendiriliyor; kullanıcı geri bildirimi önemli görülüyor
Sonuç
- GPT-4.5, denetimsiz öğrenmenin sınırlarını genişleten bir model olarak yaratıcı ve yeni yeteneklerin keşfini mümkün kılıyor
- Yapay zeka teknolojisinin yeni olasılıklarını araştırırken, kullanıcıların yenilikçi kullanım örnekleri bekleniyor.
4 yorum
Hacker News yorumları
GPT 4.5'in fiyatı çok yüksek
GPT-4.5 kullanım izlenimleri
Duygusal zekaya (EQ) odaklanma
Blog yazısı ve canlı yayın demosu hayal kırıklığı yarattı
OpenAI ve Anthropic'in farklı yaklaşımları
Kagi LLM benchmark'ında GPT-4.5'in performansı
API üzerinden GPT-4.5 kullanma yöntemi
uvxaracı kullanılarak çalıştırılabiliyorKodlama performansı karşılaştırması
OpenAI'nin bu denemesine dair anlayış
GPT-4.5'in fiyatı (1M token başına)
4o ile fiyatı karşılaştırınca giriş 30 kat, çıkış ise 15 kat daha pahalı görünüyor.
Ancak performans o kadar artmadığı için memnuniyetsizlik epey fazla gibi görünüyor.
Cursor'da GPT-4.5 kullanıldığında, diğer modellerin başarısız olduğu durumlarda bile verimli çalıştığı söyleniyor.
Tabii çok pahalı olduğu için kullanım bazlı ödeme yapmak gerekiyor. "Karmaşık kodlama yaptırırsak iflas ederiz" gibi tepkiler de var.
https://x.com/cursor_ai/status/1895210110714290302
Claude Code fiyatına bakarken ben de benzer bir şey düşünmüştüm sanırım. Maaşlı çalışan biri için saatlik ücretini aşarsa bu iflas sayılmaz mı 😵💫
Galiba bu iyi bir şey. Model fiyatına göre bizim değerimiz de...;;;