- Yapay zeka teknolojisi daha da geliştikçe daha karmaşık ve daha önemli sorunları çözebilir hale geldi ve bunu mümkün kılmak için önemli miktarda hesaplama kaynağı gerekiyor
- ChatGPT Pro, aylık 200 $'lık plan ile OpenAI'nin en yeni modellerine ve araçlarına geniş kapsamlı erişim sunuyor
- o1: en akıllı model
- o1-mini, GPT-4o ve Advanced Voice da dahil
- o1 pro mode: daha fazla hesaplama kaynağı kullanarak daha derin düşünür ve karmaşık sorunlara daha incelikli yanıtlar verir
- İleride daha güçlü üretkenlik özellikleri eklenecek
- Araştırmacılar, mühendisler ve araştırma odaklı işlerle uğraşan bireyler için tasarlandı; üretkenliği artırmaya ve yapay zeka gelişiminin ön saflarında yer almaya yardımcı oluyor
- ChatGPT Pro'nun o1 pro mode özelliği, yüksek güvenilirlikte yanıtlar sunan gelişmiş bir modeldir
- Özellikle veri bilimi, programlama ve hukuki analiz alanlarında doğru ve kapsamlı yanıtlar sunar
- o1 ve o1-preview ile karşılaştırıldığında matematik, bilim ve kodlama alanlarındaki zorlu makine öğrenimi benchmark'larında daha iyi performans gösterir
Başlıca performans karşılaştırmaları (pass@1 doğruluğu bazında)
- Matematik yarışması (AIME 2024)
- o1-preview: 50
- o1: 78
- o1 pro mode: 86
- Kod yarışması (Codeforces)
- o1-preview: 62
- o1: 89
- o1 pro mode: 90
- Doktora düzeyinde bilim soruları (GPQA Diamond)
- o1-preview: 74
- o1: 76
- o1 pro mode: 79
Güvenilirlik artışı: "4/4 reliability" değerlendirmesi
- Daha sıkı bir değerlendirme ölçütü getirildi: 4 denemenin 4'ünde de doğru cevap verildiğinde ancak çözülmüş sayılıyor
Başlıca performans karşılaştırmaları (4/4 güvenilirlik bazında)
- Matematik yarışması (AIME 2024)
- o1-preview: 37
- o1: 67
- o1 pro mode: 80
- Kod yarışması (Codeforces)
- o1-preview: 26
- o1: 64
- o1 pro mode: 75
- Doktora düzeyinde bilim soruları (GPQA Diamond)
- o1-preview: 58
- o1: 67
- o1 pro mode: 74
7 yorum
Pro'yu kullanmayı denedim ama bağlam penceresinin kısa olması ölümcül bir sorun. Uzun içerikler yazdırabiliyor, ancak bir noktadan sonra başlangıçta yazmakta olduğu içerik ya da format giderek bozulmaya başlıyor.
openai giderek daha da open olmaktan uzaklaşıyor.
Sanırım gerçek bu.
Maliyeti karşılayamadıkları için Plus abonelik ücretinin artacağını sanmıştım ama öyle değilmiş; bunun yerine daha pahalı bir ürün serisi ekleyerek ilerliyorlar. Ben de normalde gerçekten çok iyi kullanıyorum ama sanırım Pro sürüme kadar ihtiyacım olmayacak. haha
Ben şu anda Plus kullanıyorum. Bir süredir aynı tür prompt’ları aynı tür motorla çalıştırırken sonuçların değiştiğini hissediyorum. Eskisi kadar iyi performans vermiyormuş gibi geliyor.
Mevcut Plus’ta kullanılabilen modelleri nerf’leyip kırpılmış hâlini mi satıyorlar diye düşünmeden edemiyorum.
Maliyet yükseldikçe performansa dair bir güvenilirlik beklersiniz ama yapay zeka servislerinde böyle bir şey yok. Bir gün internet hattına gizlice kısıtlama getirilmesi gibi, yapay zekanın da o yöne gitme ihtimali yüksek görünüyor.
Ben de Plus kullanıyorum; buna cevapların genel tonu mu demeliyim? Adı aynı
o1olsa da, genel hissiyatı preview'den tamamen farklılaştı. Hatta sanki token çıktısını birileri bastırıyormuş gibi bile geliyor.Katılıyorum. Ben de aynı dönem sürümünü kullansam bile, ayrı bir açıklama olmadan performansın inip çıktığını hissediyorum. Biraz farklı bir konu ama belirli hizmetlerin bilgi toplamadığı kısmını da doğrulamanın bir yolu yok; bu yüzden bunun tamamen bir güven meselesi haline geldiğini düşünüyorum.
Hacker News görüşleri
OpenAI, açık kaynak alternatiflerin gelişim hızı ile gelir yaratma ihtiyacı arasında rekabet ediyor. Başarısı, büyük şirketlerin OpenAI’nin entegre ve güvenli yapay zeka çözümlerini seçip seçmeyeceğine bağlı. Bu, IBM’in kurumsal bilişim stratejisine benziyor.
Pro sürümünün context window’unun kısa olması bir şikayet konusu. Plus üyesi olarak daha uzun bir context window bekliyordum, ancak buna dair hiçbir tartışma yok. Rakiplere, context window’u bir farklılaştırıcı unsur olarak değerlendirmelerini şiddetle tavsiye ediyorum.
Pro aboneliğini satın aldıktan sonraki ilk izlenimim, yeni o1-Pro modelinin son derece iyi bir yazar olduğu yönünde. Uzun prompt’ları ve karmaşık veri analizlerini iyi işliyor.
Daha fazla işlem gücü için sunulan planlar, fiyatlandırma taktiği olarak kullanılan decoy effect ile açıklanabilir. Pahalı bir seçenek ekleyerek diğer planların daha makul görünmesi sağlanıyor.
Claude Teams için ayda 166 euro ödüyorum. Bunun nedeni, proje özelliğiyle birlikte çok sayıda dosya yükleyebilmek ve belirli bir bağlam içinde soru sorabilmek. Bu özellik, araştırmacıları parmaklarınızın ucunda tutuyormuşsunuz kadar güçlü.
Anthropic’te çok daha düşük maliyetle daha iyi performans alıyorum. Yeni GPT’nin Claude’dan 10 kat daha iyi olduğu iddiasına şüpheyle yaklaşıyorum.
OpenAI’nin, yatırımcılar yorulmadan önce “genel” yapay zekaya ulaşıp ulaşamayacağı soru işareti. ChatGPT’nin başarısı üzerinden, buna ulaşacak bir yolları olduğunu ima etmiş olabilirler.
Üründe “sınırsız” kullanım için aylık abonelik fiyatlandırmasının temel zorluğu, aşırı kullanım yapan %1’lik power user kitlesi. ChatGPT Pro’nun fiyatı power user’ları/kurumları hedefliyor.
Karmaşık Google Sheets formülleri yazmak için 4,5 saat harcadım. Yeni ChatGPT Pro modu daha hızlıysa, zaman tasarrufu açısından büyük bir avantaj sağlar.
interview mill ortamlarında o1 modelini kullanarak mülakat yapan örnekler var. Bu tür kullanım senaryolarında aylık 200 dolar ücret ucuz gelebilir.