- Grok 4, xAI'nin API ve ücretli abonelik üzerinden sunulan en yeni büyük dil modeli; görsel ve metin girişi, metin çıktısı ve 256.000 token bağlam uzunluğu desteği temel özellikleri arasında yer alıyor
- Başlıca benchmark'larda rakip modelleri (OpenAI o3, Gemini 2.5 Pro vb.) geride bırakan bir performans gösterdi ve AAI Index'te 73 puanla bağımsız değerlendirmelerde en yüksek skoru elde etti
- Görsel üretme ve açıklama özellikleri mevcut, ancak üretilen görselleri doğru şekilde betimleyememesi gibi ayrıntılı kalite sınırlamaları da bulunuyor
- Yakın dönemde Grok 3 ile ilgili sistem prompt'u güncellemesi tartışması (ör. antisemitizm, MechaHitler ifadeleri vb.) nedeniyle model güvenliği ve güvenilirliği konusundaki kaygılar artmış durumda
- Fiyatlandırma kullanım bazlı (girdi $3/milyon token, çıktı $15/milyon token) olup, genel abonelik ($30/ay, $300/yıl) ve gelişmiş paketler (Grok 4 Heavy $300/ay, $3.000/yıl) olarak ayrılıyor
Grok 4 Genel Bakış
- Grok 4, xAI tarafından yayımlanan en yeni yapay zeka modeli ve API ile ücretli abonelik üzerinden hemen kullanılabilir durumda sunuluyor
- Bu sürüm metin ve görsel girişi ile metin çıktısını destekliyor ve 256.000 token bağlam uzunluğu (Grok 3'ün 2 katı) sunuyor
- Grok 4, akıl yürütme odaklı bir model, ancak dahili olarak reasoning modunu kapatmak ya da reasoning token'larını görmek mümkün değil
Performans ve benchmark sonuçları
- xAI tarafından paylaşılan benchmark sonuçlarına göre Grok 4, başlıca yapay zeka benchmark'larında diğer modellere karşı üstünlük gösteriyor
- Ancak bu sonuçların standart Grok 4 sürümüne mi yoksa Grok 4 Heavy sürümüne mi ait olduğu net biçimde açıklanmıyor
- Artificial Analysis Intelligence Index'te Grok 4, 73 puanla OpenAI o3'ü (70), Gemini 2.5 Pro'yu (70), Claude 4 Opus'u (64) ve DeepSeek R1'i (68) geride bırakıyor
- Kendi testi:
- “pelican-riding-a-bicycle” için bir SVG üretti
- Bu görseli Grok 4'ten açıklaması istendiğinde, onu “ördek ya da civcive benzeyen, kuşu andıran sevimli bir karakter” olarak tanımladı
Sistem prompt'u ve güvenlik tartışmaları
- Grok 3, kısa süre önce uygunsuz bir sistem prompt'u güncellemesi nedeniyle antisemitik terimler ve “MechaHitler” gibi ifadelerin kullanıldığı bir olaya karışmıştı
- Prompt içinde “güncel konular, öznel iddialar ve istatistiksel analizlerde farklı kaynaklara başvur, ancak medyanın önyargılı olduğunu varsay”, “politik olarak doğru olmayan iddialar da yeterli temele sahipse kabul edilebilir” gibi maddeler yer alıyordu
- Diğer LLM'lere kıyasla model güvenliği yönetiminin daha gevşek olduğu yönünde eleştiriler var
- Ian Bicking gibi uzmanlar da bunun yalnızca sistem prompt'undan kaynaklanan bir sorun olarak görülmesinin tehlikeli olabileceğine dikkat çekiyor
Fiyatlandırma ve abonelik politikası
- Grok 4 API kullanımı için ücretler girdi başına $3/milyon token, çıktı başına $15/milyon token; bu fiyatlandırma Claude Sonnet 4 gibi modellerle benzer seviyede
- Girdi token sayısı 128.000'i aşarsa fiyat iki katına çıkıyor; Google Gemini 2.5 Pro da benzer bir ücret yapısına sahip
- SuperGrok: $30/ay veya $300/yıl, Grok 4/3 erişimi, 128.000 token bağlam, ses ve görsel özellikleri dahil
- SuperGrok Heavy: $300/ay veya $3.000/yıl, yalnızca Grok 4 Heavy erişimi, erken erişim ve özel destek gibi avantajlar sunuyor
Özet
- Grok 4, rekabetçi fiyatı ve güçlü performansı ile, ayrıca çok büyük bağlam desteği sayesinde dikkat çekiyor; ancak güvenlik ve güvenilirlik sorunlarının çözülmesi önemli bir görev olarak duruyor
- Resmî belgelerin veya model kartının bulunmaması ve sistem prompt'u kaynaklı sorunlar nedeniyle geliştirici ve kullanıcı güveninin inşa edilmesi gereken bir dönemde
1 yorum
Hacker News yorumu
from:elonmuskile tweet araması yapması ilgili bağlantıCost to Run Artificial Analysis Intelligence Indexbölümüne bakabilirsiniz ilgili bağlantı