- xAI tarafından duyurulan Grok 4 Fast, mevcut Grok 4'ün eğitim kazanımlarını temel alarak maliyet verimliliği ve hızı en üst düzeye çıkaran yeni nesil bir akıl yürütme modeli
- Bu model, 2M token bağlam penceresi, web ve X arama özellikleri ve reasoning / non-reasoning birleşik mimarisi ile gerçek zamanlı kullanım için uygun
- Benchmark'larda Grok 4'e benzer performans sunarken ortalama %40 daha az token kullanıyor; böylece aynı performans çok daha düşük maliyetle elde edilebiliyor
- Ayrıca araç kullanımı pekiştirmeli öğrenmesi sayesinde kod çalıştırma, web'de gezinme gibi alanlarda yüksek performans gösteriyor ve LMArena Search Arena'da 1. sıraya yerleşti
Maliyet verimli zekada ilerleme
- Grok 4 Fast, Grok 3 Mini'den daha iyi performans gösterirken token maliyetini de önemli ölçüde azaltıyor
- Ortalama olarak Grok 4'e kıyasla %40 daha az 'Thinking Tokens' kullanarak benzer performans elde ediyor
- Örnek benchmark skorları (pass@1):
- Grok 4 Fast: 85.7%, 92.0%, 93.3%, 20.0%, 80.0%
- Rakip modellere (GPT-5 vb.) kıyasla denk veya daha iyi sonuçlar
- GPQA, AIME, HMMT, LiveCodeBench gibi çeşitli akıl yürütme benchmark'larında Grok 4'e yakın sonuçlar veriyor
- Grok 4 Fast'in token verimliliğindeki %40 iyileşmeyle birlikte token başına fiyat da ciddi biçimde düşürülmüş durumda
- Aynı performans düzeyine ulaşırken fiyat Grok 4'e göre %98 azalıyor; böylece açık modeller arasında 'en iyi fiyat-zeka oranı (SOTA Price-to-Intelligence Ratio)' kaydına ulaşıyor
- Bağımsız kuruluş Artificial Analysis Intelligence Index'in dış değerlendirmesinde güçlü sonuçlar ile doğrulandı
Yerel araç kullanımı ve SOTA arama
- Araç kullanımı pekiştirmeli öğrenme (RL) ile eğitildiği için gerektiğinde kod çalıştırma veya web'de gezinmeyi otomatik olarak gerçekleştirebiliyor
- Web'i ve X'i gerçek zamanlı tarayarak çok adımlı arama ve medya (görsel, video) içeriklerini de işleyebilen ajanik arama yeteneğine sahip
- BrowseComp, SimpleQA, X Bench Deepsearch(zh) gibi çeşitli benchmark'larda Grok 4'ü aşan performans elde ediyor
Genel alan post-training sonuçları
- LMArena'nın Search Arena sıralamasında Grok 4 Fast(
menlo), Elo 1163 ile 1. sırada yer alıyor ve rakip modellere karşı 17 puan önde
- Text Arena'da
grok-4-fast (kod adı tahoe) 8. sırada; benzer sınıftaki diğer modellere (18. sıra ve altı) kıyasla açık ara daha iyi
- Gerçek arama ve metin görevlerinde büyük modellerin ötesinde verimlilik sergiliyor
Reasoning ve non-reasoning birleşik model
- Daha önce ayrı modeller gerektiren reasoning / non-reasoning modları tek bir mimaride birleştiriliyor
- Yalnızca sistem prompt'u ile reasoning (derin düşünme) ve non-reasoning (hızlı yanıt) modları arasında geçiş yapılabiliyor
- Uçtan uca gecikme süresini ve token maliyetini azaltarak gerçek zamanlı uygulamalar için uygun hale geliyor
- xAI API'de geliştiriciler hız/derinlik dengesini ayrıntılı biçimde ayarlayabiliyor
Dağıtım ve fiyatlandırma
- Grok 4 Fast hemen kullanılabiliyor ve OpenRouter ile Vercel AI Gateway üzerinde geçici olarak ücretsiz sunuluyor
- xAI API'de de
grok-4-fast-reasoning ve grok-4-fast-non-reasoning olmak üzere iki sürüm halinde sunuluyor; 2M token bağlam penceresi destekleniyor
- Fiyatlandırma, giriş token'larında $0.20/1M, çıkış token'larında $0.50/1M seviyesinden başlıyor; 128k token üzeri için 2 kat ücret uygulanıyor
- Önbelleğe alınmış giriş token'ları $0.05/1M fiyatla sunularak maliyetin düşürülmesine yardımcı oluyor
Gelecek planları
- Kullanıcı geri bildirimleri yansıtılarak modelin sürekli geliştirilmesi planlanıyor
- Çok modlu özellikler ve ajanik yeteneklerin güçlendirilmesi, bir sonraki güncellemenin temel hedefleri arasında
- Model kartı ve ek ayrıntılar Grok 4 Fast model kartı (PDF) üzerinden incelenebilir
2 yorum
gpt-oss'tan daha pahalı ve daha yavaş görünüyor; insanların bunu neden bu kadar çok kullandığını merak ediyorum..
Hacker News görüşleri