Grok Code Fast 1
(x.ai)- xAI tarafından piyasaya sürülen grok-code-fast-1, geliştiriciler için ultra hızlı bir yapay zeka kodlama modeli olup hızlı yanıt verme ve IDE dostu özelliklere sahiptir
- Bu model, programlama veri kümeleri odaklı olarak önceden eğitildi ve gerçek kullanıcı değerlendirmeleriyle grep, terminal, dosya düzenleme gibi araçları kullanmada yetkin olacak şekilde tasarlandı
- Performans tarafında saniyede 190 token üretim hızı ve SWE-Bench-Verified'da %70,8 puan kaydederken, TypeScript, Python, Java, Rust, C++, Go gibi birçok dilde güçlü yönler gösteriyor
- Fiyatlandırma 1 milyon giriş tokenı için $0.20, çıkış için $1.50, önbelleğe alınmış giriş için $0.02 olarak belirlenmiş durumda; bazı partner platformlarda (GitHub Copilot, Cursor vb.) ise geçici olarak ücretsiz sunuluyor
- Yakında çok modlu girdi, paralel araç çağrıları, genişletilmiş bağlam destekleyen varyant modellerin de duyurulması planlanıyor
Genel bakış
- xAI'nin grok-code-fast-1 modeli, yinelemeli düşünme ve araç kullanımının sık yaşandığı gerçek geliştirme ortamlarında hız düşüşü sorununu çözmek için geliştirilen ultra hızlı bir yapay zeka kodlama modelidir
- Saha mühendisi geri bildirimleri temel alınarak, hızlı, çevik ve gerçek iş akışlarına uygun bir model mimarisi sıfırdan yeniden inşa edildi
- Muhakeme ve hesaplama mühendisliği ekipleri, ezici derecede hızlı servis teknolojisine çok sayıda yenilikçi yöntem kattı
- Kullanıcılar, düşünce akışını okumaya fırsat bulmadan birden fazla araç çağrısının çoktan gerçekleştiğini hissedebilir
- Prompt caching optimizasyonu sayesinde partner ortamlarında %90'ın üzerinde önbellek isabet oranı elde edildi
Tasarım ve veri kümesi
- Eğitim ortamı, programlama odaklı geniş kapsamlı ön eğitim verileri temelinde oluşturuldu
- Gerçek pull request ve kod yazımı verileriyle yüksek kaliteli bir sonradan eğitim süreci yürütüldü
- Çeşitli lansman partnerleriyle yakın iş birliği içinde modelin agentic platformlar içindeki davranışı sürekli iyileştirildi
Başlıca özellikler ve desteklenen ortamlar
grok-code-fast-1, grep, terminal, dosya düzenleme gibi yaygın geliştirme araçlarını güvenilir biçimde kullanır- Kullanıcılar bunu IDE gibi başlıca geliştirme ortamlarında doğrudan kullanabilir
Programlama performansı
- Tüm yazılım geliştirme yığınını destekler
- TypeScript, Python, Java, Rust, C++, Go gibi dillerde üstün kullanım kabiliyeti gösterir
- Minimum gözetim altında bile sıfırdan proje oluşturma, kod tabanı soru-cevap, hassas hata düzeltme gibi çeşitli programlama görevlerini hızlı ve doğru şekilde yerine getirir
- Grok Code Fast 1, mevcut modeller arasında en hızlı tepki süresini sunar
- Küçük iş birimlerine bölerek kullanıldığında, yinelemeli ve hızlı iş akışları kurmak için çok avantajlıdır
- Gerçek bir örnek olarak, Cursor ortamında yalnızca bir gün içinde Battle Simulator prototipi tamamlandı
- Büyük özellikleri planlayıp adım adım alt görevlere bölerek yinelemeli çalıştırmak verimlidir
Fiyatlandırma politikası
- 1 milyon giriş tokenı başına $0.20
- 1 milyon çıkış tokenı başına $1.50
- 1 milyon önbelleğe alınmış giriş tokenı başına $0.02
- Güçlü performans ve ekonomik fiyatlandırma ile günlük programlama görevleri hızlı ve verimli biçimde yürütülebilir
Model performansı ve değerlendirme
- Token işleme hızı (Tokens Per Second, TPS): 190 ile sektörün en üst seviyelerindedir
- Diğer modellerle (Gemini 2.5 Pro, GPT-5, Claude Sonnet 4, Qwen3-Coder, Grok 4) karşılaştırıldığında hem fiyat hem işleme hızı açısından güçlü rekabet gücü gösterir
- Çeşitli açık benchmark'lar ve geliştiricilerin gerçek testleri birlikte yürütüldü
- SWE-Bench-Verified alt kümesinde %70,8'e ulaştı
- Modelin pratik faydasını ve memnuniyet düzeyini en üst düzeye çıkarmak için saha mühendisleriyle düzenli insan değerlendirmeleri ve otomatik testler birleştirildi
Gelecek planları ve kullanım bilgileri
- Resmi API ve başlıca partnerler üzerinden sunuluyor; ücretsiz deneme de geçici olarak mevcut
- GitHub Copilot, Cursor, Cline, Roo Code, Kilo Code, opencode, Windsurf vb.
- Sürekli güncelleme ve hızlı iyileştirme döngüsü sözü veriliyor
- Çok modlu girdi, paralel araç çağrıları, genişletilmiş bağlam desteği gibi yeni özellikler içeren yeni varyantlar da eğitiliyor
- Ayrı olarak bir prompt engineering guide da sunuluyor
- Model kartı ve geri bildirim kanalları (Discord vb.) üzerinden görüş paylaşılabiliyor
1 yorum
Hacker News görüşleri
Dün Cline ile test ettim; hızlı, agentic akışa iyi uyuyor ve kod kalitesi de oldukça iyi. Bu başlığın neden bu kadar olumsuz olduğunu anlamıyorum (yazarken flag de yedim). Bence bu model gayet iyi, en az gpt5-mini seviyesinde hissettiriyor. Birkaç gündür gpt5-mini’yi ana model olarak kullanıyordum; bütçeye uyuyordu ve yapılması gerekenleri iyi yapıyordu.
Dikkatimi çekenler:
bs4) ile ilgili bir işte yaklaşık 110 bin token kullandım ve görevi sorunsuz tamamladı; yüksek context durumunda sorun yaşamadıGenel olarak iyi; fiyatına göre günlük ana model olarak da kullanılabilir. Opus + gpt5 high’ı planner olarak kullanıp bu modeli implementer olarak çalıştırmayı da hayal etmek mümkün. Hızlı olduğu için paralelde pass@x tarzı kurulumlar da ilginç olabilir.
Her katmanda farklı seçeneklerin olması güzel; farklı sağlayıcıların rekabet etmesi birbirlerini tetikte tutuyor ve fiyatları aşağı çekiyor. gpt5-mini 2$/MTok, bu model ise 1.5$/MTok civarında, neredeyse “bedava” gibi hissettiriyor. Bu olumsuz havayı anlamıyorum.
Qwen3-Coder-480B (Cerebras tarafından host ediliyor) OpenRouter üzerinden giriş/çıkış dahil 2$/Mtok.
Context length’in yaklaşık yarısını kullanınca performansın iyi sayılması mı gerekiyor? qwen3-coder tarafında 65k/256k civarında kafasının karıştığını hissediyorum ve Grok’a göre %50 daha pahalı.
İncelemeyi keyifle okudum; claude code ile karşılaştırınca nasıl acaba, merak ettim.
Ben de benzer düşünüyorum; son zamanlarda bu modeli kullanıyorum, epey iyi ve çok hızlı.
İlginç olan, bu modelin öne çıkardığı benchmark’ın token çıktı hızı olması; hatta adına bile “fast” demişler.
Normalde yazılım mühendisleri için token kalitesinin hızdan daha önemli olduğunu düşünürdüm.
Asıl mesele ne kadar hızlı olduğu.
xAI’ın ortaya attığı metrikler içinde en kötüsü değil.
Cerebras’ın ücretsiz API’sini (Qwen Coder 480b, gpt-oss-120b var, ortaklık yok) kullandım; saniyede yaklaşık 3000 token ile gerçekten çok hızlı.
Kullanım amacına göre değişir.
Hız çok önemli.
HN’de AI coding assistant olarak ne kullanıldığını merak ediyorum; VSCode eklentisi önerileri gibi gerçek kullanım ipuçlarını duymak isterim.
Grok-4’ün kod performansının kötü olduğu söylendiği dönemde çıkan “coding” sürümü acaba bu model miydi, merak ediyorum.
Benchmark’larda zayıfsa, abartması daha kolay olan bir metriği (hız) öne çıkarıyor gibi
Aratınca Reddit’te bu modeli öven şeylerin sadece bariz spam hesaplardan geldiğini gördüm
ilgili hesap bağlantısı
Bence Grok 3 tabanlı gibi; Grok 3 aşırı hızlıydı ve programlamaya özel gibiydi.
“SWE-Bench-Verified” genelinde grok-code-fast-1’in şirket içi benchmark’ta %70.8 aldığı söyleniyor ama ben bu benchmark aracının kendisine biraz bakmak isterim.
Üçüncü taraf raporlarda ise yaklaşık %57.6 görünüyor
ilgili bağlantı
Ufak bir ayrıntı gibi gelebilir ama siteyi açar açmaz tarih gösteriminin darmadağın olmasına şaşırdım (gün/ay/yıl sırası karmakarışık)
Bu sadece kafa karıştırmakla kalmıyor, sıralama da düzgün çalışmıyor
Tarih sütununu sıralayınca tamamen anlamsız bir sonuç çıkıyor (ortadaki öğelere göre sıralıyor)
Böyle temel şeylere dikkat etmiyorlarsa kodlarının da özensiz olabileceğinden şüpheleniyorum
[bazı ülkeler hâlâ bu gösterimi kullanıyor ama çoğu artık standarda geçti]
Yine de diğer modellerle karşılaştırınca puanları iyi görünüyor
Grok 4’ün temel sürümüyle de oldukça iyi sonuçlar gördüğüm oldu.
Farklı mimari seçenekleri sorduğumda çok iyi yanıtlar veriyor ve problem çözme sürecini adım adım yönlendirmesi hoşuma gidiyor
Her şeyi tek seferde “one-shot” biçiminde yeniden yazmasındansa, benim gerçekten istediğim yöne doğru ilerleyen bu süreci daha çok seviyorum
Opus 4.1 veya Sonnet serisinin one-shot problem çözme değerlendirmelerinin pek isabetli olmadığını düşünüyorum; asıl önemli olan gerçek bir assistant gibi davranabilmesi
gpt-5 de istemediğim bir yöne saplanırsa, ne kadar konuşursam konuşayım aynı davranışı tekrar ediyor
Sonnet 4, mimari tasarım veya derin analizde GPT-5’in gerisinde olabilir; ama detaylı plan zaten hazırsa, sadece büyük miktarda kod üretme işinde Sonnet 4 daha iyi.
Birkaç gün Grok test ettikten sonra bana daha çok gerileme gibi geldi.
Kodumun bazı kısımlarını rastgele silip attı; uzun zamandır böyle bir şey yaşamamıştım
Üst düzey coding modelleri son zamanlarda epey güvenilir hale geldi ama Grok sanki henüz o aşamada değil
Ne kadar hızlı ve ücretsiz olursa olsun, kodumu güvenip emanet edemiyorsam araç olarak kullanamam
Kilo Code içinde Grok Code Fast 1’i ücretsiz denedim ve sonuçlar çok kötüydü
Full Self Coding?
Hangi platformu/dili kullandığınızı merak ettim.
Kodun bir kısmının silinmesi gerçekten sorun mu? Version control yok mu?
Saçma sapan garip davranışları inanılmaz hızlı yapıyor; bu iyi bir şey değil.
CRUD endpoint’leri, i8n dosyaları gibi basit ve net görevler için uygun olabilir ama onun dışında emin değilim
Ben bu modeli tam da öyle işler için kullanıyorum.
Justfile’ı iyileştirmesini istedim, tamamen dağıttı; her şeyi bozdu ve sonsuz döngüye girdi
‘sonic’ modelinin stealth döneminde de hızlıydı ama kalite gerektiği kadar isabetli değildi.
Test kodu üretip tekrar tekrar çalıştırıyordu ama amaçlanan davranışı doğrulamak yerine sadece mock çağrılarını kontrol ediyordu
Gerçek kullanım örüntülerini dikkate alma konusunda sınırları var
Ben etkileyici buldum.