Grok Code Fast 1

(x.ai)

7 puan yazan GN⁺ 2025-08-30 | 1 yorum | WhatsApp'ta paylaş

xAI tarafından piyasaya sürülen grok-code-fast-1, geliştiriciler için ultra hızlı bir yapay zeka kodlama modeli olup hızlı yanıt verme ve IDE dostu özelliklere sahiptir
Bu model, programlama veri kümeleri odaklı olarak önceden eğitildi ve gerçek kullanıcı değerlendirmeleriyle grep, terminal, dosya düzenleme gibi araçları kullanmada yetkin olacak şekilde tasarlandı
Performans tarafında saniyede 190 token üretim hızı ve SWE-Bench-Verified'da %70,8 puan kaydederken, TypeScript, Python, Java, Rust, C++, Go gibi birçok dilde güçlü yönler gösteriyor
Fiyatlandırma 1 milyon giriş tokenı için $0.20, çıkış için $1.50, önbelleğe alınmış giriş için $0.02 olarak belirlenmiş durumda; bazı partner platformlarda (GitHub Copilot, Cursor vb.) ise geçici olarak ücretsiz sunuluyor
Yakında çok modlu girdi, paralel araç çağrıları, genişletilmiş bağlam destekleyen varyant modellerin de duyurulması planlanıyor

Genel bakış

xAI'nin grok-code-fast-1 modeli, yinelemeli düşünme ve araç kullanımının sık yaşandığı gerçek geliştirme ortamlarında hız düşüşü sorununu çözmek için geliştirilen ultra hızlı bir yapay zeka kodlama modelidir
Saha mühendisi geri bildirimleri temel alınarak, hızlı, çevik ve gerçek iş akışlarına uygun bir model mimarisi sıfırdan yeniden inşa edildi
Muhakeme ve hesaplama mühendisliği ekipleri, ezici derecede hızlı servis teknolojisine çok sayıda yenilikçi yöntem kattı
- Kullanıcılar, düşünce akışını okumaya fırsat bulmadan birden fazla araç çağrısının çoktan gerçekleştiğini hissedebilir
Prompt caching optimizasyonu sayesinde partner ortamlarında %90'ın üzerinde önbellek isabet oranı elde edildi

Tasarım ve veri kümesi

Eğitim ortamı, programlama odaklı geniş kapsamlı ön eğitim verileri temelinde oluşturuldu
Gerçek pull request ve kod yazımı verileriyle yüksek kaliteli bir sonradan eğitim süreci yürütüldü
Çeşitli lansman partnerleriyle yakın iş birliği içinde modelin agentic platformlar içindeki davranışı sürekli iyileştirildi

Başlıca özellikler ve desteklenen ortamlar

grok-code-fast-1, grep, terminal, dosya düzenleme gibi yaygın geliştirme araçlarını güvenilir biçimde kullanır
Kullanıcılar bunu IDE gibi başlıca geliştirme ortamlarında doğrudan kullanabilir

Programlama performansı

Tüm yazılım geliştirme yığınını destekler
TypeScript, Python, Java, Rust, C++, Go gibi dillerde üstün kullanım kabiliyeti gösterir
Minimum gözetim altında bile sıfırdan proje oluşturma, kod tabanı soru-cevap, hassas hata düzeltme gibi çeşitli programlama görevlerini hızlı ve doğru şekilde yerine getirir

Grok Code Fast 1, mevcut modeller arasında en hızlı tepki süresini sunar
Küçük iş birimlerine bölerek kullanıldığında, yinelemeli ve hızlı iş akışları kurmak için çok avantajlıdır
Gerçek bir örnek olarak, Cursor ortamında yalnızca bir gün içinde Battle Simulator prototipi tamamlandı
Büyük özellikleri planlayıp adım adım alt görevlere bölerek yinelemeli çalıştırmak verimlidir

Fiyatlandırma politikası

1 milyon giriş tokenı başına $0.20
1 milyon çıkış tokenı başına $1.50
1 milyon önbelleğe alınmış giriş tokenı başına $0.02
Güçlü performans ve ekonomik fiyatlandırma ile günlük programlama görevleri hızlı ve verimli biçimde yürütülebilir

Model performansı ve değerlendirme

Token işleme hızı (Tokens Per Second, TPS): 190 ile sektörün en üst seviyelerindedir
Diğer modellerle (Gemini 2.5 Pro, GPT-5, Claude Sonnet 4, Qwen3-Coder, Grok 4) karşılaştırıldığında hem fiyat hem işleme hızı açısından güçlü rekabet gücü gösterir
Çeşitli açık benchmark'lar ve geliştiricilerin gerçek testleri birlikte yürütüldü
- SWE-Bench-Verified alt kümesinde %70,8'e ulaştı
Modelin pratik faydasını ve memnuniyet düzeyini en üst düzeye çıkarmak için saha mühendisleriyle düzenli insan değerlendirmeleri ve otomatik testler birleştirildi

Gelecek planları ve kullanım bilgileri

Resmi API ve başlıca partnerler üzerinden sunuluyor; ücretsiz deneme de geçici olarak mevcut
- GitHub Copilot, Cursor, Cline, Roo Code, Kilo Code, opencode, Windsurf vb.
Sürekli güncelleme ve hızlı iyileştirme döngüsü sözü veriliyor
Çok modlu girdi, paralel araç çağrıları, genişletilmiş bağlam desteği gibi yeni özellikler içeren yeni varyantlar da eğitiliyor
Ayrı olarak bir prompt engineering guide da sunuluyor
Model kartı ve geri bildirim kanalları (Discord vb.) üzerinden görüş paylaşılabiliyor

1 yorum

GN⁺ 2025-08-30

Hacker News görüşleri

Dün Cline ile test ettim; hızlı, agentic akışa iyi uyuyor ve kod kalitesi de oldukça iyi. Bu başlığın neden bu kadar olumsuz olduğunu anlamıyorum (yazarken flag de yedim). Bence bu model gayet iyi, en az gpt5-mini seviyesinde hissettiriyor. Birkaç gündür gpt5-mini’yi ana model olarak kullanıyordum; bütçeye uyuyordu ve yapılması gerekenleri iyi yapıyordu.
- Dikkatimi çekenler:
  - Hızlı (AB saat diliminde test ettim)
  - Agentic yaklaşımı ilginç biçimde ele alıyor; tüm dosyayı tek seferde değiştirmek yerine birkaç turda azar azar düzeltiyor
  - HTML parsing (bs4) ile ilgili bir işte yaklaşık 110 bin token kullandım ve görevi sorunsuz tamamladı; yüksek context durumunda sorun yaşamadı
  - İlk denemede başarısız olursa ayrı bir dosya oluşturup mock/test yapıyor, başarılı olunca ana modül dosyasını değiştiriyor; GPT5-mini ise iş sırasında dosya değişikliklerinde bazen kafası karışıp başarısız oluyordu
- Genel olarak iyi; fiyatına göre günlük ana model olarak da kullanılabilir. Opus + gpt5 high’ı planner olarak kullanıp bu modeli implementer olarak çalıştırmayı da hayal etmek mümkün. Hızlı olduğu için paralelde pass@x tarzı kurulumlar da ilginç olabilir.
- Her katmanda farklı seçeneklerin olması güzel; farklı sağlayıcıların rekabet etmesi birbirlerini tetikte tutuyor ve fiyatları aşağı çekiyor. gpt5-mini 2$/MTok, bu model ise 1.5$/MTok civarında, neredeyse “bedava” gibi hissettiriyor. Bu olumsuz havayı anlamıyorum.
- Qwen3-Coder-480B (Cerebras tarafından host ediliyor) OpenRouter üzerinden giriş/çıkış dahil 2$/Mtok.
  - OpenRouter’da Cerebras’ın saniyede 2000’den fazla token sunduğu söyleniyor; bu da 10 kat daha hızlı demek
  - Bağımsız benchmark sonuçlarına göre Qwen3-Coder-480B daha iyi görünüyor
- Context length’in yaklaşık yarısını kullanınca performansın iyi sayılması mı gerekiyor? qwen3-coder tarafında 65k/256k civarında kafasının karıştığını hissediyorum ve Grok’a göre %50 daha pahalı.
- İncelemeyi keyifle okudum; claude code ile karşılaştırınca nasıl acaba, merak ettim.
- Ben de benzer düşünüyorum; son zamanlarda bu modeli kullanıyorum, epey iyi ve çok hızlı.
  - HN yorumları Elon Musk’a karşı olumsuz ve LLM’lere karşı da önyargılı tepkiler içeriyor gibi; o yüzden düzgün değerlendirilmiyor olabilir.
İlginç olan, bu modelin öne çıkardığı benchmark’ın token çıktı hızı olması; hatta adına bile “fast” demişler.
- Normalde yazılım mühendisleri için token kalitesinin hızdan daha önemli olduğunu düşünürdüm.
- Asıl mesele ne kadar hızlı olduğu.
  - LLM çıktıları zaten bazen yanlış oluyorsa, prompt’u hızlıca birkaç kez deneyip iteratif şekilde rafine etmek daha değerli olabilir
  - Uç bir örnekte tüm projeyi milisaniyeler içinde işleyebilseydi, başarı oranı aynı kalsa bile bu çok daha değerli olurdu
  - Böyle bir hız hem kullanıcı deneyimini hem de aracın kullanılma biçimini tamamen değiştirebilir
  - Anında 3 farklı öneri almak da mümkün olabilir
  - Şahsen X ile ilişkim olsun istemediği için Grok kullanmayı düşünmüyorum; bu tamamen kişisel tercih
- xAI’ın ortaya attığı metrikler içinde en kötüsü değil.
  - ilgili bağlantı
- Cerebras’ın ücretsiz API’sini (Qwen Coder 480b, gpt-oss-120b var, ortaklık yok) kullandım; saniyede yaklaşık 3000 token ile gerçekten çok hızlı.
  - Bu yüzden model hızına hep bakıyorum
  - Ama Cerebras cloud’un günlük 70 milyon token limiti var ve bu sınırın çok hızlı aşıldığı söyleniyor; günlük geliştirmede ciddi kısıt yaratıyor
- Kullanım amacına göre değişir.
  - Basit fonksiyon autocomplete işleri için (string işleme, fonksiyon tanımı vb.) hız daha önemli hale geliyor
  - Sadece dallanıp düşünülen türden kodlamada kalite önemli, ama ne yaptığımı net biliyorsam daha az zeki ama hızlı bir model iş akışına daha çok yardımcı oluyor
  - Yavaş modellerde kodu PR review yapar gibi dikkatle incelemek gerekiyor; bu da iş akışını ciddi biçimde değiştiriyor
- Hız çok önemli.
  - Tabii kalite çok düşerse anlamı kalmaz ama Claude Sonnet 4 kadar iyi olup daha hızlı bir model olsaydı agentic coding’de oyunun kurallarını değiştirebilirdi
  - Şu an prompt gönderip 30 saniye ile birkaç dakika arası beklemek gerektiği için gerçekten deneme yapmak zor
  - Eğer birkaç saniyede bitseydi çok daha deneysel ve iteratif çalışma mümkün olurdu
  - Özellikle frontend kodunda, UI’yi tekrar tekrar değiştirmek gerektiğinde çok faydalı olurdu
HN’de AI coding assistant olarak ne kullanıldığını merak ediyorum; VSCode eklentisi önerileri gibi gerçek kullanım ipuçlarını duymak isterim.
Grok-4’ün kod performansının kötü olduğu söylendiği dönemde çıkan “coding” sürümü acaba bu model miydi, merak ediyorum.
- Benchmark’larda zayıfsa, abartması daha kolay olan bir metriği (hız) öne çıkarıyor gibi
- Aratınca Reddit’te bu modeli öven şeylerin sadece bariz spam hesaplardan geldiğini gördüm
- ilgili hesap bağlantısı
- Bence Grok 3 tabanlı gibi; Grok 3 aşırı hızlıydı ve programlamaya özel gibiydi.
“SWE-Bench-Verified” genelinde grok-code-fast-1’in şirket içi benchmark’ta %70.8 aldığı söyleniyor ama ben bu benchmark aracının kendisine biraz bakmak isterim.
- Üçüncü taraf raporlarda ise yaklaşık %57.6 görünüyor
- ilgili bağlantı
  - Ufak bir ayrıntı gibi gelebilir ama siteyi açar açmaz tarih gösteriminin darmadağın olmasına şaşırdım (gün/ay/yıl sırası karmakarışık)
  - Bu sadece kafa karıştırmakla kalmıyor, sıralama da düzgün çalışmıyor
  - Tarih sütununu sıralayınca tamamen anlamsız bir sonuç çıkıyor (ortadaki öğelere göre sıralıyor)
  - Böyle temel şeylere dikkat etmiyorlarsa kodlarının da özensiz olabileceğinden şüpheleniyorum
  - [bazı ülkeler hâlâ bu gösterimi kullanıyor ama çoğu artık standarda geçti]
  - Yine de diğer modellerle karşılaştırınca puanları iyi görünüyor
    - karşılaştırma bağlantısı
Grok 4’ün temel sürümüyle de oldukça iyi sonuçlar gördüğüm oldu.
- Sorun şu ki pek açıklama yapmıyor ve sadece kodu değiştirip geçme eğiliminde, ama sonuçlar kötü değildi
- Ben kişisel olarak daha hızlı sürüm yerine, önerdiği değişikliklerle ilgili biraz daha fazla geri bildirim ve açıklama isterdim
- Son dönemde GPT-5’in Sonnet 4’ten daha faydalı olduğunu hissettim
  - Farklı mimari seçenekleri sorduğumda çok iyi yanıtlar veriyor ve problem çözme sürecini adım adım yönlendirmesi hoşuma gidiyor
  - Her şeyi tek seferde “one-shot” biçiminde yeniden yazmasındansa, benim gerçekten istediğim yöne doğru ilerleyen bu süreci daha çok seviyorum
  - Opus 4.1 veya Sonnet serisinin one-shot problem çözme değerlendirmelerinin pek isabetli olmadığını düşünüyorum; asıl önemli olan gerçek bir assistant gibi davranabilmesi
  - gpt-5 de istemediğim bir yöne saplanırsa, ne kadar konuşursam konuşayım aynı davranışı tekrar ediyor
    - Bu yüzden Claude gibi modellerin “evet, haklısınız” tarzı tepkisini tercih edenler var
    - Geliştirme deneyimi seviyesine göre modelden beklenen şey değişebilir ama benim için son kararın bende kalması önemli
  - Sonnet 4, mimari tasarım veya derin analizde GPT-5’in gerisinde olabilir; ama detaylı plan zaten hazırsa, sadece büyük miktarda kod üretme işinde Sonnet 4 daha iyi.
Birkaç gün Grok test ettikten sonra bana daha çok gerileme gibi geldi.
- Kodumun bazı kısımlarını rastgele silip attı; uzun zamandır böyle bir şey yaşamamıştım
- Üst düzey coding modelleri son zamanlarda epey güvenilir hale geldi ama Grok sanki henüz o aşamada değil
- Ne kadar hızlı ve ücretsiz olursa olsun, kodumu güvenip emanet edemiyorsam araç olarak kullanamam
  - Kilo Code içinde Grok Code Fast 1’i ücretsiz denedim ve sonuçlar çok kötüydü
    - GPT 5 Mini’den daha az güvenilirdi ve ironik biçimde daha da yavaştı
  - Full Self Coding?
  - Hangi platformu/dili kullandığınızı merak ettim.
    - Bağlam verilmeden yazılan yorumlar çok uçlarda olduğu için kafa karıştırıyor
    - Dillere göre fark büyük; TS web geliştirmede sonuçlar hep daha iyi oluyor
  - Kodun bir kısmının silinmesi gerçekten sorun mu? Version control yok mu?
Saçma sapan garip davranışları inanılmaz hızlı yapıyor; bu iyi bir şey değil.
- CRUD endpoint’leri, i8n dosyaları gibi basit ve net görevler için uygun olabilir ama onun dışında emin değilim
  - Ben bu modeli tam da öyle işler için kullanıyorum.
    - “Basit ve can sıkıcı angaryaları” yapan bir model olarak tam yerinde
    - Her iş için zeki model gerekmiyor; kimsenin yapmak istemediği işleri buna verip hızlıca çok şey çıkartıyorum
    - Ama daha somut anlatmazsan sonuçlar saçmalayabiliyor
    - Yine de net örnekler verirsen tam söylendiği gibi yapıyor
  - Justfile’ı iyileştirmesini istedim, tamamen dağıttı; her şeyi bozdu ve sonsuz döngüye girdi
    - Kilo Code içinde kullandım, benim deneyimime göre kişiden kişiye değişebilir
‘sonic’ modelinin stealth döneminde de hızlıydı ama kalite gerektiği kadar isabetli değildi.
- Test kodu üretip tekrar tekrar çalıştırıyordu ama amaçlanan davranışı doğrulamak yerine sadece mock çağrılarını kontrol ediyordu
- Gerçek kullanım örüntülerini dikkate alma konusunda sınırları var
  - Böyle durumlarda boilerplate üretiminde güçlü olabileceğini düşündürüyor.
Ben etkileyici buldum.
- Refactoring ile ilgili bir soruda birkaç tool call yapıp kodu hızlıca okudu, mantıksal analiz yaptı ve 2 bug bulduğunu söyledi
- Tabii ikisi de bug değildi
- Yine de “havalı görünüyordu”

Grok Code Fast 1

Genel bakış

Tasarım ve veri kümesi

Başlıca özellikler ve desteklenen ortamlar

Programlama performansı

Fiyatlandırma politikası

Model performansı ve değerlendirme

Gelecek planları ve kullanım bilgileri

İlgili okumalar

1 yorum

Hacker News görüşleri