7 puan yazan GN⁺ 2025-08-30 | 1 yorum | WhatsApp'ta paylaş
  • xAI tarafından piyasaya sürülen grok-code-fast-1, geliştiriciler için ultra hızlı bir yapay zeka kodlama modeli olup hızlı yanıt verme ve IDE dostu özelliklere sahiptir
  • Bu model, programlama veri kümeleri odaklı olarak önceden eğitildi ve gerçek kullanıcı değerlendirmeleriyle grep, terminal, dosya düzenleme gibi araçları kullanmada yetkin olacak şekilde tasarlandı
  • Performans tarafında saniyede 190 token üretim hızı ve SWE-Bench-Verified'da %70,8 puan kaydederken, TypeScript, Python, Java, Rust, C++, Go gibi birçok dilde güçlü yönler gösteriyor
  • Fiyatlandırma 1 milyon giriş tokenı için $0.20, çıkış için $1.50, önbelleğe alınmış giriş için $0.02 olarak belirlenmiş durumda; bazı partner platformlarda (GitHub Copilot, Cursor vb.) ise geçici olarak ücretsiz sunuluyor
  • Yakında çok modlu girdi, paralel araç çağrıları, genişletilmiş bağlam destekleyen varyant modellerin de duyurulması planlanıyor

Genel bakış

  • xAI'nin grok-code-fast-1 modeli, yinelemeli düşünme ve araç kullanımının sık yaşandığı gerçek geliştirme ortamlarında hız düşüşü sorununu çözmek için geliştirilen ultra hızlı bir yapay zeka kodlama modelidir
  • Saha mühendisi geri bildirimleri temel alınarak, hızlı, çevik ve gerçek iş akışlarına uygun bir model mimarisi sıfırdan yeniden inşa edildi
  • Muhakeme ve hesaplama mühendisliği ekipleri, ezici derecede hızlı servis teknolojisine çok sayıda yenilikçi yöntem kattı
    • Kullanıcılar, düşünce akışını okumaya fırsat bulmadan birden fazla araç çağrısının çoktan gerçekleştiğini hissedebilir
  • Prompt caching optimizasyonu sayesinde partner ortamlarında %90'ın üzerinde önbellek isabet oranı elde edildi

Tasarım ve veri kümesi

  • Eğitim ortamı, programlama odaklı geniş kapsamlı ön eğitim verileri temelinde oluşturuldu
  • Gerçek pull request ve kod yazımı verileriyle yüksek kaliteli bir sonradan eğitim süreci yürütüldü
  • Çeşitli lansman partnerleriyle yakın iş birliği içinde modelin agentic platformlar içindeki davranışı sürekli iyileştirildi
Reklam

Başlıca özellikler ve desteklenen ortamlar

  • grok-code-fast-1, grep, terminal, dosya düzenleme gibi yaygın geliştirme araçlarını güvenilir biçimde kullanır
  • Kullanıcılar bunu IDE gibi başlıca geliştirme ortamlarında doğrudan kullanabilir

Programlama performansı

  • Tüm yazılım geliştirme yığınını destekler
  • TypeScript, Python, Java, Rust, C++, Go gibi dillerde üstün kullanım kabiliyeti gösterir
  • Minimum gözetim altında bile sıfırdan proje oluşturma, kod tabanı soru-cevap, hassas hata düzeltme gibi çeşitli programlama görevlerini hızlı ve doğru şekilde yerine getirir
  • Grok Code Fast 1, mevcut modeller arasında en hızlı tepki süresini sunar
  • Küçük iş birimlerine bölerek kullanıldığında, yinelemeli ve hızlı iş akışları kurmak için çok avantajlıdır
  • Gerçek bir örnek olarak, Cursor ortamında yalnızca bir gün içinde Battle Simulator prototipi tamamlandı
  • Büyük özellikleri planlayıp adım adım alt görevlere bölerek yinelemeli çalıştırmak verimlidir

Fiyatlandırma politikası

  • 1 milyon giriş tokenı başına $0.20
  • 1 milyon çıkış tokenı başına $1.50
  • 1 milyon önbelleğe alınmış giriş tokenı başına $0.02
  • Güçlü performans ve ekonomik fiyatlandırma ile günlük programlama görevleri hızlı ve verimli biçimde yürütülebilir
Reklam

Model performansı ve değerlendirme

  • Token işleme hızı (Tokens Per Second, TPS): 190 ile sektörün en üst seviyelerindedir
  • Diğer modellerle (Gemini 2.5 Pro, GPT-5, Claude Sonnet 4, Qwen3-Coder, Grok 4) karşılaştırıldığında hem fiyat hem işleme hızı açısından güçlü rekabet gücü gösterir
  • Çeşitli açık benchmark'lar ve geliştiricilerin gerçek testleri birlikte yürütüldü
    • SWE-Bench-Verified alt kümesinde %70,8'e ulaştı
  • Modelin pratik faydasını ve memnuniyet düzeyini en üst düzeye çıkarmak için saha mühendisleriyle düzenli insan değerlendirmeleri ve otomatik testler birleştirildi

Gelecek planları ve kullanım bilgileri

  • Resmi API ve başlıca partnerler üzerinden sunuluyor; ücretsiz deneme de geçici olarak mevcut
    • GitHub Copilot, Cursor, Cline, Roo Code, Kilo Code, opencode, Windsurf vb.
  • Sürekli güncelleme ve hızlı iyileştirme döngüsü sözü veriliyor
  • Çok modlu girdi, paralel araç çağrıları, genişletilmiş bağlam desteği gibi yeni özellikler içeren yeni varyantlar da eğitiliyor
  • Ayrı olarak bir prompt engineering guide da sunuluyor
  • Model kartı ve geri bildirim kanalları (Discord vb.) üzerinden görüş paylaşılabiliyor

1 yorum

 
GN⁺ 2025-08-30
Hacker News görüşleri
  • Dün Cline ile test ettim; hızlı, agentic akışa iyi uyuyor ve kod kalitesi de oldukça iyi. Bu başlığın neden bu kadar olumsuz olduğunu anlamıyorum (yazarken flag de yedim). Bence bu model gayet iyi, en az gpt5-mini seviyesinde hissettiriyor. Birkaç gündür gpt5-mini’yi ana model olarak kullanıyordum; bütçeye uyuyordu ve yapılması gerekenleri iyi yapıyordu.

    • Dikkatimi çekenler:

      • Hızlı (AB saat diliminde test ettim)
      • Agentic yaklaşımı ilginç biçimde ele alıyor; tüm dosyayı tek seferde değiştirmek yerine birkaç turda azar azar düzeltiyor
      • HTML parsing (bs4) ile ilgili bir işte yaklaşık 110 bin token kullandım ve görevi sorunsuz tamamladı; yüksek context durumunda sorun yaşamadı
      • İlk denemede başarısız olursa ayrı bir dosya oluşturup mock/test yapıyor, başarılı olunca ana modül dosyasını değiştiriyor; GPT5-mini ise iş sırasında dosya değişikliklerinde bazen kafası karışıp başarısız oluyordu
    • Genel olarak iyi; fiyatına göre günlük ana model olarak da kullanılabilir. Opus + gpt5 high’ı planner olarak kullanıp bu modeli implementer olarak çalıştırmayı da hayal etmek mümkün. Hızlı olduğu için paralelde pass@x tarzı kurulumlar da ilginç olabilir.

    • Her katmanda farklı seçeneklerin olması güzel; farklı sağlayıcıların rekabet etmesi birbirlerini tetikte tutuyor ve fiyatları aşağı çekiyor. gpt5-mini 2$/MTok, bu model ise 1.5$/MTok civarında, neredeyse “bedava” gibi hissettiriyor. Bu olumsuz havayı anlamıyorum.

    • Qwen3-Coder-480B (Cerebras tarafından host ediliyor) OpenRouter üzerinden giriş/çıkış dahil 2$/Mtok.

      • OpenRouter’da Cerebras’ın saniyede 2000’den fazla token sunduğu söyleniyor; bu da 10 kat daha hızlı demek
      • Bağımsız benchmark sonuçlarına göre Qwen3-Coder-480B daha iyi görünüyor
    • Context length’in yaklaşık yarısını kullanınca performansın iyi sayılması mı gerekiyor? qwen3-coder tarafında 65k/256k civarında kafasının karıştığını hissediyorum ve Grok’a göre %50 daha pahalı.

    • İncelemeyi keyifle okudum; claude code ile karşılaştırınca nasıl acaba, merak ettim.

    • Ben de benzer düşünüyorum; son zamanlarda bu modeli kullanıyorum, epey iyi ve çok hızlı.

      • HN yorumları Elon Musk’a karşı olumsuz ve LLM’lere karşı da önyargılı tepkiler içeriyor gibi; o yüzden düzgün değerlendirilmiyor olabilir.
  • İlginç olan, bu modelin öne çıkardığı benchmark’ın token çıktı hızı olması; hatta adına bile “fast” demişler.

    • Normalde yazılım mühendisleri için token kalitesinin hızdan daha önemli olduğunu düşünürdüm.

    • Asıl mesele ne kadar hızlı olduğu.

      • LLM çıktıları zaten bazen yanlış oluyorsa, prompt’u hızlıca birkaç kez deneyip iteratif şekilde rafine etmek daha değerli olabilir
      • Uç bir örnekte tüm projeyi milisaniyeler içinde işleyebilseydi, başarı oranı aynı kalsa bile bu çok daha değerli olurdu
      • Böyle bir hız hem kullanıcı deneyimini hem de aracın kullanılma biçimini tamamen değiştirebilir
      • Anında 3 farklı öneri almak da mümkün olabilir
      • Şahsen X ile ilişkim olsun istemediği için Grok kullanmayı düşünmüyorum; bu tamamen kişisel tercih
    • xAI’ın ortaya attığı metrikler içinde en kötüsü değil.

    • Cerebras’ın ücretsiz API’sini (Qwen Coder 480b, gpt-oss-120b var, ortaklık yok) kullandım; saniyede yaklaşık 3000 token ile gerçekten çok hızlı.

      • Bu yüzden model hızına hep bakıyorum
      • Ama Cerebras cloud’un günlük 70 milyon token limiti var ve bu sınırın çok hızlı aşıldığı söyleniyor; günlük geliştirmede ciddi kısıt yaratıyor
    • Kullanım amacına göre değişir.

      • Basit fonksiyon autocomplete işleri için (string işleme, fonksiyon tanımı vb.) hız daha önemli hale geliyor
      • Sadece dallanıp düşünülen türden kodlamada kalite önemli, ama ne yaptığımı net biliyorsam daha az zeki ama hızlı bir model iş akışına daha çok yardımcı oluyor
      • Yavaş modellerde kodu PR review yapar gibi dikkatle incelemek gerekiyor; bu da iş akışını ciddi biçimde değiştiriyor
    • Hız çok önemli.

      • Tabii kalite çok düşerse anlamı kalmaz ama Claude Sonnet 4 kadar iyi olup daha hızlı bir model olsaydı agentic coding’de oyunun kurallarını değiştirebilirdi
      • Şu an prompt gönderip 30 saniye ile birkaç dakika arası beklemek gerektiği için gerçekten deneme yapmak zor
      • Eğer birkaç saniyede bitseydi çok daha deneysel ve iteratif çalışma mümkün olurdu
      • Özellikle frontend kodunda, UI’yi tekrar tekrar değiştirmek gerektiğinde çok faydalı olurdu
  • HN’de AI coding assistant olarak ne kullanıldığını merak ediyorum; VSCode eklentisi önerileri gibi gerçek kullanım ipuçlarını duymak isterim.

  • Grok-4’ün kod performansının kötü olduğu söylendiği dönemde çıkan “coding” sürümü acaba bu model miydi, merak ediyorum.

    • Benchmark’larda zayıfsa, abartması daha kolay olan bir metriği (hız) öne çıkarıyor gibi

    • Aratınca Reddit’te bu modeli öven şeylerin sadece bariz spam hesaplardan geldiğini gördüm

    • ilgili hesap bağlantısı

    • Bence Grok 3 tabanlı gibi; Grok 3 aşırı hızlıydı ve programlamaya özel gibiydi.

  • “SWE-Bench-Verified” genelinde grok-code-fast-1’in şirket içi benchmark’ta %70.8 aldığı söyleniyor ama ben bu benchmark aracının kendisine biraz bakmak isterim.

    • Üçüncü taraf raporlarda ise yaklaşık %57.6 görünüyor

    • ilgili bağlantı

      • Ufak bir ayrıntı gibi gelebilir ama siteyi açar açmaz tarih gösteriminin darmadağın olmasına şaşırdım (gün/ay/yıl sırası karmakarışık)

      • Bu sadece kafa karıştırmakla kalmıyor, sıralama da düzgün çalışmıyor

      • Tarih sütununu sıralayınca tamamen anlamsız bir sonuç çıkıyor (ortadaki öğelere göre sıralıyor)

      • Böyle temel şeylere dikkat etmiyorlarsa kodlarının da özensiz olabileceğinden şüpheleniyorum

      • [bazı ülkeler hâlâ bu gösterimi kullanıyor ama çoğu artık standarda geçti]

      • Yine de diğer modellerle karşılaştırınca puanları iyi görünüyor

  • Grok 4’ün temel sürümüyle de oldukça iyi sonuçlar gördüğüm oldu.

    • Sorun şu ki pek açıklama yapmıyor ve sadece kodu değiştirip geçme eğiliminde, ama sonuçlar kötü değildi
    • Ben kişisel olarak daha hızlı sürüm yerine, önerdiği değişikliklerle ilgili biraz daha fazla geri bildirim ve açıklama isterdim
    • Son dönemde GPT-5’in Sonnet 4’ten daha faydalı olduğunu hissettim
      • Farklı mimari seçenekleri sorduğumda çok iyi yanıtlar veriyor ve problem çözme sürecini adım adım yönlendirmesi hoşuma gidiyor

      • Her şeyi tek seferde “one-shot” biçiminde yeniden yazmasındansa, benim gerçekten istediğim yöne doğru ilerleyen bu süreci daha çok seviyorum

      • Opus 4.1 veya Sonnet serisinin one-shot problem çözme değerlendirmelerinin pek isabetli olmadığını düşünüyorum; asıl önemli olan gerçek bir assistant gibi davranabilmesi

      • gpt-5 de istemediğim bir yöne saplanırsa, ne kadar konuşursam konuşayım aynı davranışı tekrar ediyor

        • Bu yüzden Claude gibi modellerin “evet, haklısınız” tarzı tepkisini tercih edenler var
        • Geliştirme deneyimi seviyesine göre modelden beklenen şey değişebilir ama benim için son kararın bende kalması önemli
      • Sonnet 4, mimari tasarım veya derin analizde GPT-5’in gerisinde olabilir; ama detaylı plan zaten hazırsa, sadece büyük miktarda kod üretme işinde Sonnet 4 daha iyi.

  • Birkaç gün Grok test ettikten sonra bana daha çok gerileme gibi geldi.

    • Kodumun bazı kısımlarını rastgele silip attı; uzun zamandır böyle bir şey yaşamamıştım

    • Üst düzey coding modelleri son zamanlarda epey güvenilir hale geldi ama Grok sanki henüz o aşamada değil

    • Ne kadar hızlı ve ücretsiz olursa olsun, kodumu güvenip emanet edemiyorsam araç olarak kullanamam

      • Kilo Code içinde Grok Code Fast 1’i ücretsiz denedim ve sonuçlar çok kötüydü

        • GPT 5 Mini’den daha az güvenilirdi ve ironik biçimde daha da yavaştı
      • Full Self Coding?

      • Hangi platformu/dili kullandığınızı merak ettim.

        • Bağlam verilmeden yazılan yorumlar çok uçlarda olduğu için kafa karıştırıyor
        • Dillere göre fark büyük; TS web geliştirmede sonuçlar hep daha iyi oluyor
      • Kodun bir kısmının silinmesi gerçekten sorun mu? Version control yok mu?

  • Saçma sapan garip davranışları inanılmaz hızlı yapıyor; bu iyi bir şey değil.

    • CRUD endpoint’leri, i8n dosyaları gibi basit ve net görevler için uygun olabilir ama onun dışında emin değilim

      • Ben bu modeli tam da öyle işler için kullanıyorum.

        • “Basit ve can sıkıcı angaryaları” yapan bir model olarak tam yerinde
        • Her iş için zeki model gerekmiyor; kimsenin yapmak istemediği işleri buna verip hızlıca çok şey çıkartıyorum
        • Ama daha somut anlatmazsan sonuçlar saçmalayabiliyor
        • Yine de net örnekler verirsen tam söylendiği gibi yapıyor
      • Justfile’ı iyileştirmesini istedim, tamamen dağıttı; her şeyi bozdu ve sonsuz döngüye girdi

        • Kilo Code içinde kullandım, benim deneyimime göre kişiden kişiye değişebilir
  • ‘sonic’ modelinin stealth döneminde de hızlıydı ama kalite gerektiği kadar isabetli değildi.

    • Test kodu üretip tekrar tekrar çalıştırıyordu ama amaçlanan davranışı doğrulamak yerine sadece mock çağrılarını kontrol ediyordu

    • Gerçek kullanım örüntülerini dikkate alma konusunda sınırları var

      • Böyle durumlarda boilerplate üretiminde güçlü olabileceğini düşündürüyor.
  • Ben etkileyici buldum.

    • Refactoring ile ilgili bir soruda birkaç tool call yapıp kodu hızlıca okudu, mantıksal analiz yaptı ve 2 bug bulduğunu söyledi
    • Tabii ikisi de bug değildi
    • Yine de “havalı görünüyordu”