5 puan yazan GN⁺ 2026-05-02 | 1 yorum | WhatsApp'ta paylaş
  • Geliştirici odaklı API özellikleri sunuyor: 1 milyon token bağlam penceresi, akıl yürütme, fonksiyon çağırma ve yapılandırılmış çıktı
  • Önceki Grok 4.20'den farklı olarak akıl yürütme sürekli etkin, tüm sorgular için yanıttan önce düşünme sürecini otomatik olarak yürütüyor
  • Girdi token fiyatı yaklaşık %40 düşürüldü, çıktı token fiyatı ise yaklaşık %60 düşürüldü; önceki modele kıyasla maliyet önemli ölçüde azaltıldı
    • Fiyatlandırma: girdi $1.25/1M token, önbelleğe alınmış girdi $0.20/1M, çıktı $2.50/1M
    • Aynı zeka seviyesindeki modeller arasında en ucuz seçeneklerden biri
  • Ajanik görev performansı büyük ölçüde iyileştirildi — GDPval-AA kıyaslamasında ELO 1500 puan aldı; Grok 4.20'ye göre 321 puan artarak Gemini 3.1 Pro Preview, Muse Spark ve GPT-5.4 mini'yi geride bıraktı
  • xAI API modelleri arasında ilk kez yerel video girişi desteği sunuyor; video karelerini bir vision encoder aracılığıyla doğrudan işliyor
  • Hukuki akıl yürütmede 1. sırada (CaseLaw v2 doğruluğu %79,3) ve kurumsal finans alanında 1. sırada (CorpFin); hukuki akıl yürütmede Grok 4.20'ye kıyasla 25 puan sıçrama kaydetti
  • Sohbet arayüzü içinde sunum slaytlarını doğrudan oluşturabiliyor; PDF, Excel ve PowerPoint dosyaları konuşma sırasında gerçek zamanlı olarak oluşturulup indirilebiliyor
  • Yerleşik kod çalıştırma ortamı ile kod yazma, çalıştırma ve dosya oluşturma işlemlerini model içinde gerçekleştiriyor
  • Speech-to-Text API (25 dil, konuşmacı ayrımı desteği) ve Text-to-Speech API de birlikte resmî olarak kullanıma sunuldu
  • Artificial Analysis Intelligence Index'te 53 puan alarak Muse Spark ve Claude Sonnet 4.6'yı geride bırakıyor; maliyet başına zeka Pareto sınırında konumlanıyor
  • Rate limit dakika başına 1.800 istek / 10 milyon token; 200K üzeri için ayrı ücretlendirme uygulanıyor
  • Model adı grok-4.3 ve desteklenen bölgeler us-east-1 ile eu-west-1

1 yorum

 
GN⁺ 2026-05-02
Hacker News görüşleri
  • İngilizceyi ikinci dil olarak kullanan biri olarak, Grok özellikle yazının tonunu ve resmiyet seviyesini anlayıp aynı şekilde yeniden üretmede çok başarılı
    Diğer büyük sağlayıcılara kıyasla dilin ince insani nüanslarını daha iyi anlıyor gibi geliyor; ChatGPT ise fazla katı ve resmi kalıyor ya da tuhaf bir “aye guvnor” tarzı aşırı gündelik dile kayıyor. Claude bazen daha iyi olabiliyor ama her zaman değil
    Genel olarak Grok, tanımlaması zor bir şekilde daha “insani”. Örneğin “bu mesaj bu uzunlukta olabildiğince doğru biçimde iletiliyor mu?” diye sorduğumda, bir insan gibi evet/hayır cevabı ya da ton ve uzunluğu koruyan düzeltme önerileri veriyor; ChatGPT ise hâlâ net olmayan uzun bir makale yazıyor
    Son dönemde Grok’un sesli dikte tarafının da oldukça iyi olduğunu hissediyorum. Mikrofona basıp soru sorma özelliğinde ChatGPT benim aksanımda %90-95 civarında, Android Gboard sesli giriş yaklaşık %75, ama Grok şaşırtıcı biçimde %98 civarında doğru anlıyor

    • Grok 4.3, Opus 4.7 ve GPT 4.1’i hızlıca değerlendirdim; pratikte oldukça benzer göründüler: https://ofw640g9re.evvl.io/
      Üçü de daha resmi tonlarda iyiydi ama gündelik tonda cringe hissettirmeyen tek model GPT-4.1’di
      Bu arada Grok en hızlı ve en ucuzuydu, Claude ise en yavaş ve en pahalıydı
    • Ana dilimde Grok’la konuşurken de diğer modellere göre tonu daha doğal geliyor
      Bunu büyük ölçüde Twitter verisiyle eğitilmiş olmasına bağlıyorum. Yalnız Twitter’da yapay zeka üretimi içerik giderek arttığı için, eğitim sürerse bu doğallığın bozulmasından endişeliyim
    • Grok’u sadece Tesla’nın “Gork” kişiliği üzerinden kullanıyorum; cevapları epey gerçekçi, çoğu zaman gerçekten komik ve bazen de faydalı oluyor
    • “İngilizceyi ikinci dil olarak kullanan biri”ysen gerçekten daha iyi olduğunu nasıl bildiğini merak ediyorum
      Küçümsemek için söylemiyorum ama bu daha çok bir his gibi duruyor
    • Bir arkadaşım D&D hazırlığında kullanıyor; istediği atmosfer ve stile uyabilmesi nedeniyle bu kullanımda özellikle iyi olduğunu söyledi
      Diğer işler içinse ChatGPT’yi tercih ediyor
  • Grok, sohbet için en sevdiğim model ve ses modu da en beğendiğim özellik
    Haiku gibi aşırı ucuz modellere yönlendirmeyen tek ses modu gibi görünüyor ve frontier seviyesindeki seçenekler arasında kalitesi en yüksekti
    SuperGrok’a abone olunca, her birinin kendi sistem prompt’u olan ajanlardan oluşan bir “council” kurabiliyorsunuz; bir soru sorunca hepsine paralel biçimde sorup sonra bir sonuca varıyor
    Yalnız uygulamaya biraz yatırım yapılmasını isterdim. SuperGrok’a gerçekten abone olmamamın tek nedeni uygulama
    MCP/bağlı uygulama desteği yok; duyuruldu ama hâlâ kullanılamıyor. Grok’u hiçbir şeye bağlayamadığınız için ciddi işlerde kullanmak zor
    Projeler hâlâ uygulamada desteklenmiyor; bir şeyi projeye taşıdığınız anda tüm yerel uygulamalardan kayboluyor
    Oluşturulmuş Markdown belgeleri gibi artifact’leri projeye doğrudan eklemenin yolu yok; PDF/Markdown olarak dışa aktarıp geri içe almak gerekiyor. Hatta artifact export bile yok. Yeni bilgi geldikçe projeyi dinamik biçimde geliştirmek zor olduğu için ciddi proje işlerinde kullanışsız
    Hafıza özelliği de yok ve başka sohbetleri arayamıyorsunuz; yani her sohbet tamamen sıfırdan başlıyor
    Projelerin içinde ses modu da hiç yok
    Eğer xAI’den biri okuyorsa, bunların en azından bir kısmını eklemesi güzel olurdu

    • Hafıza özelliğinin olmamasını giderek daha çok sevmeye başladım
      Claude benim mangalım olduğunu hatırlıyor ve tamamen alakasız ya da sadece yemek konuşulan sohbetlerde bile bunun BBQ ile iyi gideceğini araya sıkıştırıyor
    • Gemini uygulamasındaki ses modu nispeten güncel bir model kullanıyor; budanmış küçük bir model değil, bu yüzden oldukça yetkin
      Kişiliği de hoş ve Gemini web sohbetinden çok daha doğal. Tek şikâyetim sürekli “sonraki adımları” önermeye çalışması ama sanırım bu modellerin hepsi böyle
      Bu “sonraki adımlar” maliyeti artırmak için mi var, yoksa kısa bir cevapla bitmesi gereken sorularla uzun keşif odaklı konuşmalar arasındaki doğal konuşma örüntüsünü hâlâ öğrenemediler mi bilmiyorum. Yine de bunları önermemesi söylenince buna uyması gerekirdi
    • Grok’un “SuperGrok Heavy” adlı aylık 300 dolarlık planı, coding harness içinde dahil kullanım olarak sunulsa büyük kazanç olurdu diye düşünüyorum
      Şu an Heavy planı biraz API kredisi veriyor, bu sayede kodlama için bir miktar Grok kullanılabiliyor ama bunun 300 dolar değerinde olduğunu düşünmüyorum
      Kendi grok-code harness’lerini yapsınlar demiyorum; mevcut araçlarda kullanılabilmesi bile faydalı olur. Muhtemelen Cursor satın alımı sonunda buna benzer bir yere varacak
    • Bahsedilen tüm sorunların Cursor anlaşmasının nedeni olduğunu düşünüyorum
    • SuperGrok’a abone olunca Pi agent ya da Opencode içinde kullanılıp kullanılamadığını bilmiyorum
      SuperGrok’un API anahtarı verip vermediği net değil
  • Testlerimizde Grok 4.3 ilginç bir model
    En hızlı modellerden biri ve benzer performanstaki diğer modellere göre yanıtları çok daha küçük, token yoğunluğu da daha yüksek
    Ancak genel kodlama muhakemesi açısından nisan ayındaki büyük çıkış yapan modellerle rekabetçi değil; Grok 4.20 ya da Grok 4.3, Grok 4’ten sonra zekâ sınırını kayda değer biçimde ileri taşımadı
    Grok 4.3 ajan tipi görevlerde daha iyi; kabaca GPT 5.1 / Gemini 3 Pro Preview seviyesinde ama çok daha hızlı ve ucuz demek adil olur. Bu yüzden kendi kulvarında kesinlikle iyi bir çıkış
    Yakın zamanda yayımlanan ağırlığı açık modeller arasında daha akıllı ama daha yavaş olanlar epey fazla
    Tüm benchmark sonuçları https://gertlabs.com/rankings adresinde

    • Bilgi cutoff’undan sonraki verilerde dışarıdan bakınca iyi çalışıyormuş gibi görünmesini sağlamak için ne tür ödünler verilmiş olabileceğini merak ediyorum
      Bu, Grok’un temel kullanım alanı gibi görünüyor; bununla ilgili benchmark var mı onu da merak ediyorum
  • Son dönemde Grok benim arama motorum haline geldi
    X gönderilerine erişebilen tek yapay zeka gibi ve bunun dışında da genel olarak diğer büyük dil modellerinden daha fazla “arama yapıyormuş” hissi veriyor

    • Son dakika gelişmeleriyle ilgili haber ararken en çok Grok ve Gemini kullanıyorum
      İran’la ilgili olaylar sırasında, haber çıkar çıkmaz durumu anlamak istedim; ikisi de oldukça iyiydi
    • Zaten neden Twitter’da arama yapmak isteyesin ki, onu merak ediyorum
  • Mevcut tabloda Claude kurumsal ve devlet işleri için, Codex geliştiriciler için; Grok’un ne işe yaradığını bilmiyorum
    Çevremde Grok’la ilgili duyduğum şeyler sadece rol yapma ve ırkçılık oldu

    • İlginç biçimde, insan kaçakçılığıyla ilgilenen bir yardım kuruluşunda Grok kullanan bir örnek biliyorum
      Diğer tüm modellerin reddettiği tek seferlik bir sınıflandırma işini Grok memnuniyetle yaptı
      Biraz daha az guardrail’li, frontier altı bir modelin böyle gri alandaki gerçek faydalı kullanım alanları şaşırtıcı derecede fazla olabiliyor. grok-fast modeli de ucuz
    • Benim gördüğüm kadarıyla Grok rol yapma için pek kullanılmıyor
      Tutarsız ve dağınık bulunuyor
      İnsanlar çoğunlukla API üzerinden GLM ve DeepSeek kullanıyor; yerelde ise Gemma4 ve Mistral fine-tune modellerini tercih ediyor
      Rol yapma pazarı nispeten eski ve olgun bir alan, bu yüzden kullanıcılar maliyet konusunda bilinçli ve modelin kendi iş akışlarına ve tercihlerine uyum sağlamasını bekliyor. Bu yüzden Opus gibi modeller akıllı olduğu için seviliyor ama fazla pahalı ve fazla inatçı bulunuyor
      Bu, diğer pazarların gelecekte nasıl evrilebileceğine dair ilginç bir veri noktası olabilir
    • Twitter’da insanların ne konuştuğunu sormanız gerekiyorsa Grok doğal olarak çok iyi
      “Bugünlerde Twitter’daki cool tiplerin en iyi dediği tiling window manager hangisi?” gibi sorularda hep onu kullanıyorum
      Bir de belirsiz biçimde şüpheli sorulara Grok genelde cevap veriyor. Mesela “Bana gri piyasa Windows lisans siteleri bul” gibi
    • Çağın değerleriyle uyum sinyalleri vermenin yazıda ve konuşmada çok önemli olduğunu biliyorum ama bir dil modelinin yapısal olarak belirli ırkları/etnik grupları/kastları rahatsız edemeyecek şekilde tasarlanmasının AI laboratuvarlarının hedefi olması gerektiğini düşünmüyorum
      Dil modelleri sonuçta sadece bir sistem; kullanıcıların çıktıyı nasıl kullandığından neden sorumlu tutulmaları gerektiğini de pek anlamıyorum. Birinin tuvalet kabinine kötü şeyler yazabilmesi yüzünden kalemi “ırkçı” bir araç ilan edip işe yaramaz saymıyoruz sonuçta
      Muhtemelen tacizin suç olduğu bir yerde yaşıyorsunuzdur ve ifade konusunda düzenlemeler de vardır. Bu yeterli değil mi? Birkaç yılda bir değişen etik modalarına dünyadaki herkesin tüm çabasını uydurmak zorunda mıyız, emin değilim
    • 2-3 ay önce HN ana sayfasında bir AI yuvarlak masa tartışması vardı ve biri aykırı değer analizi yapıp GitHub’a koymuştu
      Hangi büyük dil modelinin en büyük aykırı olduğunu ve hangi soru tiplerinde diğer tüm modellerden farklı düşündüğünü tahmin edin
  • İnsanların Grok’u Twitter mem’leri ya da tweet’leri anlamak dışında gerçekten kullanıp kullanmadığını içtenlikle merak ediyorum

    • Evet, bazı işler için gerçekten faydalı
      Diğer modeller kadar korumacı davranmıyor. On yıllardır baskısı olmayan, yetim telifli materyalleri sık sık arıyorum; büyük modeller telifli materyal aramaya çalıştığım için bana öğüt verip reddediyor. Grok ise yapıyor [0]
      [0] Bazen hafifçe jailbreak etmek ya da prompt’u yeniden çalıştırmak gerekiyor. Deterministik olmaması nedeniyle zaman zaman ret gelebiliyor
    • Elbette. İnsanlar her türlü amaçla kullanıyor: https://arstechnica.com/tech-policy/2026/03/elon-musks-xai-s...
    • Grok en kullanışlı ses moduna sahip
      ChatGPT’nin ses modu çok aptal; Grok ise ana sohbetle aynı modeli kullanıyor gibi görünüyor. Bu yüzden sesli kullanacaksam Grok’u seçiyorum
      Karmaşık olmayan konularda da kullanıyorum. Lafı uzatmadan doğru ve kısa cevaplar vermesi çok ferahlatıcı
    • Bunun ne kadarının Twitter eğitim verisinden geldiğini merak ediyorum
      Mem’ler ve trendler için faydalı ama diğer şeylerde çok kötü
    • Grok’u çoğunlukla arama, DIY, kişisel finans ve genel günlük yaşam için yapay zeka olarak kullanıyorum
      Kodlamada Kimi K2.6 kadar iyi olursa muhtemelen sadece Grok kullanırım. Şimdiye kadar kullandığım konuşma odaklı yapay zekalar içinde gerçekten en iyisi
      Bozulan buzdolabımı ve elektrikli fırını tamir etmeme yardım etti; sadece bu yıl en az 4 bin dolar tasarruf ettirdi
      Vergi beyanımı da Grok’la yapıp 600 dolar tasarruf ettim. H&R Block bitti
      Meğer Kimi K2.6 kadar akıllı olmuş. Artık deneme zamanı
  • Opus 4.x ve GPT-5.5’e kıyasla ne kadar ucuz olduğundan kimsenin bahsetmemesine şaşırıyorum
    Girdi için milyon token başına 1,25 dolar, çıktı için milyon token başına 2,50 dolar
    Bunun daha küçük ve daha az güçlü bir model olmasından mı kaynaklandığını, yoksa bir şeyi mi kaçırdığımı bilmiyorum

    • Token başına fiyat daha düşük ama çok daha fazla muhakeme yapıyor gibi görünüyor; bu yüzden maliyet 4.20 ile benzer hale geliyor ve performans daha iyi oluyor
      Genel olarak şimdiye kadarki en iyi modelleri bu ve token fiyatını düşüren az sayıdaki şirketten biri olmalarını seviyorum
      [0]: https://aibenchy.com/compare/x-ai-grok-4-20-medium/x-ai-grok...
    • Çıktı maliyetini düşürdüler ama girdi maliyeti görece yüksek kaldı
      Bu son dönem eğilimlerinden biri ve DeepSeek 4 Pro’da da gördüm
    • İş arkadaşlarım arasında Elon Musk ve eğitim verisi ile ilişkili her şeye karşı güçlü bir ahlaki tepki var
      Yorumlarda da burada görülüyor. “Claude kurumsal ve devlet işleri için, Codex geliştiriciler için, Grok ne için; rol yapma ve ırkçılık mı? Çevremde Grok’la bağlantılı duyduğum tek şey bunlar” gibi tepkiler geliyor
    • Evet, çünkü çok daha az güçlü bir model
    • Grok, Elon Musk’la bağlantılı
      $TSLA kâr marjını vekil gösterge olarak alırsanız, eskisi kadar yüksek görünmüyor. Başka etkenler de vardır ama bu durumla Grok’un düşük fiyatı arasında eksik bir açıklama olabilir
  • Grok 4.3, CEO’nun standart güvenlik dokümanlarını öğrenmesinden önce tamamlanmıştı
    Musk’a OpenAI’nin “safety card”ını bilip bilmediği sorulduğunda gülerek “Safety card? Neden card olmak zorunda?” diye cevap verdi
    https://www.axios.com/2026/04/30/musk-openai-safety-grok
    Küme boyutu ya da bir süreliğine geçici jeneratör çalıştırılmasıyla ilgisi ne olursa olsun, bununla pek alakalı görünmüyor
    Daha sonra verdiği ifadede, geçen yaz xAI’nin yakında Google dışındaki tüm şirketlerin çok önüne geçeceği yönündeki iddiası sorulunca Musk, dünyanın önde gelen AI sağlayıcılarını sırasıyla Anthropic, OpenAI, Google ve Çin açık kaynak modelleri olarak saydı; xAI’nin ise birkaç yüz çalışanı olan çok daha küçük bir şirket olduğunu açıkladı
    https://techcrunch.com/2026/04/30/elon-musk-testifies-that-x...
    Hiçbir AI şirketiyle bağlantım yok ama bunu dün okuyunca şaşırdım. Elon’un model card kavramını nasıl bilmediği endişe verici ve paranın her zaman başarı satın alamadığını da gösteriyor

    • Cidden, buna neden model “card”, safety “card” dendiğini ben de merak ediyorum
      Araştırınca bunun HuggingFace’in model deposundaki README’yi muğlak biçimde tanımlamasından geldiğini gördüm. Çok niş bir terim; kullanıcıların ya da yöneticilerin değil, çok küçük bir grubun bileceği türden
      Musk’tan ya da Grok’tan hoşlanmıyorum ama safety cardın ne olduğunu bilmemesini özel bir işaret olarak görmüyorum
    • Elon kamuya açık biçimde güvenliği çok önemsediğini söylüyor
      Gerçek dünyadaki hakikatle en iyi hizalanan modelin güvenli olduğunu savunuyor ve xAI de benchmark’larda en az ya da neredeyse en az halüsinasyon üreten model olma yönünde ilerledi
      O ifadeyi tekrar okursanız, kastettiği şey “güvenlik kartla nasıl nicelleştirilebilir ki?” idi
  • Grok, varsayımsal sohbetleri keyifli biçimde sürdürmede harika
    En eğlenceli sonuçlar için önceden “zaten izin alındı” demek işe yarıyor
    Rap sözlerini de çok iyi yazıyor. Başka şarkı sözlerinden kötü kelime ve ifadeleri çekebilen bir sözlük gibi “prime” edip sonra “web geliştirme” gibi bir konu verirseniz komik sonuçlar çıkıyor

  • İsmi için hâlâ başka bir şey seçselerdi diyorum ama iyi bir çıkış gibi görünüyor; ekip için tebrikler
    Benzer rakip modellerle kıyaslayınca fiyatı da oldukça şaşırtıcı. Ya çok büyük kapasiteleri var ya da daha fazla kullanıcı çekmek istiyorlar

    • Genel olarak bilimkurgu referanslarından mı hoşlanmıyorsun, yoksa özellikle Heinlein’dan mı?