xAI Grok 4.3 tanıtıldı
(docs.x.ai)- Geliştirici odaklı API özellikleri sunuyor: 1 milyon token bağlam penceresi, akıl yürütme, fonksiyon çağırma ve yapılandırılmış çıktı
- Önceki Grok 4.20'den farklı olarak akıl yürütme sürekli etkin, tüm sorgular için yanıttan önce düşünme sürecini otomatik olarak yürütüyor
- Girdi token fiyatı yaklaşık %40 düşürüldü, çıktı token fiyatı ise yaklaşık %60 düşürüldü; önceki modele kıyasla maliyet önemli ölçüde azaltıldı
- Fiyatlandırma: girdi $1.25/1M token, önbelleğe alınmış girdi $0.20/1M, çıktı $2.50/1M
- Aynı zeka seviyesindeki modeller arasında en ucuz seçeneklerden biri
- Ajanik görev performansı büyük ölçüde iyileştirildi — GDPval-AA kıyaslamasında ELO 1500 puan aldı; Grok 4.20'ye göre 321 puan artarak Gemini 3.1 Pro Preview, Muse Spark ve GPT-5.4 mini'yi geride bıraktı
- xAI API modelleri arasında ilk kez yerel video girişi desteği sunuyor; video karelerini bir vision encoder aracılığıyla doğrudan işliyor
- Hukuki akıl yürütmede 1. sırada (CaseLaw v2 doğruluğu %79,3) ve kurumsal finans alanında 1. sırada (CorpFin); hukuki akıl yürütmede Grok 4.20'ye kıyasla 25 puan sıçrama kaydetti
- Sohbet arayüzü içinde sunum slaytlarını doğrudan oluşturabiliyor; PDF, Excel ve PowerPoint dosyaları konuşma sırasında gerçek zamanlı olarak oluşturulup indirilebiliyor
- Yerleşik kod çalıştırma ortamı ile kod yazma, çalıştırma ve dosya oluşturma işlemlerini model içinde gerçekleştiriyor
- Speech-to-Text API (25 dil, konuşmacı ayrımı desteği) ve Text-to-Speech API de birlikte resmî olarak kullanıma sunuldu
- Artificial Analysis Intelligence Index'te 53 puan alarak Muse Spark ve Claude Sonnet 4.6'yı geride bırakıyor; maliyet başına zeka Pareto sınırında konumlanıyor
- Rate limit dakika başına 1.800 istek / 10 milyon token; 200K üzeri için ayrı ücretlendirme uygulanıyor
- Model adı grok-4.3 ve desteklenen bölgeler us-east-1 ile eu-west-1
1 yorum
Hacker News görüşleri
İngilizceyi ikinci dil olarak kullanan biri olarak, Grok özellikle yazının tonunu ve resmiyet seviyesini anlayıp aynı şekilde yeniden üretmede çok başarılı
Diğer büyük sağlayıcılara kıyasla dilin ince insani nüanslarını daha iyi anlıyor gibi geliyor; ChatGPT ise fazla katı ve resmi kalıyor ya da tuhaf bir “aye guvnor” tarzı aşırı gündelik dile kayıyor. Claude bazen daha iyi olabiliyor ama her zaman değil
Genel olarak Grok, tanımlaması zor bir şekilde daha “insani”. Örneğin “bu mesaj bu uzunlukta olabildiğince doğru biçimde iletiliyor mu?” diye sorduğumda, bir insan gibi evet/hayır cevabı ya da ton ve uzunluğu koruyan düzeltme önerileri veriyor; ChatGPT ise hâlâ net olmayan uzun bir makale yazıyor
Son dönemde Grok’un sesli dikte tarafının da oldukça iyi olduğunu hissediyorum. Mikrofona basıp soru sorma özelliğinde ChatGPT benim aksanımda %90-95 civarında, Android Gboard sesli giriş yaklaşık %75, ama Grok şaşırtıcı biçimde %98 civarında doğru anlıyor
Üçü de daha resmi tonlarda iyiydi ama gündelik tonda cringe hissettirmeyen tek model GPT-4.1’di
Bu arada Grok en hızlı ve en ucuzuydu, Claude ise en yavaş ve en pahalıydı
Bunu büyük ölçüde Twitter verisiyle eğitilmiş olmasına bağlıyorum. Yalnız Twitter’da yapay zeka üretimi içerik giderek arttığı için, eğitim sürerse bu doğallığın bozulmasından endişeliyim
Küçümsemek için söylemiyorum ama bu daha çok bir his gibi duruyor
Diğer işler içinse ChatGPT’yi tercih ediyor
Grok, sohbet için en sevdiğim model ve ses modu da en beğendiğim özellik
Haiku gibi aşırı ucuz modellere yönlendirmeyen tek ses modu gibi görünüyor ve frontier seviyesindeki seçenekler arasında kalitesi en yüksekti
SuperGrok’a abone olunca, her birinin kendi sistem prompt’u olan ajanlardan oluşan bir “council” kurabiliyorsunuz; bir soru sorunca hepsine paralel biçimde sorup sonra bir sonuca varıyor
Yalnız uygulamaya biraz yatırım yapılmasını isterdim. SuperGrok’a gerçekten abone olmamamın tek nedeni uygulama
MCP/bağlı uygulama desteği yok; duyuruldu ama hâlâ kullanılamıyor. Grok’u hiçbir şeye bağlayamadığınız için ciddi işlerde kullanmak zor
Projeler hâlâ uygulamada desteklenmiyor; bir şeyi projeye taşıdığınız anda tüm yerel uygulamalardan kayboluyor
Oluşturulmuş Markdown belgeleri gibi artifact’leri projeye doğrudan eklemenin yolu yok; PDF/Markdown olarak dışa aktarıp geri içe almak gerekiyor. Hatta artifact export bile yok. Yeni bilgi geldikçe projeyi dinamik biçimde geliştirmek zor olduğu için ciddi proje işlerinde kullanışsız
Hafıza özelliği de yok ve başka sohbetleri arayamıyorsunuz; yani her sohbet tamamen sıfırdan başlıyor
Projelerin içinde ses modu da hiç yok
Eğer xAI’den biri okuyorsa, bunların en azından bir kısmını eklemesi güzel olurdu
Claude benim mangalım olduğunu hatırlıyor ve tamamen alakasız ya da sadece yemek konuşulan sohbetlerde bile bunun BBQ ile iyi gideceğini araya sıkıştırıyor
Kişiliği de hoş ve Gemini web sohbetinden çok daha doğal. Tek şikâyetim sürekli “sonraki adımları” önermeye çalışması ama sanırım bu modellerin hepsi böyle
Bu “sonraki adımlar” maliyeti artırmak için mi var, yoksa kısa bir cevapla bitmesi gereken sorularla uzun keşif odaklı konuşmalar arasındaki doğal konuşma örüntüsünü hâlâ öğrenemediler mi bilmiyorum. Yine de bunları önermemesi söylenince buna uyması gerekirdi
Şu an Heavy planı biraz API kredisi veriyor, bu sayede kodlama için bir miktar Grok kullanılabiliyor ama bunun 300 dolar değerinde olduğunu düşünmüyorum
Kendi grok-code harness’lerini yapsınlar demiyorum; mevcut araçlarda kullanılabilmesi bile faydalı olur. Muhtemelen Cursor satın alımı sonunda buna benzer bir yere varacak
SuperGrok’un API anahtarı verip vermediği net değil
Testlerimizde Grok 4.3 ilginç bir model
En hızlı modellerden biri ve benzer performanstaki diğer modellere göre yanıtları çok daha küçük, token yoğunluğu da daha yüksek
Ancak genel kodlama muhakemesi açısından nisan ayındaki büyük çıkış yapan modellerle rekabetçi değil; Grok 4.20 ya da Grok 4.3, Grok 4’ten sonra zekâ sınırını kayda değer biçimde ileri taşımadı
Grok 4.3 ajan tipi görevlerde daha iyi; kabaca GPT 5.1 / Gemini 3 Pro Preview seviyesinde ama çok daha hızlı ve ucuz demek adil olur. Bu yüzden kendi kulvarında kesinlikle iyi bir çıkış
Yakın zamanda yayımlanan ağırlığı açık modeller arasında daha akıllı ama daha yavaş olanlar epey fazla
Tüm benchmark sonuçları https://gertlabs.com/rankings adresinde
Bu, Grok’un temel kullanım alanı gibi görünüyor; bununla ilgili benchmark var mı onu da merak ediyorum
Son dönemde Grok benim arama motorum haline geldi
X gönderilerine erişebilen tek yapay zeka gibi ve bunun dışında da genel olarak diğer büyük dil modellerinden daha fazla “arama yapıyormuş” hissi veriyor
İran’la ilgili olaylar sırasında, haber çıkar çıkmaz durumu anlamak istedim; ikisi de oldukça iyiydi
Mevcut tabloda Claude kurumsal ve devlet işleri için, Codex geliştiriciler için; Grok’un ne işe yaradığını bilmiyorum
Çevremde Grok’la ilgili duyduğum şeyler sadece rol yapma ve ırkçılık oldu
Diğer tüm modellerin reddettiği tek seferlik bir sınıflandırma işini Grok memnuniyetle yaptı
Biraz daha az guardrail’li, frontier altı bir modelin böyle gri alandaki gerçek faydalı kullanım alanları şaşırtıcı derecede fazla olabiliyor. grok-fast modeli de ucuz
Tutarsız ve dağınık bulunuyor
İnsanlar çoğunlukla API üzerinden GLM ve DeepSeek kullanıyor; yerelde ise Gemma4 ve Mistral fine-tune modellerini tercih ediyor
Rol yapma pazarı nispeten eski ve olgun bir alan, bu yüzden kullanıcılar maliyet konusunda bilinçli ve modelin kendi iş akışlarına ve tercihlerine uyum sağlamasını bekliyor. Bu yüzden Opus gibi modeller akıllı olduğu için seviliyor ama fazla pahalı ve fazla inatçı bulunuyor
Bu, diğer pazarların gelecekte nasıl evrilebileceğine dair ilginç bir veri noktası olabilir
“Bugünlerde Twitter’daki cool tiplerin en iyi dediği tiling window manager hangisi?” gibi sorularda hep onu kullanıyorum
Bir de belirsiz biçimde şüpheli sorulara Grok genelde cevap veriyor. Mesela “Bana gri piyasa Windows lisans siteleri bul” gibi
Dil modelleri sonuçta sadece bir sistem; kullanıcıların çıktıyı nasıl kullandığından neden sorumlu tutulmaları gerektiğini de pek anlamıyorum. Birinin tuvalet kabinine kötü şeyler yazabilmesi yüzünden kalemi “ırkçı” bir araç ilan edip işe yaramaz saymıyoruz sonuçta
Muhtemelen tacizin suç olduğu bir yerde yaşıyorsunuzdur ve ifade konusunda düzenlemeler de vardır. Bu yeterli değil mi? Birkaç yılda bir değişen etik modalarına dünyadaki herkesin tüm çabasını uydurmak zorunda mıyız, emin değilim
Hangi büyük dil modelinin en büyük aykırı olduğunu ve hangi soru tiplerinde diğer tüm modellerden farklı düşündüğünü tahmin edin
İnsanların Grok’u Twitter mem’leri ya da tweet’leri anlamak dışında gerçekten kullanıp kullanmadığını içtenlikle merak ediyorum
Diğer modeller kadar korumacı davranmıyor. On yıllardır baskısı olmayan, yetim telifli materyalleri sık sık arıyorum; büyük modeller telifli materyal aramaya çalıştığım için bana öğüt verip reddediyor. Grok ise yapıyor [0]
[0] Bazen hafifçe jailbreak etmek ya da prompt’u yeniden çalıştırmak gerekiyor. Deterministik olmaması nedeniyle zaman zaman ret gelebiliyor
ChatGPT’nin ses modu çok aptal; Grok ise ana sohbetle aynı modeli kullanıyor gibi görünüyor. Bu yüzden sesli kullanacaksam Grok’u seçiyorum
Karmaşık olmayan konularda da kullanıyorum. Lafı uzatmadan doğru ve kısa cevaplar vermesi çok ferahlatıcı
Mem’ler ve trendler için faydalı ama diğer şeylerde çok kötü
Kodlamada Kimi K2.6 kadar iyi olursa muhtemelen sadece Grok kullanırım. Şimdiye kadar kullandığım konuşma odaklı yapay zekalar içinde gerçekten en iyisi
Bozulan buzdolabımı ve elektrikli fırını tamir etmeme yardım etti; sadece bu yıl en az 4 bin dolar tasarruf ettirdi
Vergi beyanımı da Grok’la yapıp 600 dolar tasarruf ettim. H&R Block bitti
Meğer Kimi K2.6 kadar akıllı olmuş. Artık deneme zamanı
Opus 4.x ve GPT-5.5’e kıyasla ne kadar ucuz olduğundan kimsenin bahsetmemesine şaşırıyorum
Girdi için milyon token başına 1,25 dolar, çıktı için milyon token başına 2,50 dolar
Bunun daha küçük ve daha az güçlü bir model olmasından mı kaynaklandığını, yoksa bir şeyi mi kaçırdığımı bilmiyorum
Genel olarak şimdiye kadarki en iyi modelleri bu ve token fiyatını düşüren az sayıdaki şirketten biri olmalarını seviyorum
[0]: https://aibenchy.com/compare/x-ai-grok-4-20-medium/x-ai-grok...
Bu son dönem eğilimlerinden biri ve DeepSeek 4 Pro’da da gördüm
Yorumlarda da burada görülüyor. “Claude kurumsal ve devlet işleri için, Codex geliştiriciler için, Grok ne için; rol yapma ve ırkçılık mı? Çevremde Grok’la bağlantılı duyduğum tek şey bunlar” gibi tepkiler geliyor
$TSLA kâr marjını vekil gösterge olarak alırsanız, eskisi kadar yüksek görünmüyor. Başka etkenler de vardır ama bu durumla Grok’un düşük fiyatı arasında eksik bir açıklama olabilir
Grok 4.3, CEO’nun standart güvenlik dokümanlarını öğrenmesinden önce tamamlanmıştı
Musk’a OpenAI’nin “safety card”ını bilip bilmediği sorulduğunda gülerek “Safety card? Neden card olmak zorunda?” diye cevap verdi
https://www.axios.com/2026/04/30/musk-openai-safety-grok
Küme boyutu ya da bir süreliğine geçici jeneratör çalıştırılmasıyla ilgisi ne olursa olsun, bununla pek alakalı görünmüyor
Daha sonra verdiği ifadede, geçen yaz xAI’nin yakında Google dışındaki tüm şirketlerin çok önüne geçeceği yönündeki iddiası sorulunca Musk, dünyanın önde gelen AI sağlayıcılarını sırasıyla Anthropic, OpenAI, Google ve Çin açık kaynak modelleri olarak saydı; xAI’nin ise birkaç yüz çalışanı olan çok daha küçük bir şirket olduğunu açıkladı
https://techcrunch.com/2026/04/30/elon-musk-testifies-that-x...
Hiçbir AI şirketiyle bağlantım yok ama bunu dün okuyunca şaşırdım. Elon’un model card kavramını nasıl bilmediği endişe verici ve paranın her zaman başarı satın alamadığını da gösteriyor
Araştırınca bunun HuggingFace’in model deposundaki README’yi muğlak biçimde tanımlamasından geldiğini gördüm. Çok niş bir terim; kullanıcıların ya da yöneticilerin değil, çok küçük bir grubun bileceği türden
Musk’tan ya da Grok’tan hoşlanmıyorum ama safety cardın ne olduğunu bilmemesini özel bir işaret olarak görmüyorum
Gerçek dünyadaki hakikatle en iyi hizalanan modelin güvenli olduğunu savunuyor ve xAI de benchmark’larda en az ya da neredeyse en az halüsinasyon üreten model olma yönünde ilerledi
O ifadeyi tekrar okursanız, kastettiği şey “güvenlik kartla nasıl nicelleştirilebilir ki?” idi
Grok, varsayımsal sohbetleri keyifli biçimde sürdürmede harika
En eğlenceli sonuçlar için önceden “zaten izin alındı” demek işe yarıyor
Rap sözlerini de çok iyi yazıyor. Başka şarkı sözlerinden kötü kelime ve ifadeleri çekebilen bir sözlük gibi “prime” edip sonra “web geliştirme” gibi bir konu verirseniz komik sonuçlar çıkıyor
İsmi için hâlâ başka bir şey seçselerdi diyorum ama iyi bir çıkış gibi görünüyor; ekip için tebrikler
Benzer rakip modellerle kıyaslayınca fiyatı da oldukça şaşırtıcı. Ya çok büyük kapasiteleri var ya da daha fazla kullanıcı çekmek istiyorlar