10 puan yazan xguru 2025-02-19 | 1 yorum | WhatsApp'ta paylaş
  • xAI'nin misyonu evrenin özünü anlamak; bunun için de gerçeği aramayı en yüksek öncelik haline getiren bir yapay zeka olan Grok'u geliştiriyor
  • Grok 3, Grok 2'ye kıyasla 10 kattan fazla gelişmiş performans gösteriyor; bu da seçkin ekibin çabası ve büyük ölçekli hesaplama kaynakları sayesinde mümkün oldu
    • Grok, Heinlein'ın Stranger in a Strange Land adlı romanında Mars'ta büyüyen bir karakterin kullandığı bir sözcük olup "bir şeyi tamamen ve derinlemesine anlamak" anlamına geliyor
    • Empati de önemli bir unsur olarak öne çıkıyor
  • xAI ilk modeline 17 ay önce başladı; Grok 1, 314B (314 milyar) parametreye sahip bir modeldi
    • Ardından Grok 1.5 ve Grok 2 geldi; sonrasında Grok 3'ün geliştirilmesiyle performans sıçramalı biçimde arttı
  • Veri merkezi: xAI, Grok geliştirmesini hızlandırmak için kendi veri merkezini kurdu
    • İlk 100 bin GPU kümesini devreye almak 122 gün sürdü; ardından yalnızca 92 günde kapasite iki katına çıkarıldı (200K)
    • Bu, dünyanın en büyük tam bağlantılı H100 kümesi ve tüm bu GPU'lar ile hesaplama gücü Grok'u iyileştirmek için kullanıldı
  • Grok 3: Grok 2'ye göre 10 kattan fazla geliştirilmiş performans (gerçekte 15 kattan fazla)
    • Ocak başında ön eğitim tamamlandı ve model hâlâ öğrenmeye devam ediyor
  • Benchmark'lar: Grok 3, genel matematiksel akıl yürütme, bilim ve kodlama alanlarında güçlü performans gösteriyor
    • Daha küçük sürüm olan Grok 3 Mini de rakipleriyle aynı seviyede
    • Özellikle lise düzeyi matematik yarışması (AIME) sorularında en üst düzey sonuçlar elde etti
    • En güncel chatbot değerlendirmesi (Chatbot Arena) içinde 1.400'ün üzerinde ELO puanı alarak tüm modeller arasında 1. sıraya yerleşti

Grok 3'ün yeni özellikleri

  • Gelişmiş akıl yürütme (Advanced Reasoning)
    • Grok 3, yalnızca basit yanıtlar üretmek yerine derinlemesine bir düşünme sürecinden geçerek sonuca ulaşma yeteneğine sahip
    • Problemleri analiz etme, hataları bulma ve çeşitli olasılıkları keşfetme becerisi güçlendirildi
    • Gerçek kullanım örnekleri:
      • Mars yolculuğu yörünge hesaplama: Dünya-Mars gidiş-dönüş yörüngesini simüle ederek görsel çıktı üretiyor
      • Yeni oyun geliştirme: Tetris ve Zuma'yı birleştiren yeni bir oyunu anında oluşturuyor
  • Grok 3'ün gerçek zamanlı öğrenme yeteneği
    • Her gün yeni iyileştirmeler yapılıyor ve bir günlük fark bile performans farkı yaratabiliyor
    • Test sürecinde bile model gelişmeye devam ediyor
  • Grok 3 ile mühendislik iyileştirmeleri
    • Grok 3, şirket içinde de kodlama ve problem çözmede yüzlerce saatlik işi kısaltıyor
    • Matematik ve yarışmalı programlama problemlerini çözerken hataları kendi başına tespit edip düzeltme yeteneğini öğreniyor

Yeni nesil özellik: Grok 3 tabanlı ajan

  • Deep Search
    • Yeni bir yapay zeka arama motoru; sıradan arama motorlarına göre daha derin bilgi buluyor
    • Birden çok sitedeki bilgiyi analiz edip en güncel verileri karşılaştırarak en güvenilir yanıtı sunuyor
    • Örnekler:
      • Bir sonraki Starship fırlatma takvimi sorgulama
      • Path of Exile popüler build analizi
      • March Madness basketbol turnuvası şampiyonluk tahmini
  • Yapay zeka sesli asistanı (Voice Assistant)
    • Kullanıcının Grok ile gerçek bir konuşma yapar gibi iletişim kurabilmesini sağlayan özellik eklenecek
    • Grok, yalnızca metni sese dönüştürmekle kalmayıp ses tonu, duygu ve vurgu gibi unsurları dikkate alarak doğal biçimde konuşabilecek

Grok 3 çıkışı ve gelecek planları

  • Yayın takvimi
    • Bugünden itibaren Grok 3'ün beta sürümü Premium+ abonelerine sunuluyor
    • X (eski adıyla Twitter) uygulamasını güncelleyerek yeni özellikler kullanılabiliyor
    • Bağımsız web sitesi grok.com ve özel Grok uygulaması (iOS/Android) yayımlanıyor
  • Yeni abonelik seçeneği: Super Grok
    • En yeni özellikleri hızlıca denemek isteyen kullanıcılar için Super Grok abonelik modeli sunuluyor
  • Gelecek planları
    • Grok 3 API'si yakında çıkacak (birkaç hafta içinde)
    • Grok 3 açık kaynak olarak yayımlanacak (önümüzdeki birkaç ay içinde)
    • Daha güçlü yeni nesil bir küme inşa ediliyor (mevcut sistemin 5 katı performans)
    • Yapay zeka tabanlı oyun geliştirmeye hız vermek için bir yapay zeka oyun stüdyosu kurulacak

Sonuç

  • Grok 3, yapay zeka modellerinde yeni bir boyut açıyor ve xAI bunu daha da ileri taşımak için çalışıyor
  • Güçlü akıl yürütme yeteneği, yapay zeka tabanlı arama motoru ve sesli asistan özellikleriyle Grok giderek daha fazla gerçek bir yapay zeka yardımcısına dönüşüyor
  • Elon Musk, gelecekte yapay zekanın Fields Medal gibi akademik başarılar elde edeceğini öngörüyor

1 yorum

 
GN⁺ 2025-02-19
Hacker News görüşleri
  • Karpathy, Grok hakkındaki ilk izleniminin OpenAI'nin o1-pro seviyesi olduğunu söyledi
  • Grok, bir benchmark'ta en üst seviyeye ulaştı
  • LLM alanındaki rekabetin kızışması tüketiciler için iyi haber
    • Tekel konumundaki şirketlerin tüm değeri emmemesini umuyorum
  • Düşük maliyetle de son teknoloji LLM geliştirilebileceğine dair kanıt var
  • Kayıt altına alınmış sunum ilham verici değildi
    • Yeni bir şey yoktu, zaten bildiğimiz şeylerdi
  • Birçok kişi OpenAI'nin taklit edildiğini düşünüyor
    • OpenAI'nin hâlâ neler yapabildiğini gösterdiğine inanıyorlar
  • xAI'nin hızla arayı kapattığını kabul etmek gerekiyor
    • Yalnızca modelde değil, üründe de öne geçiyor
  • Rekabetçi bir Grok'un en iyi sonucu, ChatGPT'nin kamuoyundaki algısını kırmak olabilir
  • Karpathy bunun o1-pro seviyesinde olduğuna inanıyor
  • OpenAI, teknik bir hendek olmadığını bir kez daha kanıtlıyor
    • Elon'un OpenAI'yi satın alma teklifinin makul olduğunu düşünüyor
  • Elon, Çin'de popüler olduğu için yapay zeka mühendislerini kolayca bulabilir
    • xAI/XSpace/Neurallink hisseleri sunabilir
  • OpenAI'nin değerini 100 milyar doların üzerinde biçen yatırımcılara bol şans
  • Grok 2'nin ağırlıklarını yayımlamayı planlıyor
  • LLM'lerin kişiselleştirilmiş reklamlar eklediği bir gelecek hayal ediyorum