19 puan yazan GN⁺ 2025-11-19 | 3 yorum | WhatsApp'ta paylaş
  • Google, en akıllı yapay zeka modeli Gemini 3'ü tanıttı; geliştirilmiş akıl yürütme ve çok modlu anlama yetenekleri sunuyor
  • Gemini 3 Pro, önceki nesle kıyasla tüm ana benchmark'larda en yüksek performansı gösterirken metin, görsel, video ve kod gibi çeşitli girdileri işliyor
  • Deep Think modu, karmaşık problem çözümü için gelişmiş akıl yürütme yetenekleri ekliyor; Ultra abonelerine kademeli olarak sunulacak
  • Gemini 3, öğrenme, geliştirme ve planlama genelinde destek sağlıyor ve Google Search, Gemini uygulaması, AI Studio, Vertex AI gibi platformlarda kullanılabiliyor
  • Google, Gemini 3 ile akıllı ajanlar ve kişiselleştirilmiş yapay zeka çağına geçişi hızlandırıyor

Gemini 3'e genel bakış

  • Gemini 3, Google tarafından geliştirilen en akıllı yapay zeka modeli olarak, kullanıcıların her türlü fikri hayata geçirmesine yardımcı oluyor
  • Çok modlu anlama ile ajanik kodlama (Agentic Coding) yeteneklerini birleştirerek metin, görsel, video, ses ve kod gibi farklı girdileri entegre şekilde işliyor
  • Gemini 3 Pro, AI Studio, Vertex AI, Gemini uygulaması, Google Antigravity platformu gibi Google ekosisteminin genelinde kullanılabiliyor
  • Deep Think modu, gelişmiş akıl yürütme yetenekleriyle karmaşık problem çözümünü destekliyor ve Google AI Ultra abonelerine sunulacak

CEO mesajı

  • Sundar Pichai, Gemini projesinin başlamasından 2 yıl sonra AI Overviews aylık 2 milyar kullanıcı, Gemini uygulaması 650 milyon kullanıcı ve 130 binden fazla geliştirici katılımı gibi başarıları vurguladı
  • Google'ın tam yığın yapay zeka inovasyon yapısı (altyapı–araştırma–model–ürün), teknolojinin hızla yayılmasını mümkün kılıyor
  • Gemini 3, önceki neslin çok modlu, akıl yürütme ve ajan özelliklerini birleştiren bir model olarak kullanıcının niyetini ve bağlamını daha doğru anlıyor
  • Gemini 3, Search'ün AI Mode'u, Gemini uygulaması, AI Studio, Vertex AI, Google Antigravity gibi alanlarda eş zamanlı olarak kullanıma sunuldu

Gemini 3 Pro performansı

  • Gemini 3 Pro, 2.5 Pro'ya kıyasla tüm ana yapay zeka benchmark'larında üstün performans gösterdi
    • LMArena liderlik tablosunda 1501 Elo, Humanity’s Last Exam'de 37.5%, GPQA Diamond'da 91.9%, MathArena Apex'te 23.4% elde etti
    • Çok modlu benchmark'lar MMMU-Pro'da 81%, Video-MMMU'da 87.6%, SimpleQA Verified'da 72.1% kaydetti
  • Doğru ve özlü yanıtlar veriyor; bilimsel kavramları görselleştirmek veya yaratıcı fikirleri somutlaştırmak için kullanılabiliyor
  • Örnek olarak tokamak içindeki plazma akışını görselleştiren kod üretme ve nükleer füzyon fiziği hakkında şiir yazma yetenekleri gösterildi
Reklam

Gemini 3 Deep Think

  • Deep Think modu, Gemini 3'ün akıl yürütme ve çok modlu anlama yeteneklerini daha da güçlendiriyor
    • Humanity’s Last Exam'de 41.0%, GPQA Diamond'da 93.8%, ARC-AGI-2'de 45.1% ile en üst düzey performans gösterdi
  • Karmaşık problem çözümü ve yeni zorluklar karşısında ileri düzey akıl yürütme yeteneğini ortaya koyuyor

Öğrenin (Learn anything)

  • Gemini 3, 1 milyon token'lık bağlam penceresi ve çok modlu akıl yürütme ile öğrenmeyi destekliyor
    • El yazısı tarifleri çevirip dijital bir yemek kitabı oluşturma
    • Uzun dersleri ve makaleleri özetleyip etkileşimli bilgi kartları veya görselleştirme kodu üretme
    • Spor videolarını analiz ederek kişiselleştirilmiş antrenman planı oluşturma
  • Google Search'teki AI Mode, Gemini 3 tabanlı olarak sürükleyici görsel düzenler ve etkileşimli araçlar gerçek zamanlı üretiyor
Reklam

Geliştirin (Build anything)

  • Gemini 3, zero-shot üretim ve karmaşık prompt işleme konularında güçlü; WebDev Arena'da 1487 Elo elde etti
    • Terminal-Bench 2.0'da 54.2%, SWE-bench Verified'da 76.2% ile araç kullanımı ve kodlama ajanı performansını iyileştirdi
  • Google AI Studio, Vertex AI, Gemini CLI, Google Antigravity üzerinde geliştirme yapılabiliyor
  • Cursor, GitHub, JetBrains, Manus, Replit gibi üçüncü taraf platformlarda da destekleniyor

Google Antigravity: ajan merkezli geliştirme ortamı

  • Google Antigravity, Gemini 3 tabanlı ajanik geliştirme platformu olarak geliştiricilerin yapay zeka ile görev odaklı düzeyde iş birliği yapmasını sağlıyor
  • Ajanlar editör, terminal ve tarayıcıya doğrudan erişerek kod yazma, çalıştırma ve doğrulama işlemlerini otomatik olarak gerçekleştiriyor
  • Gemini 3 Pro ile Gemini 2.5 Computer Use modeli ve Nano Banana görüntü düzenleme modeli entegre edilmiş durumda
  • Örnek olarak bir uçuş takip uygulamasını ajanın kendi başına tasarlayıp kodlayıp doğruladığı bir iş akışı sunuluyor

Planlayın (Plan anything)

  • Gemini 3, uzun vadeli planlama yeteneğini güçlendirerek Vending-Bench 2 liderlik tablosunda 1. sırayı aldı
    • Simüle edilmiş bir otomat işletmesinde 1 yıl boyunca istikrarlı karar alma performansı gösterdi
  • Karmaşık çok adımlı işleri otomatikleştirebiliyor: e-posta düzenleme, hizmet rezervasyonu gibi
  • Ultra aboneleri, Gemini Agent özelliğini Gemini uygulamasında doğrudan deneyebilecek
Reklam

Sorumlu geliştirme

  • Gemini 3, Google yapay zeka modelleri içinde en güvenli model olarak, prompt injection'a direnç ve siber saldırı savunması açısından güçlendirildi
  • Frontier Safety Framework uyarınca iç testler ve dış uzman değerlendirmeleri gerçekleştirildi
    • UK AISI, Apollo, Vaultis, Dreadnode gibi kurumlar katıldı
  • Ayrıntılı güvenlik değerlendirme sonuçları Gemini 3 model kartında paylaşıldı

Gemini 3 çağının başlangıcı

  • Gemini 3, şu kanallar üzerinden dağıtıma çıkmaya başladı
    • Gemini uygulaması ve Search'teki AI Mode
    • AI Studio, Google Antigravity, Gemini CLI üzerinden geliştirici erişimi
    • Vertex AI ve Gemini Enterprise üzerinden kurumsal dağıtım
  • Deep Think modu, ek güvenlik doğrulamalarının ardından Ultra abonelerine sunulacak
  • İleride Gemini 3 serisinin ek modelleri de tanıtılacak; kullanıcı geri bildirimine dayalı genişleme planlanıyor

3 yorum

 
t7vonn 2025-11-19

Gemini kralı, vay beee

 
GN⁺ 2025-11-19
Hacker News görüşleri
  • Eski bir XML tabanlı hesap makinesi uygulamasını Gemini'ye verdim, bir dakikadan kısa sürede tam bir web uygulaması oluşturdu
    Yıllardır özel XML'i Android/Swing uygulamalarına dönüştüren bir derleyiciyi kendim geliştirmiştim ama Gemini bunu format açıklaması olmadan başardı
    Lovable ile denediğimde uygulama düzgün çalışmamış ve sadece kredileri boşa harcamıştı; bu kez ise tamamen farklı bir seviyedeydi
    Sonuç bağlantısı

  • En son Project Euler problemini (#970) Gemini'ye verdim. Eğitim verisinde olma ihtimali düşüktü ama 5 dakika 10 saniye düşündükten sonra doğru cevabı veren Python kodunu üretti
    İnsanlarda en iyi 3 çözüm süresi sırasıyla 14 dakika, 20 dakika ve 1 saat 14 dakikaydı
    Bu tür problemlerin modelin RL ile ayarlandığı alanlardan biri olacağını tahmin ediyordum ama yine de günler sürebilecek bir işi birkaç dakikada çözmesi şaşırtıcıydı

    • Ben de aynı problemi Gemini 3 Pro Preview ile çözmeyi denedim; 4 dakika 31 saniyede sonuç verdi ama yanlıştı
      Web aramasını yasaklamama rağmen stackexchange, youtube vb. 8 adet “kaynak” döndürdü
      Yine de çıkarımlarının çoğu doğruydu ve oldukça faydalı bir araç
      Prompt bağlantısı
    • Eskiden test ettiğim Kattis'in low problemi ile tekrar denedim ve ilk kez bir LLM geçti
      ChatGPT'den bu yana hiçbir model çözememişti; sonunda Gemini 3 başardı
    • Modelin yüksek Elo puanı sadece hızından kaynaklanıyor olabilir
      Ama bu sonuçlara bakınca, 10 yıl içinde bulmacalarda Stockfish seviyesinde bir yapay zeka çıkacak gibi görünüyor
    • Bu arada güncel en son problem Project Euler #970
    • gpt-5.1 thinking ile denedim, gidip cevabı internetten aradı 😅
  • Daha önce Flash 2.5 ile denediğim analog saat widget'ı promptunu Gemini 3 Pro Preview'e verdim ve ilk seferde kusursuz çalışan bir sonuç aldım
    Sonuç bağlantısı

    • Flash 2.5 de fena değildi. Metrik UNIX saati yaptı ve saniyeleri kilosecond olarak gösterdi
      Bir gün 86.4ks ediyor ve şu an yaklaşık 1.76 gigasaniyelik AUNIX zaman damgasındayız. Bir gün bunun 20 fitlik fiziksel bir saatini yapmak istiyorum
    • Saniye kolu 12'ye geldiğinde “wiggle” animasyonu olmadan buna bakamıyorum 😂
    • Bu proje Wes Bos'un 30 Days of JavaScript kursundaki örneklerden biri, yani eğitim verisinde yer almış olma ihtimali yüksek
    • Ben birkaç iyileştirme ekledim ama tik sesi ancak ikinci denemede düzgün oldu
      İyileştirilmiş sürüm bağlantısı
    • Başkasının yazdığı prompt çok daha basitti. Benim eskiden kullandığım sürüm, ${time} değişkenini içeren yalnızca HTML/CSS üretimine yönelikti ve Gemini bunu tamamen mahvetti
      Başarısız örnek bağlantısı
  • Pelican benchmark ile ilgili notlarımı ve yeni yüksek zorluk sürümünü derledim
    Blog yazısı

    • Artık her laboratuvarda bir ‘pelikan sorumlusu’ vardır herhalde. SVG üzerinde bisiklete binen pelikanı daha iyi çizebilmek için gece gündüz eğitim yapıyorlardır
    • Aylardır pelikan eğitmişlerdi, ben benchmark'ı değiştirir değiştirmez hedef de değişmiş oldu 😂
    • “Bisiklete binen pelikan”ın zaten eğitim verisinde bulunuyor olma ihtimali yüksek
    • Doygunluk sorunu olmadığını söylediler ama sonuçlara bakınca büyük laboratuvarlar gizlice pelikan tepesine tırmanıyormuş gibi duruyor
    • Gemini 3'ün bilgi kesim tarihinin Ocak 2025 olması ve 2.5 ile aynı kalması biraz hayal kırıklığı yarattı
      Muhtemelen aynı temel modeli kullanıp sadece RL ayarını iyileştirmiş olabilirler
  • Gemini 3 Pro Preview, benim temel Python benchmark'ımda tamamen başarısız oldu
    Gemini 2.5 Pro biraz daha yakındı ama o da hâlâ yanlıştı
    Buna karşılık gpt-5.1-thinking, Claude Sonnet 4.5 ve Opus 4.1 geçti
    Bu da bana bir kez daha benchmark'ların mutlak ölçüt olmadığını hissettirdi

    • “Benchmark'lar anlamsız” demek abartı. Sınırlamaları var ama hâlâ faydalı göstergeler
      GPT-5 thinking'in başarısız olduğu “temel” Python probleminin ne olduğunu merak ettim
    • Tek bir kişisel benchmark üzerinden sonuç çıkarmak çok güvenilir değil. Paylaşırsan hep birlikte doğrulayabiliriz
    • Ben sık sık “tek bir HTML sayfasında Pac-Man oyunu yap” testini kullanıyorum. Gemini 3 de 2.5 gibi bunda başarısız oldu
    • Benchmark'ın anlamı tasarım kalitesine bağlıdır. Sadece açık olup olmamasına bakarak karar verilemez
    • Google'ın açıkladığı SWEBench skorlarında Gemini 3 Pro, Claude Sonnet 4.5'in altında kalmıştı. Opus 4.5'in daha iyi olup olmadığını da merak ediyorum
  • Tıbbi konular içeren bir problemi ele alırken Gemini 2.5 Pro yaklaşık yarısını doğru yaptı ama Gemini 3.0 bunu kusursuz çözdü
    İlgili düzenlemeleri, araştırmaları ve onay süreçlerini mantıklı biçimde düzenleyerek gerçekten karar vermeye yardımcı oldu
    Böyle modeller insanların hayatını gerçekten değiştirecek gibi görünüyor

  • Google'ın duyuru yazısında “Yapay zeka tarafından oluşturulan özeti oku” düğmesi olması çok komikti
    Bir sonraki adım herhalde “Yapay zekamız sizin yapay zeka özetinizi okusun” olacak
    Sonunda Douglas Adams'ın Electric Monk'u gibi, inanç bile otomasyona bağlanabilir

    • Ben de iş yerinde bir yapay zeka projesine Electric Monk adını vermek istemiştim ama fazla tartışmalı bulunduğu için Electric Mentor olarak değiştirdim
    • Bununla ilgili SMBC çizgi romanı çok yerinde
    • Artık yapay zekanın bulut kesintisi çözümünü bile otomatikleştirmesini isterdim
    • Yalnızca geliştiricileri değil, yöneticilik rollerini bile yapay zeka değiştirebilir gibi görünüyor
  • Benim sevdiğim benchmark, uzun toplantı ses dosyalarını özetleme ve konuşmacı ayrıştırma işi
    Gemini 2.5 özetlemede iyiydi ama konuşmacı ayrıştırması berbattı; 3.0 ise bunu kusursuz yaptı

    • Ben 90 dakikalık bir podcast ile denedim; Gemini 3 halüsinasyon ürünü alıntılar üretti ve zaman damgalarının hepsi yanlıştı
      Uzun seslerde hâlâ sınırları var
    • ElevenLabs veya Soniox gibi özel ses modelleri kullanılırsa çok daha doğru sonuçlar alınabiliyor
    • Hangi promptu kullandığını merak ettim
    • Ben de podcast konuşmacı ayrıştırma projesi geliştiriyorum ve oldukça iyi çalışıyor
    • Parakeet TDT v3 bu tür işler için çok uygun görünüyor
  • Oluşturduğum beş bacaklı köpek fotoğrafı testinde Gemini 3 de başarısız oldu
    Yine de diğer modellerin aksine beşinci bacağı fark etti ama onu başka bir uzuvla karıştırdı
    Görsel algı hâlâ büyük bir sorun

    • Algı (perception), evrimin milyarlarca yıl boyunca incelttiği bir alan olduğu için hesaplama açısından çok daha zor bir problem
    • Muhtemelen bu tür yanlış yorumlar güvenlik filtresinin kör noktalarından kaynaklanıyor olabilir
 
nullptr 2025-11-19

Şu anda Google'ın yayımladığı VSCode OSS çatalı Antigravity'de ( https://antigravity.google/pricing ) ücretsiz olarak kullanılabiliyor.
Bunun dışında, gemini-cli'de şu anda yalnızca AI Ultra'nın (aylık 360 bin won) kullanılabildiği anlaşılıyor.