Gemini 3 - Google'ın en yeni Gemini yapay zeka modeli tanıtıldı

(blog.google)

19 puan yazan GN⁺ 2025-11-19 | 3 yorum | WhatsApp'ta paylaş

Google, en akıllı yapay zeka modeli Gemini 3'ü tanıttı; geliştirilmiş akıl yürütme ve çok modlu anlama yetenekleri sunuyor
Gemini 3 Pro, önceki nesle kıyasla tüm ana benchmark'larda en yüksek performansı gösterirken metin, görsel, video ve kod gibi çeşitli girdileri işliyor
Deep Think modu, karmaşık problem çözümü için gelişmiş akıl yürütme yetenekleri ekliyor; Ultra abonelerine kademeli olarak sunulacak
Gemini 3, öğrenme, geliştirme ve planlama genelinde destek sağlıyor ve Google Search, Gemini uygulaması, AI Studio, Vertex AI gibi platformlarda kullanılabiliyor
Google, Gemini 3 ile akıllı ajanlar ve kişiselleştirilmiş yapay zeka çağına geçişi hızlandırıyor

Gemini 3'e genel bakış

Gemini 3, Google tarafından geliştirilen en akıllı yapay zeka modeli olarak, kullanıcıların her türlü fikri hayata geçirmesine yardımcı oluyor
Çok modlu anlama ile ajanik kodlama (Agentic Coding) yeteneklerini birleştirerek metin, görsel, video, ses ve kod gibi farklı girdileri entegre şekilde işliyor
Gemini 3 Pro, AI Studio, Vertex AI, Gemini uygulaması, Google Antigravity platformu gibi Google ekosisteminin genelinde kullanılabiliyor
Deep Think modu, gelişmiş akıl yürütme yetenekleriyle karmaşık problem çözümünü destekliyor ve Google AI Ultra abonelerine sunulacak

CEO mesajı

Sundar Pichai, Gemini projesinin başlamasından 2 yıl sonra AI Overviews aylık 2 milyar kullanıcı, Gemini uygulaması 650 milyon kullanıcı ve 130 binden fazla geliştirici katılımı gibi başarıları vurguladı
Google'ın tam yığın yapay zeka inovasyon yapısı (altyapı–araştırma–model–ürün), teknolojinin hızla yayılmasını mümkün kılıyor
Gemini 3, önceki neslin çok modlu, akıl yürütme ve ajan özelliklerini birleştiren bir model olarak kullanıcının niyetini ve bağlamını daha doğru anlıyor
Gemini 3, Search'ün AI Mode'u, Gemini uygulaması, AI Studio, Vertex AI, Google Antigravity gibi alanlarda eş zamanlı olarak kullanıma sunuldu

Gemini 3 Pro performansı

Gemini 3 Pro, 2.5 Pro'ya kıyasla tüm ana yapay zeka benchmark'larında üstün performans gösterdi
- LMArena liderlik tablosunda 1501 Elo, Humanity’s Last Exam'de 37.5%, GPQA Diamond'da 91.9%, MathArena Apex'te 23.4% elde etti
- Çok modlu benchmark'lar MMMU-Pro'da 81%, Video-MMMU'da 87.6%, SimpleQA Verified'da 72.1% kaydetti
Doğru ve özlü yanıtlar veriyor; bilimsel kavramları görselleştirmek veya yaratıcı fikirleri somutlaştırmak için kullanılabiliyor
Örnek olarak tokamak içindeki plazma akışını görselleştiren kod üretme ve nükleer füzyon fiziği hakkında şiir yazma yetenekleri gösterildi

Gemini 3 Deep Think

Deep Think modu, Gemini 3'ün akıl yürütme ve çok modlu anlama yeteneklerini daha da güçlendiriyor
- Humanity’s Last Exam'de 41.0%, GPQA Diamond'da 93.8%, ARC-AGI-2'de 45.1% ile en üst düzey performans gösterdi
Karmaşık problem çözümü ve yeni zorluklar karşısında ileri düzey akıl yürütme yeteneğini ortaya koyuyor

Öğrenin (Learn anything)

Gemini 3, 1 milyon token'lık bağlam penceresi ve çok modlu akıl yürütme ile öğrenmeyi destekliyor
- El yazısı tarifleri çevirip dijital bir yemek kitabı oluşturma
- Uzun dersleri ve makaleleri özetleyip etkileşimli bilgi kartları veya görselleştirme kodu üretme
- Spor videolarını analiz ederek kişiselleştirilmiş antrenman planı oluşturma
Google Search'teki AI Mode, Gemini 3 tabanlı olarak sürükleyici görsel düzenler ve etkileşimli araçlar gerçek zamanlı üretiyor

Geliştirin (Build anything)

Gemini 3, zero-shot üretim ve karmaşık prompt işleme konularında güçlü; WebDev Arena'da 1487 Elo elde etti
- Terminal-Bench 2.0'da 54.2%, SWE-bench Verified'da 76.2% ile araç kullanımı ve kodlama ajanı performansını iyileştirdi
Google AI Studio, Vertex AI, Gemini CLI, Google Antigravity üzerinde geliştirme yapılabiliyor
Cursor, GitHub, JetBrains, Manus, Replit gibi üçüncü taraf platformlarda da destekleniyor

Google Antigravity: ajan merkezli geliştirme ortamı

Google Antigravity, Gemini 3 tabanlı ajanik geliştirme platformu olarak geliştiricilerin yapay zeka ile görev odaklı düzeyde iş birliği yapmasını sağlıyor
Ajanlar editör, terminal ve tarayıcıya doğrudan erişerek kod yazma, çalıştırma ve doğrulama işlemlerini otomatik olarak gerçekleştiriyor
Gemini 3 Pro ile Gemini 2.5 Computer Use modeli ve Nano Banana görüntü düzenleme modeli entegre edilmiş durumda
Örnek olarak bir uçuş takip uygulamasını ajanın kendi başına tasarlayıp kodlayıp doğruladığı bir iş akışı sunuluyor

Planlayın (Plan anything)

Gemini 3, uzun vadeli planlama yeteneğini güçlendirerek Vending-Bench 2 liderlik tablosunda 1. sırayı aldı
- Simüle edilmiş bir otomat işletmesinde 1 yıl boyunca istikrarlı karar alma performansı gösterdi
Karmaşık çok adımlı işleri otomatikleştirebiliyor: e-posta düzenleme, hizmet rezervasyonu gibi
Ultra aboneleri, Gemini Agent özelliğini Gemini uygulamasında doğrudan deneyebilecek

Sorumlu geliştirme

Gemini 3, Google yapay zeka modelleri içinde en güvenli model olarak, prompt injection'a direnç ve siber saldırı savunması açısından güçlendirildi
Frontier Safety Framework uyarınca iç testler ve dış uzman değerlendirmeleri gerçekleştirildi
- UK AISI, Apollo, Vaultis, Dreadnode gibi kurumlar katıldı
Ayrıntılı güvenlik değerlendirme sonuçları Gemini 3 model kartında paylaşıldı

Gemini 3 çağının başlangıcı

Gemini 3, şu kanallar üzerinden dağıtıma çıkmaya başladı
- Gemini uygulaması ve Search'teki AI Mode
- AI Studio, Google Antigravity, Gemini CLI üzerinden geliştirici erişimi
- Vertex AI ve Gemini Enterprise üzerinden kurumsal dağıtım
Deep Think modu, ek güvenlik doğrulamalarının ardından Ultra abonelerine sunulacak
İleride Gemini 3 serisinin ek modelleri de tanıtılacak; kullanıcı geri bildirimine dayalı genişleme planlanıyor

3 yorum

t7vonn 2025-11-19

Gemini kralı, vay beee

GN⁺ 2025-11-19

Hacker News görüşleri

Eski bir XML tabanlı hesap makinesi uygulamasını Gemini'ye verdim, bir dakikadan kısa sürede tam bir web uygulaması oluşturdu
Yıllardır özel XML'i Android/Swing uygulamalarına dönüştüren bir derleyiciyi kendim geliştirmiştim ama Gemini bunu format açıklaması olmadan başardı
Lovable ile denediğimde uygulama düzgün çalışmamış ve sadece kredileri boşa harcamıştı; bu kez ise tamamen farklı bir seviyedeydi
Sonuç bağlantısı
En son Project Euler problemini (#970) Gemini'ye verdim. Eğitim verisinde olma ihtimali düşüktü ama 5 dakika 10 saniye düşündükten sonra doğru cevabı veren Python kodunu üretti
İnsanlarda en iyi 3 çözüm süresi sırasıyla 14 dakika, 20 dakika ve 1 saat 14 dakikaydı
Bu tür problemlerin modelin RL ile ayarlandığı alanlardan biri olacağını tahmin ediyordum ama yine de günler sürebilecek bir işi birkaç dakikada çözmesi şaşırtıcıydı
- Ben de aynı problemi Gemini 3 Pro Preview ile çözmeyi denedim; 4 dakika 31 saniyede sonuç verdi ama yanlıştı
  Web aramasını yasaklamama rağmen stackexchange, youtube vb. 8 adet “kaynak” döndürdü
  Yine de çıkarımlarının çoğu doğruydu ve oldukça faydalı bir araç
  Prompt bağlantısı
- Eskiden test ettiğim Kattis'in low problemi ile tekrar denedim ve ilk kez bir LLM geçti
  ChatGPT'den bu yana hiçbir model çözememişti; sonunda Gemini 3 başardı
- Modelin yüksek Elo puanı sadece hızından kaynaklanıyor olabilir
  Ama bu sonuçlara bakınca, 10 yıl içinde bulmacalarda Stockfish seviyesinde bir yapay zeka çıkacak gibi görünüyor
- Bu arada güncel en son problem Project Euler #970
- gpt-5.1 thinking ile denedim, gidip cevabı internetten aradı 😅
Daha önce Flash 2.5 ile denediğim analog saat widget'ı promptunu Gemini 3 Pro Preview'e verdim ve ilk seferde kusursuz çalışan bir sonuç aldım
Sonuç bağlantısı
- Flash 2.5 de fena değildi. Metrik UNIX saati yaptı ve saniyeleri kilosecond olarak gösterdi
  Bir gün 86.4ks ediyor ve şu an yaklaşık 1.76 gigasaniyelik AUNIX zaman damgasındayız. Bir gün bunun 20 fitlik fiziksel bir saatini yapmak istiyorum
- Saniye kolu 12'ye geldiğinde “wiggle” animasyonu olmadan buna bakamıyorum 😂
- Bu proje Wes Bos'un 30 Days of JavaScript kursundaki örneklerden biri, yani eğitim verisinde yer almış olma ihtimali yüksek
- Ben birkaç iyileştirme ekledim ama tik sesi ancak ikinci denemede düzgün oldu
  İyileştirilmiş sürüm bağlantısı
- Başkasının yazdığı prompt çok daha basitti. Benim eskiden kullandığım sürüm, ${time} değişkenini içeren yalnızca HTML/CSS üretimine yönelikti ve Gemini bunu tamamen mahvetti
  Başarısız örnek bağlantısı
Pelican benchmark ile ilgili notlarımı ve yeni yüksek zorluk sürümünü derledim
Blog yazısı
- Artık her laboratuvarda bir ‘pelikan sorumlusu’ vardır herhalde. SVG üzerinde bisiklete binen pelikanı daha iyi çizebilmek için gece gündüz eğitim yapıyorlardır
- Aylardır pelikan eğitmişlerdi, ben benchmark'ı değiştirir değiştirmez hedef de değişmiş oldu 😂
- “Bisiklete binen pelikan”ın zaten eğitim verisinde bulunuyor olma ihtimali yüksek
- Doygunluk sorunu olmadığını söylediler ama sonuçlara bakınca büyük laboratuvarlar gizlice pelikan tepesine tırmanıyormuş gibi duruyor
- Gemini 3'ün bilgi kesim tarihinin Ocak 2025 olması ve 2.5 ile aynı kalması biraz hayal kırıklığı yarattı
  Muhtemelen aynı temel modeli kullanıp sadece RL ayarını iyileştirmiş olabilirler
Gemini 3 Pro Preview, benim temel Python benchmark'ımda tamamen başarısız oldu
Gemini 2.5 Pro biraz daha yakındı ama o da hâlâ yanlıştı
Buna karşılık gpt-5.1-thinking, Claude Sonnet 4.5 ve Opus 4.1 geçti
Bu da bana bir kez daha benchmark'ların mutlak ölçüt olmadığını hissettirdi
- “Benchmark'lar anlamsız” demek abartı. Sınırlamaları var ama hâlâ faydalı göstergeler
  GPT-5 thinking'in başarısız olduğu “temel” Python probleminin ne olduğunu merak ettim
- Tek bir kişisel benchmark üzerinden sonuç çıkarmak çok güvenilir değil. Paylaşırsan hep birlikte doğrulayabiliriz
- Ben sık sık “tek bir HTML sayfasında Pac-Man oyunu yap” testini kullanıyorum. Gemini 3 de 2.5 gibi bunda başarısız oldu
- Benchmark'ın anlamı tasarım kalitesine bağlıdır. Sadece açık olup olmamasına bakarak karar verilemez
- Google'ın açıkladığı SWEBench skorlarında Gemini 3 Pro, Claude Sonnet 4.5'in altında kalmıştı. Opus 4.5'in daha iyi olup olmadığını da merak ediyorum
Tıbbi konular içeren bir problemi ele alırken Gemini 2.5 Pro yaklaşık yarısını doğru yaptı ama Gemini 3.0 bunu kusursuz çözdü
İlgili düzenlemeleri, araştırmaları ve onay süreçlerini mantıklı biçimde düzenleyerek gerçekten karar vermeye yardımcı oldu
Böyle modeller insanların hayatını gerçekten değiştirecek gibi görünüyor
Google'ın duyuru yazısında “Yapay zeka tarafından oluşturulan özeti oku” düğmesi olması çok komikti
Bir sonraki adım herhalde “Yapay zekamız sizin yapay zeka özetinizi okusun” olacak
Sonunda Douglas Adams'ın Electric Monk'u gibi, inanç bile otomasyona bağlanabilir
- Ben de iş yerinde bir yapay zeka projesine Electric Monk adını vermek istemiştim ama fazla tartışmalı bulunduğu için Electric Mentor olarak değiştirdim
- Bununla ilgili SMBC çizgi romanı çok yerinde
- Artık yapay zekanın bulut kesintisi çözümünü bile otomatikleştirmesini isterdim
- Yalnızca geliştiricileri değil, yöneticilik rollerini bile yapay zeka değiştirebilir gibi görünüyor
Benim sevdiğim benchmark, uzun toplantı ses dosyalarını özetleme ve konuşmacı ayrıştırma işi
Gemini 2.5 özetlemede iyiydi ama konuşmacı ayrıştırması berbattı; 3.0 ise bunu kusursuz yaptı
- Ben 90 dakikalık bir podcast ile denedim; Gemini 3 halüsinasyon ürünü alıntılar üretti ve zaman damgalarının hepsi yanlıştı
  Uzun seslerde hâlâ sınırları var
- ElevenLabs veya Soniox gibi özel ses modelleri kullanılırsa çok daha doğru sonuçlar alınabiliyor
- Hangi promptu kullandığını merak ettim
- Ben de podcast konuşmacı ayrıştırma projesi geliştiriyorum ve oldukça iyi çalışıyor
- Parakeet TDT v3 bu tür işler için çok uygun görünüyor
Oluşturduğum beş bacaklı köpek fotoğrafı testinde Gemini 3 de başarısız oldu
Yine de diğer modellerin aksine beşinci bacağı fark etti ama onu başka bir uzuvla karıştırdı
Görsel algı hâlâ büyük bir sorun
- Algı (perception), evrimin milyarlarca yıl boyunca incelttiği bir alan olduğu için hesaplama açısından çok daha zor bir problem
- Muhtemelen bu tür yanlış yorumlar güvenlik filtresinin kör noktalarından kaynaklanıyor olabilir

nullptr 2025-11-19

Şu anda Google'ın yayımladığı VSCode OSS çatalı Antigravity'de ( https://antigravity.google/pricing ) ücretsiz olarak kullanılabiliyor.
Bunun dışında, gemini-cli'de şu anda yalnızca AI Ultra'nın (aylık 360 bin won) kullanılabildiği anlaşılıyor.