- Google, en akıllı yapay zeka modeli Gemini 3'ü tanıttı; geliştirilmiş akıl yürütme ve çok modlu anlama yetenekleri sunuyor
- Gemini 3 Pro, önceki nesle kıyasla tüm ana benchmark'larda en yüksek performansı gösterirken metin, görsel, video ve kod gibi çeşitli girdileri işliyor
- Deep Think modu, karmaşık problem çözümü için gelişmiş akıl yürütme yetenekleri ekliyor; Ultra abonelerine kademeli olarak sunulacak
- Gemini 3, öğrenme, geliştirme ve planlama genelinde destek sağlıyor ve Google Search, Gemini uygulaması, AI Studio, Vertex AI gibi platformlarda kullanılabiliyor
- Google, Gemini 3 ile akıllı ajanlar ve kişiselleştirilmiş yapay zeka çağına geçişi hızlandırıyor
Gemini 3'e genel bakış
- Gemini 3, Google tarafından geliştirilen en akıllı yapay zeka modeli olarak, kullanıcıların her türlü fikri hayata geçirmesine yardımcı oluyor
- Çok modlu anlama ile ajanik kodlama (Agentic Coding) yeteneklerini birleştirerek metin, görsel, video, ses ve kod gibi farklı girdileri entegre şekilde işliyor
- Gemini 3 Pro, AI Studio, Vertex AI, Gemini uygulaması, Google Antigravity platformu gibi Google ekosisteminin genelinde kullanılabiliyor
- Deep Think modu, gelişmiş akıl yürütme yetenekleriyle karmaşık problem çözümünü destekliyor ve Google AI Ultra abonelerine sunulacak
CEO mesajı
- Sundar Pichai, Gemini projesinin başlamasından 2 yıl sonra AI Overviews aylık 2 milyar kullanıcı, Gemini uygulaması 650 milyon kullanıcı ve 130 binden fazla geliştirici katılımı gibi başarıları vurguladı
- Google'ın tam yığın yapay zeka inovasyon yapısı (altyapı–araştırma–model–ürün), teknolojinin hızla yayılmasını mümkün kılıyor
- Gemini 3, önceki neslin çok modlu, akıl yürütme ve ajan özelliklerini birleştiren bir model olarak kullanıcının niyetini ve bağlamını daha doğru anlıyor
- Gemini 3, Search'ün AI Mode'u, Gemini uygulaması, AI Studio, Vertex AI, Google Antigravity gibi alanlarda eş zamanlı olarak kullanıma sunuldu
Gemini 3 Pro performansı
- Gemini 3 Pro, 2.5 Pro'ya kıyasla tüm ana yapay zeka benchmark'larında üstün performans gösterdi
- LMArena liderlik tablosunda 1501 Elo, Humanity’s Last Exam'de 37.5%, GPQA Diamond'da 91.9%, MathArena Apex'te 23.4% elde etti
- Çok modlu benchmark'lar MMMU-Pro'da 81%, Video-MMMU'da 87.6%, SimpleQA Verified'da 72.1% kaydetti
- Doğru ve özlü yanıtlar veriyor; bilimsel kavramları görselleştirmek veya yaratıcı fikirleri somutlaştırmak için kullanılabiliyor
- Örnek olarak tokamak içindeki plazma akışını görselleştiren kod üretme ve nükleer füzyon fiziği hakkında şiir yazma yetenekleri gösterildi
Gemini 3 Deep Think
- Deep Think modu, Gemini 3'ün akıl yürütme ve çok modlu anlama yeteneklerini daha da güçlendiriyor
- Humanity’s Last Exam'de 41.0%, GPQA Diamond'da 93.8%, ARC-AGI-2'de 45.1% ile en üst düzey performans gösterdi
- Karmaşık problem çözümü ve yeni zorluklar karşısında ileri düzey akıl yürütme yeteneğini ortaya koyuyor
Öğrenin (Learn anything)
- Gemini 3, 1 milyon token'lık bağlam penceresi ve çok modlu akıl yürütme ile öğrenmeyi destekliyor
- El yazısı tarifleri çevirip dijital bir yemek kitabı oluşturma
- Uzun dersleri ve makaleleri özetleyip etkileşimli bilgi kartları veya görselleştirme kodu üretme
- Spor videolarını analiz ederek kişiselleştirilmiş antrenman planı oluşturma
- Google Search'teki AI Mode, Gemini 3 tabanlı olarak sürükleyici görsel düzenler ve etkileşimli araçlar gerçek zamanlı üretiyor
Geliştirin (Build anything)
- Gemini 3, zero-shot üretim ve karmaşık prompt işleme konularında güçlü; WebDev Arena'da 1487 Elo elde etti
- Terminal-Bench 2.0'da 54.2%, SWE-bench Verified'da 76.2% ile araç kullanımı ve kodlama ajanı performansını iyileştirdi
- Google AI Studio, Vertex AI, Gemini CLI, Google Antigravity üzerinde geliştirme yapılabiliyor
- Cursor, GitHub, JetBrains, Manus, Replit gibi üçüncü taraf platformlarda da destekleniyor
Google Antigravity: ajan merkezli geliştirme ortamı
- Google Antigravity, Gemini 3 tabanlı ajanik geliştirme platformu olarak geliştiricilerin yapay zeka ile görev odaklı düzeyde iş birliği yapmasını sağlıyor
- Ajanlar editör, terminal ve tarayıcıya doğrudan erişerek kod yazma, çalıştırma ve doğrulama işlemlerini otomatik olarak gerçekleştiriyor
- Gemini 3 Pro ile Gemini 2.5 Computer Use modeli ve Nano Banana görüntü düzenleme modeli entegre edilmiş durumda
- Örnek olarak bir uçuş takip uygulamasını ajanın kendi başına tasarlayıp kodlayıp doğruladığı bir iş akışı sunuluyor
Planlayın (Plan anything)
- Gemini 3, uzun vadeli planlama yeteneğini güçlendirerek Vending-Bench 2 liderlik tablosunda 1. sırayı aldı
- Simüle edilmiş bir otomat işletmesinde 1 yıl boyunca istikrarlı karar alma performansı gösterdi
- Karmaşık çok adımlı işleri otomatikleştirebiliyor: e-posta düzenleme, hizmet rezervasyonu gibi
- Ultra aboneleri, Gemini Agent özelliğini Gemini uygulamasında doğrudan deneyebilecek
Sorumlu geliştirme
- Gemini 3, Google yapay zeka modelleri içinde en güvenli model olarak, prompt injection'a direnç ve siber saldırı savunması açısından güçlendirildi
- Frontier Safety Framework uyarınca iç testler ve dış uzman değerlendirmeleri gerçekleştirildi
- UK AISI, Apollo, Vaultis, Dreadnode gibi kurumlar katıldı
- Ayrıntılı güvenlik değerlendirme sonuçları Gemini 3 model kartında paylaşıldı
Gemini 3 çağının başlangıcı
- Gemini 3, şu kanallar üzerinden dağıtıma çıkmaya başladı
- Gemini uygulaması ve Search'teki AI Mode
- AI Studio, Google Antigravity, Gemini CLI üzerinden geliştirici erişimi
- Vertex AI ve Gemini Enterprise üzerinden kurumsal dağıtım
- Deep Think modu, ek güvenlik doğrulamalarının ardından Ultra abonelerine sunulacak
- İleride Gemini 3 serisinin ek modelleri de tanıtılacak; kullanıcı geri bildirimine dayalı genişleme planlanıyor
3 yorum
Gemini kralı, vay beee
Hacker News görüşleri
Eski bir XML tabanlı hesap makinesi uygulamasını Gemini'ye verdim, bir dakikadan kısa sürede tam bir web uygulaması oluşturdu
Yıllardır özel XML'i Android/Swing uygulamalarına dönüştüren bir derleyiciyi kendim geliştirmiştim ama Gemini bunu format açıklaması olmadan başardı
Lovable ile denediğimde uygulama düzgün çalışmamış ve sadece kredileri boşa harcamıştı; bu kez ise tamamen farklı bir seviyedeydi
Sonuç bağlantısı
En son Project Euler problemini (#970) Gemini'ye verdim. Eğitim verisinde olma ihtimali düşüktü ama 5 dakika 10 saniye düşündükten sonra doğru cevabı veren Python kodunu üretti
İnsanlarda en iyi 3 çözüm süresi sırasıyla 14 dakika, 20 dakika ve 1 saat 14 dakikaydı
Bu tür problemlerin modelin RL ile ayarlandığı alanlardan biri olacağını tahmin ediyordum ama yine de günler sürebilecek bir işi birkaç dakikada çözmesi şaşırtıcıydı
Web aramasını yasaklamama rağmen stackexchange, youtube vb. 8 adet “kaynak” döndürdü
Yine de çıkarımlarının çoğu doğruydu ve oldukça faydalı bir araç
Prompt bağlantısı
ChatGPT'den bu yana hiçbir model çözememişti; sonunda Gemini 3 başardı
Ama bu sonuçlara bakınca, 10 yıl içinde bulmacalarda Stockfish seviyesinde bir yapay zeka çıkacak gibi görünüyor
Daha önce Flash 2.5 ile denediğim analog saat widget'ı promptunu Gemini 3 Pro Preview'e verdim ve ilk seferde kusursuz çalışan bir sonuç aldım
Sonuç bağlantısı
Bir gün 86.4ks ediyor ve şu an yaklaşık 1.76 gigasaniyelik AUNIX zaman damgasındayız. Bir gün bunun 20 fitlik fiziksel bir saatini yapmak istiyorum
İyileştirilmiş sürüm bağlantısı
${time}değişkenini içeren yalnızca HTML/CSS üretimine yönelikti ve Gemini bunu tamamen mahvettiBaşarısız örnek bağlantısı
Pelican benchmark ile ilgili notlarımı ve yeni yüksek zorluk sürümünü derledim
Blog yazısı
Muhtemelen aynı temel modeli kullanıp sadece RL ayarını iyileştirmiş olabilirler
Gemini 3 Pro Preview, benim temel Python benchmark'ımda tamamen başarısız oldu
Gemini 2.5 Pro biraz daha yakındı ama o da hâlâ yanlıştı
Buna karşılık gpt-5.1-thinking, Claude Sonnet 4.5 ve Opus 4.1 geçti
Bu da bana bir kez daha benchmark'ların mutlak ölçüt olmadığını hissettirdi
GPT-5 thinking'in başarısız olduğu “temel” Python probleminin ne olduğunu merak ettim
Tıbbi konular içeren bir problemi ele alırken Gemini 2.5 Pro yaklaşık yarısını doğru yaptı ama Gemini 3.0 bunu kusursuz çözdü
İlgili düzenlemeleri, araştırmaları ve onay süreçlerini mantıklı biçimde düzenleyerek gerçekten karar vermeye yardımcı oldu
Böyle modeller insanların hayatını gerçekten değiştirecek gibi görünüyor
Google'ın duyuru yazısında “Yapay zeka tarafından oluşturulan özeti oku” düğmesi olması çok komikti
Bir sonraki adım herhalde “Yapay zekamız sizin yapay zeka özetinizi okusun” olacak
Sonunda Douglas Adams'ın Electric Monk'u gibi, inanç bile otomasyona bağlanabilir
Benim sevdiğim benchmark, uzun toplantı ses dosyalarını özetleme ve konuşmacı ayrıştırma işi
Gemini 2.5 özetlemede iyiydi ama konuşmacı ayrıştırması berbattı; 3.0 ise bunu kusursuz yaptı
Uzun seslerde hâlâ sınırları var
Oluşturduğum beş bacaklı köpek fotoğrafı testinde Gemini 3 de başarısız oldu
Yine de diğer modellerin aksine beşinci bacağı fark etti ama onu başka bir uzuvla karıştırdı
Görsel algı hâlâ büyük bir sorun
Şu anda Google'ın yayımladığı VSCode OSS çatalı Antigravity'de ( https://antigravity.google/pricing ) ücretsiz olarak kullanılabiliyor.
Bunun dışında, gemini-cli'de şu anda yalnızca AI Ultra'nın (aylık 360 bin won) kullanılabildiği anlaşılıyor.