- Gemini 2.5 Deep Think özelliği, Google AI Ultra abonelerine özel olarak Gemini uygulamasına dahil edildi
- Yeni paralel düşünme (parallel thinking) tekniği ve araştırma bulgularıyla güncellenerek, IMO’da altın madalya kazanan bir modele dayanıp gerçek kullanıma daha uygun hâle getirildi
- Yaratıcı problem çözme, matematiksel ve bilimsel akıl yürütme, algoritma geliştirme gibi çeşitli karmaşık görevlerde üstün performans gösteriyor
- Performansı artırmak için çıkarım süresi (Thinking Time) uzatılıyor; farklı fikir ve çözümleri aynı anda keşfederek daha derin düşünce ve daha yaratıcı sonuçlar üretiyor
- Güvenlik ve sorumlu yapay zeka geliştirme için, geliştirilmiş değerlendirme ve önlem süreçleri uygulanıyor; ayrıca API ve kurumsal kullanımın genişletilmesi planı duyuruluyor
Gemini 2.5 Deep Think yayını
- Gemini 2.5 Deep Think özelliği, Google AI Ultra abonelerine Gemini uygulaması üzerinden sunuluyor
- Güvenilir test kullanıcıları ve araştırmacıların geri bildirimleriyle, en güncel araştırma sonuçlarıyla güncellenmiş bir sürüm
- Son uluslararası matematik olimpiyatı (IMO) için altın madalya düzeyinde bir modele dayalı olarak, gerçek kullanıcı deneyimine uyacak şekilde hız ve pratiklik iyileştirildi
- Bu duyuru ile yaratıcılığı artıran bir problem çözme aracı olarak potansiyeli genişletirken, matematikçiler ve araştırmacılardan gelen geri bildirime göre işlevler daha da olgunlaştırılacak
Deep Think'in çalışma prensibi
- Paralel düşünme tekniği kullanılarak Gemini, karmaşık bir probleme ilişkin çeşitli fikir ve çözümleri aynı anda arayıp karşılaştırıp birleştirebiliyor
- Modelin çıkarım süresi (Thinking Time) uzatılıyor; böylece birçok hipotez daha derinlemesine incelenip daha yaratıcı çözümler bulunabiliyor
- Güçlendirilmiş öğrenme ile bu genişletilmiş akıl yürütme yolları aktif biçimde kullanılacak şekilde eğitiliyor, daha sezgisel ve derin bir problem çözme becerisi güçlendiriliyor
Deep Think'in temel performans ve kullanım alanları
- Aşamalı geliştirme ve tasarım: karmaşık sistemleri veya tasarımları adım adım geliştirme çalışmalarında yüksek performans sergiliyor
- Bilimsel ve matematiksel keşif: matematiksel akıl yürütme veya bilimsel makale yorumlama gibi yüksek zorluklu yaratıcı keşiflerde güçlüdür
- Algoritma ve kod geliştirme: problemin yapılandırılması, zaman karmaşıklığı ve ödünleşimleri hesaba katılması gereken zorlu kodlama problemlerinde en gelişmiş performans elde ediyor
- LiveCodeBench V6 ve Humanity’s Last Exam gibi son benchmarklarda, önceki modellerle karşılaştırıldığında en yüksek düzeyde kod/bilgi/akıl yürütme performansı sunduğu kanıtlandı
Gemini'nin sorumlu geliştirme ve güvenliği
- Gemini 2.5 Deep Think, güvenlik değerlendirmelerinde önceki Pro modeline göre geliştirilmiş içerik güvenliği ve nesnel ton gösteriyor
- Karmaşıklık arttıkça risk de birlikte ölçülüyor; Frontier Safety değerlendirmeleri ve gerekli karşı önlemler güçlendiriliyor
- Ayrıntılı güvenlik sonuçları model kartında görüntülenebilir
Deep Think'in kullanımı
- Google AI Ultra aboneleri, Gemini uygulamasında model açılır menüsünden 2.5 Pro'yu seçip istem çubuğundaki Deep Think geçişini açarak, günde belirlenen sayıda kullanım hakkını tüketebiliyor
- Kod çalıştırma, Google arama gibi araçlarla otomatik entegre oluyor ve çok daha uzun yanıtlar üretebiliyor
- Yakın zamanda Gemini API ve kurumsal için ek testler de yapılacak
1 yorum
Hacker News görüşleri
Yeni çıkan Deep Think agent’ını denedim, ama daha beş prompt girer girmez günlük kullanım limitine ulaştım. Ayda $250 ödeyip böyle bir hizmet almak biraz hayal kırıklığı yaratıyor. o3-pro ya da Grok 4 Heavy’ye kıyasla fiyat/performans açısından belirgin biçimde geride kalıyor. Yapay zeka topluluğunda bu özellik, Google Ultra abonelik ücretini bir nebze olsun haklı çıkarabilecek tek unsur olarak ilgi görüyordu. Ama Google bir yandan AI Studio’da en iyi modelini ücretsiz sunarken, gerçekten para ödeyen Ultra abonelerine böyle bir ücretlendirme politikası uyguluyorsa bunu anlamak çok zor. Performans tarafında ise, işle ilgili zor bir senaryo verdiğimde net ve ikna edici bir çözüm sundu; hatta bu çözüm şirket içi toplantıda vardığımız sonuçla da örtüşüyordu. Ama sonuçta o3 de çok daha düşük bir fiyata benzer bir sonuca ulaştı. Sadece o3’ün raporu biraz daha dağınık görünüyordu. Biraz daha kullanmadan kesin bir şey söylemek zor
Millet, Gemini Deep Think’e “bisiklete binen bir pelikanın SVG görselini çiz” diye prompt verdim ve ortaya bu çıktı https://www.svgviewer.dev/s/5R5iTexQ Simon Willison’dan önce denedim!
Kendiniz denemek isterseniz simonw’nin LLM cli’ını ve llm-consortium eklentisini kullanabilirsinizAvantaj 1: Birden fazla modeli istediğiniz gibi birleştirip kullanabiliyorsunuz. Laboratuvardan bağımsız olarak istediğiniz kombinasyonu kurabiliyorsunuzAvantaj 2: llm-model-gateway eklentisini kullanarak hepsini tek seferde yerel API üzerinden uygulamanıza ya da kodlama işbirliği araçlarınıza bağlayabiliyorsunuz https://x.com/karpathy/status/1870692546969735361
Kurulumu ve örnek komutları, hatta consortium of consortium da yapılabileceğine dair örneği bile doğrudan yazmış.
https://GitHub.com/irthomasthomas/llm-consortium
llm servekomutunu göremediğini belirtmişBirkaç hafta önce IMO’da altın madalya alan model bu değil ama ona çok yakın bir akraba gibi https://x.com/OfficialLoganK/status/1951262261512659430Henüz API üzerinden sunulmuyor
Bu yaklaşım Grok 4 Heavy’ye benziyor: birden fazla ‘reasoning’ agent’ını paralel çalıştırıp sonra yanıtları karşılaştırarak en iyi cevabı seçiyor ve toplamda yaklaşık 30 dakika sürüyor. Sonuçlar etkileyici, ama aslında Grok 4’e (tek agent, daha hızlı model) değil Grok 4 Heavy’ye karşı benchmark yapmak daha adil olur
OpenAI fiyatı $200’a, Anthropic $100 ve $200’e, Gemini $250’ye, Grok ise $300’e kadar çıkardı. Sadece OpenAI “fiilen sınırsız” dedi ve ChatGPT Pro planında gerçekten hiç limite takılmadım. Claude Max tarafında ise birkaç kez sınıra çarptım. Bu şirketlerin limitleri neden açıkça paylaşmadığını merak ediyorum
Son birkaç aydır Gemini kullanırken, aksine giderek kötüleştiğini hissediyorum. Hallucination çok sık oluyor ve bunu gösterdiğinizde bile yapay zeka diretmekten vazgeçmiyor. Güvenmek zorlaşıyor
Google AI Ultra abonesiyseniz bugünden itibaren Gemini uygulamasında Deep Think’i (sabit sayıda prompt ile) kullanabileceğiniz söyleniyor. Ama “sabit set” ifadesinin sabit bir sayı mı yoksa önceden tanımlanmış prompt türleri mi anlamına geldiğini daha net öğrenmek istiyorum
Gemini CLI ile planlama yaparken, açıkça defalarca kendi kendine beklenmedik işler yapmamasını söyleyip müdahale etsem bile hâlâ keyfi değişiklikler yapmaya çalışıp planı bozduğu oluyor