1 puan yazan GN⁺ 2 시간 전 | 1 yorum | WhatsApp'ta paylaş
  • Gemini 3.5 Flash, frontier düzeyinde zekâ ile yürütme yeteneğini birleştiren ilk Gemini 3.5 modeli olarak ajan ve kodlama alanındaki uzun soluklu işleri hedefliyor
  • Flash serisinin hızını korurken Terminal-Bench 2.1'de %76,2, GDPval-AA'da 1656 Elo gibi ölçümlerde Gemini 3.1 Pro'yu geride bırakıyor
  • Çıktı token'ı bazında saniye başına işleme hızı diğer frontier modellerden 4 kat daha hızlı ve maliyeti de çoğu durumda yarıdan daha az olduğundan uzun süreli ajan işlerinde avantaj sağlıyor
  • Antigravity ve AI Studio'da uygulama geliştirme, eski kodun Next.js'e dönüştürülmesi, makaleye dayalı oyun geliştirme ve UX taslakları üretimi gibi çok adımlı işleri yerine getiriyor
  • Gemini uygulaması ve Search AI Mode'un varsayılan modeli olarak sunuluyor; ayrıca Gemini Spark ile kurumsal iş ortaklarının iş akışlarında da kullanılıyor ve 3.5 Pro'nun gelecek ay çıkması planlanıyor

Gemini 3.5'in duyurulması ve sunulacağı alanlar

  • Gemini 3.5, frontier düzeyinde zekâ ile yürütme yeteneğini birleştiren en yeni model ailesi olup daha yetkin ajanlar oluşturmak için konumlandırılıyor
  • İlk yayınlanan model 3.5 Flash; ajan ve kodlama alanında frontier düzeyinde performans sunuyor ve gerçek fayda sağlayan karmaşık, uzun süreli görevlere odaklanıyor
  • 3.5 Flash, çeşitli Google ürünleri ve geliştirici araçları üzerinden sunuluyor
    • Genel kullanıcılara Gemini uygulaması ve Google Search içindeki AI Mode üzerinden ulaştırılıyor
    • Geliştiriciler Google Antigravity, Google AI Studio'daki Gemini API ve Android Studio üzerinden kullanabiliyor
    • Kurumlara Gemini Enterprise Agent Platform ve Gemini Enterprise aracılığıyla sunuluyor
  • 3.5 Pro da geliştiriliyor; hâlihazırda şirket içinde kullanılıyor ve gelecek ay yayınlanması planlanıyor

3.5 Flash'in performansı

  • 3.5 Flash, Flash serisinin hızını korurken birçok boyutta büyük amiral gemisi modellerle rekabet eden bir zekâ sunuyor
  • Google'ın en güçlü ajan odaklı kodlama modeli olarak zor kodlama ve ajan benchmark'larında Gemini 3.1 Pro'yu geride bırakıyor
    • Terminal-Bench 2.1: %76,2
    • GDPval-AA: 1656 Elo
    • MCP Atlas: %83,6
    • CharXiv Reasoning çok modlu anlama: %84,2
  • Çıktı token'ı bazında saniye başına işleme hızı diğer frontier modellerden 4 kat daha hızlı
  • Artificial Analysis metriklerinde sağ üst çeyrekte yer alarak kalite ile gecikme arasındaki ödünleşimi azaltan bir model olarak öne çıkıyor

Büyük ölçekli ajan işleri

  • Hız ve performans dengesi sayesinde 3.5 Flash, uzun süreli ajan işleri için uygun
  • Geliştiricilerin günler, denetçilerin ise haftalar harcadığı işleri daha kısa sürede tamamlamaya yardımcı oluyor ve diğer frontier modellere kıyasla çoğu zaman yarıdan daha düşük maliyetle bunu yapabiliyor
  • Gerçek problem çözme süreçlerinde hızlıca planlama, üretim ve yineleme yapılmasını sağlıyor
    • Yeni uygulama geliştirme
    • Kod tabanı bakımı
    • Finansal belge hazırlığına destek
  • Güncellenmiş Antigravity harness ile birleştirildiğinde, zorlu kullanım senaryolarında iş birliği yapan alt ajanları devreye alarak sorunları büyük ölçekte ele alan bir yürütme motoruna dönüşüyor
  • Gözetim altında çok adımlı iş akışlarını ve kodlama görevlerini güvenilir biçimde yürütürken frontier düzeyinde performansı koruyor

Antigravity ve AI Studio kullanım örnekleri

  • 3.5 Flash, Antigravity'de dinamik ölçütlere göre yapılandırılmamış varlıkları otomatik olarak yeniden adlandıran ve sınıflandıran çok adımlı iş akışlarını çalıştırıyor
  • Antigravity'de iki ajan kullanarak AlphaZero makalesini sentezliyor ve 6 saat içinde tamamen oynanabilir bir oyunu kodluyor
  • Antigravity harness ile karmaşık eski bir kod tabanını Next.js'e dönüştürüyor
  • Antigravity'de alt ajanlar kullanarak yeni bir şehir manzarası üretiyor ve builder ile player ajanlarının hızlı öz-iyileştirme döngüsüyle bir oyun geliştiriyor
  • Gemini 3'ün güçlü çok modlu temeli üzerinde 3.5 Flash, daha zengin ve etkileşimli web arayüzleri ile grafikler üretiyor
    • AI Studio'da yapay zeka araştırma makaleleri için etkileşimli animasyonlar oluşturuyor
    • AI Studio'da düz metin açıklamalarını etkileşimli donanıma dönüştürüyor
    • AI Studio'da bir okul bağış etkinliği için tam bir marka kimliği konsepti oluşturmak üzere birden çok konsepti paralel çalıştırıyor
    • AI Studio'da checkout akışı için farklı UX yaklaşımlarını 60 saniye içinde üretiyor

Kurumsal ve geliştirici kullanımı

  • 3.5 Flash'in ajan yetenekleri geliştirici ve kurumsal iş akışlarında şimdiden kullanılıyor
  • Gemini 3.5 model ailesi geliştirilirken sektör ortaklarıyla birlikte tekrar eden işlerin ve karmaşıklığın ortaya çıktığı noktalar belirlendi
  • İş ortakları, bankacılık ve fintech tarafında haftalara yayılan iş akışlarının otomasyonundan karmaşık veri ortamlarında veri bilimi ekiplerinin içgörü bulmasına kadar çeşitli alanlarda etkisini görüyor
  • Shopify

    • Alt ajanları paralel çalıştırarak uzun vadede karmaşık verileri analiz ediyor ve küresel ölçekte daha doğru satıcı büyüme tahminleri yapıyor
  • Macquarie Bank

    • 100 sayfayı aşan karmaşık belgeler üzerinde akıl yürütme, ilgili bilgileri arama ve düşük gecikmeyle güvenilir öneriler üretme yoluyla müşteri onboarding sürecini hızlandıran bir yaklaşımı pilot olarak deniyor
  • Salesforce

    • 3.5 Flash'i Agentforce ile entegre ederek bağlamı koruyan ve karmaşık çok turlu araç çağrılarını yürüten çok sayıda alt ajan aracılığıyla karmaşık kurumsal işleri otomatikleştiriyor
  • Ramp

    • Karmaşık faturaların çok modlu anlaşılmasını geçmiş örüntüler üzerinde akıl yürütmeyle birleştirerek daha akıllı ve daha güvenilir OCR sağlıyor
  • Xero

    • Tedarikçi tespiti ve 1099 vergi formları için bilgi toplama gibi haftalara yayılan karmaşık iş akışlarını ajanların otonom biçimde yönetmesini sağlayarak küçük işletmelerde tekrarlayan idari işlerin otomasyonunu mümkün kılıyor
  • Databricks

    • Ajan odaklı iş akışları kullanarak gerçek zamanlı bilgileri izliyor ve arıyor, büyük veri kümeleri genelinde akıl yürüterek sorunları teşhis ediyor ve düzeltmeler ile çözümler öneriyor

Kişisel yapay zeka ajanı ve Search uygulamaları

  • 3.5 Flash, dünya genelinde Gemini uygulaması ve Search içindeki AI Mode'un varsayılan modeli oluyor
  • Google I/O'da, 3.5 Flash'in ajan özelliklerini günlük yaşama taşıyan yeni özellikler tanıtıldı
  • Gemini Spark, 3.5 Flash kullanan kişisel bir yapay zeka ajanı
    • Günün 24 saati çalışıyor
    • Kullanıcının talimatlarına göre dijital yaşamı geziniyor ve kullanıcı adına işlem yapıyor
    • Bugünden itibaren güvenilir test kullanıcılarına sunulmaya başlandı
    • ABD'deki Google AI Ultra abonelerine gelecek hafta beta olarak sunulması planlanıyor
  • 3.5 Flash'in gelişmiş ajan odaklı kodlama yetenekleri, Search genelinde daha akıllı deneyimler sunuyor
    • Kullanıcı için 24 saat çalışan yeni bir bilgi ajanı sunuyor
    • Daha dinamik üretken arayüz deneyimlerini mümkün kılıyor
    • Search, 3.5 Flash'i kullanarak Gyroid desenini açıklayan etkileşimli görseller oluşturuyor

Güvenlik önlemleri

  • Gemini 3.5, Frontier Safety Framework doğrultusunda geliştirildi
  • Siber ve CBRN güvenlik önlemleri güçlendirilerek zararlı içerik üretme olasılığı ile güvenli sorgulara yanlış şekilde yanıt vermeyi reddetme olasılığı azaltıldı
  • Yeni ve daha gelişmiş güvenlik eğitimi ile risk azaltma teknikleri uygulandı
  • Yanıt verilmeden önce yapay zekanın iç akıl yürütmesini incelemeye ve anlamaya yardımcı olan yorumlanabilirlik aracı içeriliyor

1 yorum

 
GN⁺ 2 시간 전
Hacker News görüşleri
  • Pelikan oldukça makul görünüyor: https://github.com/simonw/llm-gemini/issues/133#issuecomment...
    Ama bisiklet pek iyi değil. Pedal ile arka tekerlek arasındaki çubuğu atlamışlar, diğer kadro parçaları da garip biçimde birbirine dolanmış
    Maliyeti de pahalı. O pelikanın teki 13 sent tuttu: https://www.llm-prices.com/#it=11&ot=14403&sel=gemini-3.5-fl...

    • O pelikan, kripto konferansı için Miami'ye gelmiş gibi görünüyor
    • Bu, büyük dil modellerindeki ilerlemede hissettiğim şeyi kusursuz biçimde gösteriyor. Böyle bir SVG iyileştirmesi istendiğinde eksik çapraz çubuğu ya da kopuk uzuvları düzeltmek yerine, sadece daha fazla öğe ekliyor
      Bu örnek de bariz şekilde çok daha iyi ve detay seviyesi absürt derecede yüksek, ama temel kadro şekli hâlâ yanlış. Web sayfasında da denerseniz aynı desen çıkıyor; düğme gibi şeyleri daha da çoğaltıyor
      Bozuk pelikan SVG'sini bir görüntü modeline verip kusurları bulmasını da denedim, ama bozuk parçaları yine tespit edemedi
    • Chainstay'i atlamak, birine bisiklet çizmesini söylediğinizde sık görülen bir sonuç
      https://www.gianlucagimini.it/portfolio-item/velocipedia/

      çoğu kişi, normal bir erkek bisikletinden oldukça uzak bir şey çizdi

    • Google'a özgü, havalı olmayan ama gençler için hâlâ alakalı görünmeye çalışan o havayı epey iyi yakalamış gibi
    • O güneş, OS müzesiyle ilgili diğer üst sıralardaki HN gönderisinin arka planındaki güneşe çok benziyor: https://news.ycombinator.com/item?id=48195009
  • Girdi/çıktı için milyon token başına fiyat:
    Gemini 2.5 Flash: $0.30/$2.50
    Gemini 3.0 Flash Preview: $0.50/$3.00
    Gemini 3.5 Flash: $1.50/$9.00
    Fiyat yönü ilginç. Aynı boyuttaki bir sonraki modelde 3 kat fiyat artışı gördüğümü sanmıyorum, bir de 3'ün yalnızca Preview olması komik
    3.5 Flash, $1.25/$10 olan Gemini 2.5 Pro ile benzer maliyette

    • Bu, maliyet artışını küçümsüyor. 3.5 Flash aynı zamanda daha fazla token kullanıyor. artificialanalysis.ai ölçütüne göre tam değerlendirmeyi çalıştırma maliyet farkı daha gerçekçi görünüyor:
      Gemini 2.5 Flash(27 puan): $172(1.0x)
      Gemini 2.5 Pro(35 puan): $649(3.8x)
      Gemini 3.0 Flash(46 puan): $278(1.6x)
      Gemini 3.5 Flash(55 puan): $1,552(9.0x, ya da 2.5 Pro'ya göre 2.4x)
      Bu devasa bir fiyat artışı. Gemini 3.0 Flash ile karşılaştırınca 5.6 kat ediyor
    • Muhtemelen baştan beri ucuz modelleri sürdürmek gibi bir niyetleri yoktu. API'nin üstüne hizmet kuranlar ortaya çıktıktan sonra baskı uygulamaya başlamak doğal bir yöntem
      Bu yüzden sağlayıcıya bağımlı olmayan bir soyutlama katmanı kurmak gerçekten mantıklı. Kotlin kullanıyorsanız Koog harika
    • Bir DeepSeek anı daha lazım. Yoksa sıradan insanların AI kullanması zorlaşacak ve sadece büyük şirketlerin karşılayabildiği bir şeye dönüşecek
    • Google TPU'lar sayesinde çıkarımı gerçekten herkesten daha ucuza çalıştırabiliyorsa, bu bana bir tehlike işareti gibi geliyor. Belki de büyük dil modellerini kâr ederek sunmak zor olduğu ortaya çıkıyordur
      Ya da benchmark'ları iyi olduğu için fiyat artırabileceklerini düşünüyor olabilirler. Ama henüz bunu haklı çıkaracak kadar pazar payları varmış gibi görünmüyor
    • 3.5 Flash Preview değil de Stable olarak işaretlenmiş değil mi? Ben mi yanlış okuyorum?
      https://ai.google.dev/gemini-api/docs/models/gemini-3.5-flas...
  • Google'ın bu modeli Preview değil Stable olarak işaretlemiş olması dikkat çekici. Son dönemdeki yayın akışıyla karşılaştırınca sıra dışı
    Buna bir de 3 kat fiyat artışı eklenince, Flash fiyatı daha sonra geri alınacak geçici bir önlemden çok Google'ın istediği uzun vadeli taban gibi okunuyor
    Yine de bunun yalnızca Google'ın ortamı okumasından mı kaynaklandığını, yoksa sektörün genelinin sessizce ucuz çıkarım için çıtayı yeniden mi belirlediğini söylemek şimdilik zor

  • Create animated SVG of a frog on a boat rowing through jungle river. Single page self contained HTML page with SVG
    3.5 Flash: Thinking Medium - 7516 tokens
    https://gistpreview.github.io/?5c9858fd2057e678b55d563d9bff0...
    3.5 Flash: Thinking High - 7280 tokens
    https://gistpreview.github.io/?1cab3d70064349d08cf5952cdc165...
    3.1 Pro - 28,258 tokens
    https://gistpreview.github.io/?6bf3da2f80487608b9525bce53018...
    3.1 üretim için 3 dakika düşündü ama animasyon hareketini düzgün ekleyen tek modeldi

  • Biri "Flash" dediğinde aklıma hemen "onun yerine HTML5'i düşünün" geliyorsa gerçekten yaşlanmış mıyım?

    • Flash kültürünü bu kadar eğlenceli yapan unsurların neredeyse hiçbiri HTML5'e geçmedi
    • Flash tasarımcısı gerçekten çok iyiydi. Web'in bir ölçüde geriye götürdüğü şeylerden biri, 90'lar ve 2000'lerin RAD araçları oldu
    • Gençler!
      Flash, ah, ah, saviour of the universe. Flash, ah, ah, he'll save every one of us!
      Kaç yıldır sürdüğünü bile bilmeyecek kadar uzun zamandır, "flash" kelimesini her duyduğumda bunu düşünüyorum
  • Bilgi kesim tarihi: Ocak 2025
    Son güncelleme: Mayıs 2026
    Bu gecikme bana oldukça uğursuz hissettiriyor

    • En azından bazı durumlarda daha fazla sentetik veri ve sıkı biçimde seçilmiş verilerle eğitime gidiliyor gibi görünüyor. Özellikle küçük modeller, onlarca ya da yüzlerce GB'lık model ağırlıklarının içine dünyanın tamamını sığdıramadığı için bilgi kapsamını aşırı genişletemiyor
      Bu yüzden daha yüksek kaliteli akıl yürütme elde etmek için eğitimi odaklamak gerekiyor; veri de çok yüksek kaliteli ve çok yoğun olmalı
      Araç kullanımı güçlüyse modelin eski veriler kullanması o kadar önemli olmayabilir. Çünkü güncel bilgiyi arayabilir. Ama şu anda çoğu model, biraz yönlendirme olmadan bunu yapmıyor
      Bildiğim kadarıyla Qwen 3 ailesi, aynı temel modelden başlayıp çeşitli metrikleri iyileştirmek için yalnızca fine-tuning / sonradan eğitim yaptı. Gemini 3 ailesi de tamamen aynı olabilir ve belki de şu anda Gemini 4 tabanlı modelleri güncel bilgiyle eşzamanlı eğitiyorlardır
    • Gerçekler model ağırlıklarından çekilmemeli. Dayanak gerçek veri kaynakları olmalı
    • Bunun ne anlama geldiğini açıklayabilir misin?
    • Ben bunun Google'ın bilinçli tercihi olduğunu sanıyordum
  • google ai pro plan kullanıyorum ve Antigravity'de 3.5 Flash denedim; iki prompt'ta kotam tükendi. Hata değilse gerçekten kullanılamaz düzeyde

    • Dün ya da önceki gün Google, AI Pro kotasını standart kullanımın 33 katından 4 katına düşürdü
      Gemini subreddit'indeki havaya bakılırsa eskisine göre çok daha sert düşmüş gibi. Ben de muhtemelen AI Pro'yu iptal edeceğim
      Bu güncellemeyle uygulama da bozuldu. Mesajı düzenlediğimde uygulama her seferinde çöküyor. Hem de Pixel'de kullanıyor olmama rağmen
  • Gemini 3.5 Flash'ın 2000 token saati fena değil. https://clocks.brianmoore.com/

  • Neredeyse aynı model için 3 kat fiyat artışı. Hani AI ucuzlayacak ve her yerde olacak deniyordu

    • Her yere yayılacak derken belki crack modası gibi yayılmasını kastediyorlardı
    • Benchmark'lara inanırsanız bunu 3.1 Pro'nun dörtte üç fiyatı olarak da görebilirsiniz
  • Fiyatlandırma saçmalık
    Gemini 3.5 Pro'nun da fiyatı birlikte artacak gibi. 12 x 5 = 60?
    Google sanki bizim Çin modelleri kullanmamızı istiyor