11 puan yazan GN⁺ 2025-11-21 | 1 yorum | WhatsApp'ta paylaş
  • Nano Banana Pro, Gemini 3 Pro tabanlı Google DeepMind'in en yeni görüntü üretme ve düzenleme modeli olup görsel fikirleri hassas biçimde hayata geçirme yeteneği sunuyor
  • Metin oluşturma kalitesindeki iyileşme ve çok dilli destek sayesinde poster, mockup, infografik gibi işlerde okunması kolay ifadeler doğrudan görsele eklenebiliyor
  • En fazla 14 görseli birleştirme, 5 kişide karakter tutarlılığını koruma, 2K~4K çözünürlük desteği gibi özelliklerle yüksek kaliteli görsel içerik üretimini destekliyor
  • Google Ads, Workspace, Gemini uygulaması, AI Studio gibi çeşitli Google ürünlerine entegre edilerek tüketiciler, profesyoneller ve geliştiriciler tarafından kullanılabiliyor
  • SynthID filigranı, yapay zeka ile üretilen görsellerde şeffaflığı sağlarken AI içerik tanımlama özelliği de doğrudan Gemini uygulamasında sunuluyor

Nano Banana Pro'ya genel bakış

  • Nano Banana Pro, Gemini 3 Pro'nun akıl yürütme yeteneği ve dünya bilgisini kullanarak görsel bilgiyi ayrıntılı biçimde görselleştiren bir model
    • Önceki sürüm olan Nano Banana (Gemini 2.5 Flash Image) sonrasında çıkan yükseltilmiş sürüm
    • Fikir geliştirme, veri görselleştirme, el yazısı notları diyagrama dönüştürme gibi çeşitli tasarım işlerini destekliyor

Başlıca özellikler

  • Doğru ve bağlam açısından zengin görseller üretme
    • Gemini 3'ün gelişmiş akıl yürütme yetenekleri sayesinde eğitim amaçlı infografikler, diyagramlar gibi olgu temelli içerikler üretebiliyor
    • Google Search'ün gerçek zamanlı bilgileriyle entegre çalışarak hava durumu, spor, tarifler gibi canlı verileri görselleştirebiliyor
  • Çok dilli metin üretimi
    • Görsel içindeki metni doğru ve kolay okunur biçimde sunuyor, ayrıca birden fazla dile çeviri ve yerelleştirme yapabiliyor
    • Çeşitli font, doku ve tipografi stilleri kullanarak poster veya marka içerikleri üretimine uygun
    Reklam
  • Yüksek kaliteli görsel ifade
    • En fazla 14 görseli birleştirme ve 5 kişide karakter tutarlılığını koruma ile karmaşık kompozit görseller oluşturabiliyor
    • Yerel düzenleme, kamera açısı ayarı, renk düzeltme, ışık geçişi gibi ince düzenleme kontrolleri sunuyor
    • 2K ve 4K çözünürlük ile çeşitli en-boy oranlarını destekleyerek hem baskı hem dijital platformlara uyum sağlıyor

Kullanım ortamları

  • Tüketiciler ve öğrenciler için
    • Gemini uygulamasındaki 'Create images' özelliğinde Nano Banana Pro kullanılabiliyor
    • Ücretsiz kullanıcılar sınırlı üretim kotasının ardından temel Nano Banana'ya geçiyor
    • Google AI Plus, Pro ve Ultra aboneleri daha yüksek üretim limitlerine sahip oluyor
  • Profesyoneller için
    • Google Ads içindeki görsel üretme özelliği Nano Banana Pro'ya yükseltildi
    • Google Workspace içindeki Slides ve Vids'de de kullanılabiliyor
  • Geliştiriciler ve kurumlar için
    • Gemini API, Google AI Studio, Vertex AI, Antigravity, Gemini Enterprise gibi platformlarda genişletilmiş destek sunuluyor
  • İçerik üreticileri için
    • Flow aracı üzerinden video üreticileri ve pazarlamacılar sahne bazında ayrıntılı kontrol sağlayabiliyor
    Reklam

Yapay zeka ile üretilen görsellerin tanımlanması ve şeffaflık

  • Nano Banana Pro ile üretilen tüm görsellere kaynak tespiti için SynthID dijital filigranı ekleniyor
    • Gemini uygulamasında görsel yükleyerek bunun “Google AI ile üretilip üretilmediği” doğrudan kontrol edilebiliyor
    • Ücretsiz ve Pro kullanıcılarının görsellerine görünür filigran (Gemini sparkle) de ekleniyor
    • Ultra aboneleri ve AI Studio geliştirici araçları için filigransız temiz tuval sunuluyor
  • SynthID'nin gelecekte ses ve video içeriklerine de genişletilmesi planlanıyor

İlgili materyaller

  • Build with Nano Banana Pro: geliştiriciler için Gemini 3 Pro Image modelinin tanıtımı
  • Prompting Tips for Nano Banana Pro: etkili prompt yazımı rehberi
  • AI Image Verification in Gemini App: SynthID tabanlı görsel doğrulama özelliğinin açıklaması

Orijinal metinde ek bilgi yok

1 yorum

 
GN⁺ 2025-11-21
Hacker News yorumları
  • Bu hafta Google sanki Godzilla gibi hareket ediyormuş gibi hissettirdi
    İlk kez AI Studio’ya kart bağlamayı denedim ama ödeme süreci fazlasıyla karmaşıktı
    Tüm ayarları tamamlamama rağmen sürekli “permission denied” hatası aldım
    Bu kadar uğraşıp bir de para ödeyeceksem, model ne kadar iyi olursa olsun bir anlamı kalmıyor

    • Yaşattığımız kötü deneyim için üzgünüz
      Erişilebilirliği artırmak için ekip yoğun şekilde iyileştirmeler yapıyor
      Ödeme tarafındaki sürtünmeyi azaltmak için AI Studio’ya entegre ödeme sistemi hazırlanıyor ve ocak ayında dünya genelinde kullanıma sunulmasının planlandığı söyleniyor
    • Google API’leri genel olarak giriş bariyeri çok yüksek
      Diğer servislerde tek bir API anahtarı yeterliyken, Google’da hesap oluşturma → uygulama oluşturma → servisi etkinleştirme → OAuth uygulaması oluşturma → JSON indirme adımlarının hepsini yapmak gerekiyor
    • Sadece API kullanmak istiyorsanız Fal.ai’nin Nano-Banana-Pro’sunu öneririm
      Kayıt süreci çok daha basit ve çeşitli yapay zeka modelleri sunuyor
    • Ben de Claude ve OpenAI’ın ücretli planlarını kullanıyorum ama Gemini’de ödeme o kadar zor ki denemeye kalkmak bile güç
      Sırf basit bir test için GCP projesi oluşturmak fazlasıyla ağır kaçıyor
    • Google’ın yapay zeka ürünleri için daha iyi bir geliştirici frontend’i yapmak bile başlı başına iş fırsatı olacak kadar büyük bir kullanım zorluğu var
  • Tüm düzenleme odaklı prompt’larımı Nano Banana Pro ile yeniden test ettim
    SHRDLU, M&M Van Halen ve Scorpio Street testlerini geçti
    Sonuçlara buradan bakabilirsiniz
    NB Pro, orijinal NB’ye kıyasla belirgin şekilde daha iyi performans gösterdi

    • Zürafa düzenleme testinde Seedream’e kıyasla NB Pro’nun sonucu daha iyi görünüyordu ama değerlendirme bunun tersiydi
      Testin kendisi pek uygun değilmiş gibi geldi
    • NB Pro zürafa testini geçmiş sayılmalıydı
      Sonuç kusursuz değil ama isteneni yerine getirdi
    • Pisa Kulesi testi ilginçti
      Net bilgi gerektiren prompt’ları geçiyor ama sadece eğik bir nesneyi düzleştirmek hâlâ zor
    • Her testte orijinal görsel de sürekli yanında gösterilse karşılaştırma daha kolay olurdu
      Slider yerine orijinal-sonuç eşzamanlı gösterim daha sezgisel olabilir
    • Site gerçekten çok faydalı. Metinden görsele benchmark’ını da NB Pro ile yapmayı düşünüp düşünmediğinizi merak ediyorum
  • Birkaç aydır Nano Banana prompt engineering analizi yapıyordum, Google da yeni sürümü çıkardı
    Yeni model gemimg paketi içinde doğrudan çalışıyor
    Ama fiyatı yüksek olduğu için varsayılan model yapmak zor
    Dokümana göre model ara görselleri (Thinking aşaması) en fazla iki adet üretiyor
    Bu da maliyet artışının nedeni olabilir

    • “Sol gözde çilek, sağ gözde böğürtlen” prompt örneği ilginçti
      Model sağ ve solu gözlemcinin bakış açısına göre yorumlayıp yanlış yerleştirdi
      Bu tür göreli yönerge hataları tıp alanında da sık görülen bir sorun
      İlgili örnek bağlantısı
    • Max’in Nano Banana rehberi hâlâ geçerli
      Prompt’ların çoğu NB Pro’da da iyi çalışıyor
      Rehber bağlantısı
      Benim deney sonuçlarımı da paylaştım
    • Girdi görseli başına maliyet $0.06 değil, $0.0011
    • gemimg 0.3.2 sürümünü yayımladım; NB Pro’daki görsel hatalarının çoğu düzeltildi
      “Studio Ghibli tarzına dönüştürme” ChatGPT’ye göre çok daha isabetli
      Ama aşırı gerçekçi görseller bazen uncanny valley etkisine düşebiliyor
    • gemimg wrapper’ı hâlâ faydalı
      Teknolojik değişime uyum sağlayan esnek araç tasarımının ne kadar önemli olduğunu yeniden hatırlattı
  • Kısa prompt’larla tam bir infografik üretme becerisi şaşırtıcı
    “Datasette projesi nasıl çalışır” diye istedim, oldukça tamamlanmış bir sonuç aldım
    Sonuç bağlantısı

    • Bu özellik SaaS tarafında etkinlik broşürü oluşturma işlevini kökten değiştirebilir
      Şu anda metni ayrı render ediyorduk, artık tek seferde yapmak mümkün olabilir
    • Piyano klavyesinde orta doyu bulmakta başarısız oldu
      Sonuç görseline bakabilirsiniz
    • Hakkında neredeyse hiç bilgi olmayan bir proje için bile (player.html) iyi infografikler üretiyor
      GitHub bağlantısı
      Bunu Instagram için kare formata da otomatik dönüştürdü
    • Datasette infografiğinin gerçekten nasıl çalıştığıyla örtüşüp örtüşmediğini merak ediyorum
  • Yapay zeka görselleri artık bariz artefaktlar üretmiyor ama stil yüzünden hâlâ yapay zeka ürünü oldukları anlaşılıyor
    Özellikle infografikler, insan yapımı olanlardan ayırt edilebildi
    Bu, belirli veri setlerinin aşırı temsil edilmesinin sonucu gibi görünüyor

    • İnsanlar küçük görsel farklara karşı çok hassas
      Ortalama üzerinden eğitilmiş modeller “ortalama bir görsel uzayı” üretiyor
      İlgili örneklere bakınca, ince ayarla daha gerçekçi sonuçlar almak mümkün görünüyor
    • Bu sadece veri sorunu değil
      Bazı modeller kasıtlı olarak stili törpüleyerek yapay bir his bırakıyor
      Açık modellerde LoRA ile ince ayar yapılabiliyor ama kapalı modellerde bunun zor olması sorun
    • Modellerin çoğu tüm web verisiyle eğitildiği için öngörülebilir ortalama sonuçlar üretiyor
      Daha özgün görseller isteniyorsa prompt’un kendisinin daha yaratıcı olması gerekiyor
    • Doku, oran ve ışık gibi alanlarda hâlâ ince hatalar kalıyor
      Bu yüzden sıradaki görev olarak görsel düzenleme yetenekleri öne çıkıyor
    • İnsan geri bildirimiyle ince ayar yapılan modeller “ortalama zevki” öğrenip karakterini kaybediyor
      İlk modellerin kalitesi daha düşüktü ama daha ilginç sonuçlar veriyordu
  • SynthID iyi bir ilk adım ama filigransız yapay zeka içeriklerini ayırt edememek gibi bir sınırı var
    Büyük şirketlerin standartlaştırılmış tanımlayıcılar benimsemesi gerekiyor

    • Hükümetin filigranı zorunlu kılması tehlikeli olabilir diye düşünüyorum
      Photoshop için de böyle bir düzenleme olsaydı yaratıcılık ciddi şekilde kısıtlanırdı
    • Apple’ın bir gün “Real Photos” benzeri bir özellik çıkaracağını düşünüyorum
      Gerçek kamerayla çekilmiş fotoğraf olduğunu kanıtlayıp iMessage içinde doğrulama işareti eklemek gibi
    • Şirketlerin filigran kullanmasının nedeni veri yeniden eğitimini yönetmek
      Sonunda büyük ticari modeller varsayılan olarak filigranı zorunlu kılacaktır
    • Standart bir tanımlayıcı çıktığında, onu kaldıran yazılımlar da ortaya çıkacaktır
      Bu bitmeyen bir kedi-fare oyunu olacak
    • Bu sorunları çözmeye çalışan C2PA projesi zaten var
  • 2D animatörler henüz rahat olabilir
    Sprite sheet üretmeyi denediğimde, kareleri sadece tekrar etti; doğal ara hareketler (interpolation) üretemedi

  • Resmî kaynak derlemesi
    Developer Blog
    DeepMind Sayfası
    Model Card PDF
    SynthID tanıtımı

  • Bu model, ilk kez piyano testimi geçen görsel üretim modeli oldu
    Oktavlar boyunca siyah tuş desenini doğru şekilde tekrar ediyor
    Önceki modeller tuş dizilimini hep yanlış gösteriyordu

    • Ama 88 tuş standardının dışına çıkınca hâlâ çok hata yapıyor
      Belirli notaları renklendirme isteğini de rastgele ele alıyor
      Piyano standartlaşmış bir nesne olduğu ve eğitim verisi bol olması gerektiği hâlde kavrayışı yetersiz
    • Tekrarlayan desenleri uzun süre korumak zor
      88 tuşun tamamında tutarlılığı korumuş olması etkileyici
  • Artık model metni görselin içine doğal biçimde render edebiliyor
    Eskiden imkânsız olan bu özellik şimdi temel bir yetenek gibi hissettiriyor

    • Ben de katılıyorum. Ama ikon üretimi gibi görselle kodun kesiştiği alanlar hâlâ zayıf
      Eğriler, boşluklar ve dengeyi tutturmak gibi ince tasarım işleri için insan eli hâlâ daha iyi