21 puan yazan GN⁺ 2025-09-12 | 1 yorum | WhatsApp'ta paylaş
  • Google Nano-banana için çeşitli görsel üretimi ve düzenleme çalışmalarından örnekleri bir araya getiren açık kaynaklı bir vaka koleksiyonu
  • Google görsel üretim teknolojisini kullanarak yaratıcı dönüşüm ve çoklu görsel düzenleme yeteneklerini gösteriyor
  • Her vaka, Twitter/X, Xiaohongshu vb. topluluklardan derlenmiş gerçek kullanım örneklerinden oluşuyor
  • Metin prompt'ları ile giriş görsellerini birleştirerek deneysel ve uygulamalı dönüşüm örneklerini geniş bir yelpazede sunuyor
  • Prompt tasarımı ve giriş rehberi dokümante edilmiş durumda; böylece herkes hemen kullanabiliyor

Genel Bakış

  • Bu depo, Nano-banana'nın görsel üretimi ve düzenleme teknolojisiyle oluşturulmuş çeşitli görselleri ve prompt örneklerini toplayan bir kürasyon galerisidir
  • Google'ın sınırsıza yakın görsel üretim ve düzenleme olanaklarını gösterirken Nano-banana'yı anlamaya yardımcı olur; aynı zamanda çoklu görsel birleştirme ve yaratıcı düzenlemenin gücünü deneyimlemeyi sağlar
  • Vakalar çoğunlukla Twitter/X, Xiaohongshu ve diğer bağımsız içerik platformlarından derlenmiştir
  • Depodaki en son güncelleme tarihi ve sürüm geçmişi kaydedilir

Menü

Her vaka, giriş görselleri ve prompt kombinasyonu ile çıktı örneğinden oluşur.

Girdi & Prompt Örnekleri

  • Girdi: referans görsel, Google Maps görseli, portre fotoğrafı, eskiz, materyal görseli vb. farklı türler gerekir
  • Prompt: İngilizce yazılmış; görsel dönüştürme, düzenleme, tasarım, renk düzeltme vb. için ayrıntılı istekler içerir

Temsili Prompt Yapısı

  • Kişi veya ürünün stili, saç modeli, arka plan dönüşümü vb.
  • Ürün, bina, karakter, yemek, çizgi roman stili, kimlik fotoğrafı, mockup gibi farklı amaçlar için kullanılabilir
  • [köşeli parantez] içindeki bölümler kullanım amacına göre değiştirilerek daha ince ayarlı yönlendirme yapılabilir

Örnek Akış

  • Görsel yükleme → prompt girme → çıktı sonucunu kontrol etme (görsel bağlantısı)
  • Bazıları 'girdi/sonuç' tablo biçimindedir, bazıları ise yalnızca çıktı sonucunu sunar

Vakalardaki Başlıca Örneklerin Özeti

  • Karakter/ürün dönüşümü: portre fotoğraflarını karakter, figür, Lego, Gundam tarzı paketlemeye dönüştürme
  • Cosplay/tasarım: illüstrasyon tabanlı cosplay fotoğrafları, karakterin 3 görünüşü ve ifade sheet'leri üretme
  • Görsel iyileştirme/restorasyon: eski fotoğraf restorasyonu, şeffaf arka plan kaldırma, renk/parlaklık iyileştirme, gürültü onarma
  • Birleştirme/stil geçişi: diyalogsuz çizgi roman ve siyah-beyaz 4 panel, çizgi roman stiline dönüştürme, minyatür, materyal/filtre uygulama, saç modeli/makyaj değiştirme
  • Veri görselleştirme: blog/yazı özeti infografikleri, kalori ve besin değeri gösterimi
  • Eğitim/sunum: uzun vadeli model çizimleri, matematik problem çözümü, açıklama notları ekleme vb.

Prompt Rehberi ve Referanslar

  • Her prompt ve vaka açıklamasında girdiler ile [yerine geçecek içerik] için özelleştirme rehberi sunulur
  • Birden çok görsel birleştirilerek hikâye, moda panosu, poz sheet'i gibi uygulamalar üretilebilir
  • Teknik çıktılar (wireframe, hologram, 3D ifade) da mümkündür

Topluluk Katılımı ve Teşekkür

  • Yapay zeka topluluğundaki gerçek örnekleri paylaşan kişiler merkez alınarak içerik sürekli eklenmektedir
  • Yeni kullanım fikirleri veya yaratıcı işler özgürce önerilebilir

Projenin Önemi ve Farkı

  • En yeni görsel üretim algoritmalarının gerçek uygulama örneklerini zengin biçimde bir araya getiren bir GitHub deposudur
  • Nano-banana prompt'ları ve çıktı sonuçlarının ayrıntılı seçenekleri ile vaka bazlı uygulama yöntemleri tek bakışta görülebilir
  • Uygulamalı tasarımcılar, yapay zeka araştırmacıları, geliştiriciler ve herkes için yüksek referans değeri ve pratik fayda sunar
  • Her örnek, farklı görsel düzenleme, üretim ve dönüştürme amaçları için kolayca yeniden kullanılabilir

1 yorum

 
GN⁺ 2025-09-12
Hacker News görüşleri
  • Nano-Banana'nın gerçekten şaşırtıcı sonuçlar göstermesine hayran kaldım. Farklı text-to-image prompt'larında sonuçların ne kadar doğru çıktığını birincil ölçüt olarak alan, en ileri görüntü modellerini karşılaştıran bir web sitesi işletiyorum. Yakın zamanda, mevcut bir görüntüyü metinle yerel olarak düzenleme becerisini değerlendiren bir Editing Comparison Showdown da ekledim. Şu anda 6 multimodal modeli (Nano-Banana, Kontext Max, Qwen 20b vb.) karşılaştırıyorum. Sonuçlara bu bağlantıdan bakabilirsiniz. Gemini Flash 2.5, 12 üzerinden 7 puanla birinci; Kontext ise 5 puanda ve geliştirici modelini yerelde çalıştırabilmeniz de düşünülünce bu oldukça etkileyici
    • Nano Banana'dan açıkça büyük bir değişiklik yapmasını istesem bile çoğu zaman aynı görüntüyü üretiyor. Bazen de gerçekten tuhaf biçimde doğru sonuç veriyor. Bunu yaşayan veya çözümünü bilen varsa duymak isterim
    • Hâlâ saatleri (ör. 1:15 am gösteren bir saat) düzgün çizemiyor. Ayrıca çizgi/karikatür görsellerine üretilen metin de %100 doğru değil
    • gpt-image-1 eklemenizi öneririm. Global pikselleri değiştirerek çalıştığı için teknik olarak bir düzenleme modeli sayılmaz, ama çok karmaşık prompt'lar ve görüntü referanslarında Nano Banana'dan daha yönlendirilebilir hissettiriyor
  • Bu modelin yalnızca hayal gücünüzle sınırlı olması ve görüntü başına sadece $0.04 maliyeti etkileyici. Sayfada yazmıyor ama bu, Google Gemini Image Generation modeli (resmî doküman). Örnek koleksiyonu da güzel. Ancak ikinci örneğin iş ortamı için biraz uygunsuz görünmesi bana biraz garip geldi
    • Nano Banana'nın özellikle görüntü düzenleme için optimize edildiğini vurgulamak isterim (daha fazla bilgi)
    • Bunun tek bir model mi yoksa bir model pipeline'ı mı olduğunu merak ediyorum
  • Bazı örneklerde NSFW unsurlar var. ABD teknoloji sektörünün büyük bölümünde üstteki URL'yi paylaşmak hassas olabilir; tek tek güvenli örnekleri seçip göstermek daha iyi olabilir. Referans olarak, Vaka 1'in yarısında eteğini kaldırıp iç çamaşırını gösteren anime/çizgi roman tarzı hizmetçi kıyafetli bir kadın var. Ziyaretçilerin ilk sayfada hemen görebildiği örnekler içinde en sorunlu kısım bence bu
    • Bu iç çamaşırı teşhirli örneğin üretilmiş olmasına gerçekten şaşırdım. Ben Nano Banana kullandığımda (güvenlik filtresi off iken) lanetli samuray miğferi ve yerde yatan ceset bulunan çizgi roman tarzı bir görseli üretmeyi reddetmişti
    • Beni daha da rahatsız eden şey, referans görselin açıkça bir sanatçının yaptığı yüksek kaliteli dijital sanat olmasıydı. AI/LLM alanındaki hukuki meseleleri bir kenara bıraksak bile, başkasının eserini resmî dokümanda bu kadar açık şekilde kullanmak etik olarak rahatsız edici
  • İnsanların neden iyi sonuçlar aldığını gerçekten anlamıyorum. Burada Nano Banana'yı (gemini-2.5-flash-image-preview) seçip kullandım ama sonuçlar çöp seviyesindeydi. Karakter referans fotoğrafı ve bir sahne yükleyip karakteri o sahneye koymasını istediğimde, sadece kes-yapıştır yapıyor; stil ve renkler tutmasa bile olduğu gibi yerleştiriyor. ChatGPT'nin sonuçları daha iyi bile olabilir (bazen benzer görünmüyor ama Paint'te 2 dakikada yapılacak bir şeyden yine çok daha iyi). Acaba yanlış modeli mi kullanıyorum?
    • Ben de aynı şeyi yaşıyorum. Nano Banana iyi çalıştığında çok iyi çalışıyor ama vakaların %90'ında sonuç ya tuhaf ya da düşük kaliteli oluyor. Sanki kes-yapıştır veya paint over gibi duruyor ve makul istekleri bile "güvenlik" gerekçesiyle reddediyor (deneyimime göre gerçek insan içeren görseller neredeyse hiç olmuyor). Etkileyiciden çok sinir bozucu
    • Benim deneyimimde Nano Banana, uygun gördüğünde gerçekten kopyala-yapıştırı çok agresif kullanıyor. Karakterin sahneye doğal biçimde entegre edilmesi gerektiğini açıkça prompt'ta belirtmeniz gerekiyor. Yani doğru şekilde prompt yazarsanız başka modellerden çok daha iyi, ama prompt tasarlama süreci başlı başına yorucu ve can sıkıcı
    • Prompt'u küçük değişikliklerle denemek ya da Gemini 2.5 Pro'dan prompt iyileştirmesi isteyip sonra bunu Gemini 2.5 Flash'a vermek şeklinde yineleyerek neyin işe yaradığını öğrenmek mantıklı olabilir
    • Bende de tamamen çöp gibi sonuçlar çıkıyor. Eşimin (32 yaşında) fotoğrafını yükleyip kakülle nasıl görüneceğini denemek istedim ama çoğu deneme güvenlik gerekçesiyle reddedildi. Ara sıra başarılı olsa da yüz bambaşka birine dönüşüyordu. Sadece bir kez düzgün üretti ama kakülü ayarlamak mümkün olmadı; sürekli aynı sonucu döndürdü ve araya bolca "içerik engellendi" mesajı girdi
  • Bana göre bu modelin performansı beklentinin altında. Örnek görseller seçilmiş gibi duruyor. Denediğim bazı başarısız örnekleri paylaşayım: yüzdeki sert gölgeleri kaldıramadı, eski siyah-beyaz bir fotoğrafı net renkli (modern DSLR tarzı) hale getirmesini isteyince sadece renk tonu biraz değişti, 3x3 saç modeli grid'i isteyince sürekli 2x3 üretti ve ancak sonunda 3x3 yaptı ama ırklar karıştı, gerçek bir görselle üretilmiş görseli birleştirmek de mümkün olmadı (ör. tütü giymiş yunus görseli kaba bir kopyala-yapıştır gibi duruyordu)
    • AR bina vurgulama örneği güzeldi. Aynı prompt ile skyline içindeki en belirgin binayı iyi vurguluyor ama başka bir binayı işaret edince tamamen çuvallıyor. Midtown Manhattan görselinde Chrysler Building'i bulup vurgulamasını istedim, "görselde yok" dedi; 432 Park Ave isteyince de görselin ortasında rastgele bir bina belirdi. Chicago Museum Campus fotoğrafında belirli bir binayı isteyince aslında görünmeyen Hancock Center'ı vurguladı. Açıklamalar da yanlıştı ve bazen metin de bozulmuştu
    • Örnekler de kusursuz değil. "Benim fotoğrafım farklı dönemlerde" prompt'u "yüzü değiştirme" denmesine rağmen yüzü tamamen değiştirdi, "OOTD Outfit" yanlış kamera kullanımına sahipti, "Virtual Makeup Try-On" makyajı iyi yansıtamadı, "Lighting Control" ışığı kötü yönetti, "Design a Chess Set" ise giriş görseli gerekmiyor denmesine rağmen pratikte gerektiriyordu; yani sonuçlarda çok soru işareti vardı. Yine de Photoshop kullanmayanlar veya elde düzenlemeye başlamadan önce bir taslak isteyenler için işe yarayabilir
    • Açıkçası, her projenin tanıtım demosunda doğal olarak en iyi örneklerin seçilmesi normaldir diye düşünüyorum
  • Python ile Nano Banana görsel üretimini kolaylaştıran bir paketi yakın zamanda yayımladım (github bağlantısı). Test ederken fark ettiğim etkileyici bir prompt engineering eğilimi var: a) LLM tarzı Markdown listeleri kullanmak ve b) award-winning, DSLR camera gibi eski AI image stil anahtar kelimelerinden yararlanmak, Gemini 2.5 Flash Image üzerinde çok iyi çalışıyor. Bu modelin metin encoder'ı ve eğitim veri seti daha büyük olduğu için, gerçek ifadelerin hangi özellikleri tarif ettiğini ayırt etmede başarılı. Google geliştirici dokümanları da bu tür anahtar kelimelerin kullanımını öneriyor. Ayrıca 32k context window sayesinde görüntüden HTML render etmek veya ayrıntılı JSON girdisiyle tutarlı sonuçlar almak gibi ilginç denemeler de mümkün
  • Bunun şaşırtıcı bir ilerleme olduğunu düşünüyorum. Çok yakın zamana kadar aynı karakteri defalarca tutarlı biçimde üretmek bile zordu. Şimdi bu düzeyde kombinasyon ve tutarlılık görüyoruz. Üretici modellerin gelişim hızı gerçekten inanılmaz. Bu kadar çok örneği toplayan yapımcıya ve katkıda bulunanlara teşekkürler. Aracın pratikte ne olduğunu anlamama çok yardımcı oldu
  • Yakın zamanda şunu fark ettim: Eskiden, saç stilini değiştirmek gibi şeyleri kafamızda canlandırabilmenin insana özgü özel bir yetenek olduğuna inanmak keyifliydi. Şimdi makinelerin bu yeteneği benim hayal gücüme yakın ya da ondan daha iyi biçimde yeniden üretebildiğini görünce, elbise askısını kaldıracak kadar güçlü olmamam gibi, hayal gücümün de o kadar özel olmayabileceği düşüncesi biraz rahatsız edici geliyor
    • Ben zihnimde bu şekilde görüntü canlandıramayan biriyim; hep daha entelektüel ve mantıksal düşünüyorum, o yüzden senin hayal gücün hâlâ özel bir yetenek. Çoğu insana gerçek bir süper güç gibi geliyor. AI'ı Batman'e (para ve utility belt varsa güçlü, ama onlar olmadan etkisiz), insan hayal gücünü ise Superman'e (doğuştan gelen bir güç olduğu için her zaman erişilebilir) benzetmek isterim
    • Kafanızda canlandırdığınız görüntüden keyif alabilmek, ona gülmek, şaşırmak ya da sarsılmak gerçekten özel bir şey. İnsanların bir varoluş nedeni ve duyguları var; bir gün batımına bakıp ışığın saçılmasını düşünebilir ya da sadece hayranlık duyabilirsiniz. Her anı tam anlamıyla kabul ettiğinizde büyülü geliyor. Sana burada yanıt yazabiliyor olmam ve Hacker News'in var olması bile mucize gibi
    • Benim aphantasia'm var (yani zihinde görüntü canlandıramama), o yüzden artık herkesin eşit şartlarda hayal kurabilmesine seviniyorum
    • İleride makinelerin kendi başına yeni sanat stilleri yaratıp yaratamayacağını merak ediyorum. Örneğin çizgi roman/anime stilleri dönemlere göre değişiyor; eğer insanlar bu evrimi durdurursa makineler bunu sürdürmeye devam edebilir mi, izlemeye değer bir soru. İlkesel olarak mümkün olmalı (insanlar da biyolojik makineler sonuçta), ama mevcut AI mimarileriyle bunun hâlâ uzak olduğunu düşünüyorum
    • Adil olmak gerekirse, modelin bu yeteneğinin kendisi de bizim oluşturduğumuz eğitim verisi sayesinde var
  • Nano Banana'yı gerçekten faydalı şekilde kullanıyorum. Oğlum ve arkadaşlarının çocukları için fotoğraf tabanlı boyama kitapları üretirken yararlanıyorum (örnekler ve kod). Siyah-beyaz boyama kitabı hissini iyi korurken, orijinal fotoğrafın bazı detaylarını da sonuçta yaşatabiliyor
  • Çok genç kadınların cinselleştirilmiş biçimde sunulduğu örneklerin fazla olması rahatsız edici. Case 1/B'de kadın karakter eteğini kaldırıp iç çamaşırını gösteriyor. Model oldukça etkileyici ama böyle olgunlaşmamış içerikler yüzünden PR'ı zedeleniyor gibi. Ben saydığımda 26 genç kadın örneği ve 9 erkek örneği vardı. Bu arada sadece 'Lena' eksikti (Lenna referansı)
    • Ben de ilk başta aynı şekilde rahatsız oldum. İkimiz de yaşlandığımız için mi bilmiyorum ama bana da öyle hissettirdi
    • Teknolojik ilerlemenin itici gücünün her zaman cinsel arzu olduğunu kabul ediyorum (hoşumuza gitse de gitmese de). VHS, online ödeme, video streaming gibi alanları da sonuçta bu talep itti. "İnternet pornodur" diyen meşhur şarkı da aklıma geliyor
    • Tarih öncesi heykeltıraşların ne yonttuğuna bir bakarsanız daha da şaşırırsınız. Siteye bakmadan önce yorumları okudum; Case 1'in bir çocuk olduğunu, ardından da seksi bir hizmetçi geldiğini görünce ilk düşündüğüm şey "aman Tanrım, umarım bu ikisini tek bir görselde birleştirmemişlerdir" oldu.