1 puan yazan GN⁺ 2025-10-30 | 1 yorum | WhatsApp'ta paylaş
  • Birden fazla üretken yapay zeka görsel düzenleme aracının sonuçlarını karşılaştıran içerik biçimi
  • Her aracın aynı girdi için ürettiği düzenleme sonuçlarını görsel olarak karşılaştıran bir yapı
  • Sayfada “Loading editing comparisons...” ifadesi yer alıyor; bu da düzenleme karşılaştırmalarının yüklenmekte olduğunu gösteriyor
  • Başlık dışında, belirli araç adları, karşılaştırma ölçütleri, sonuç açıklamaları vb. sağlanmıyor
  • Genel olarak yapay zeka görsel düzenleme performansını karşılaştırmaya yönelik bir arayüz gibi görünüyor, ancak ayrıntılar özgün metinde yer almıyor

Sayfa özeti

  • Başlık “Generative AI Image Editing Showdown”; bu da birden fazla yapay zeka görsel düzenleme modelinin karşılaştırıldığını ima ediyor
  • Gövdede yalnızca “Loading editing comparisons...” ifadesi bulunuyor; karşılaştırma sonuçları veya açıklamalar yer almıyor
  • Ek metin, veri, görsel, araç listesi, değerlendirme ölçütleri vb. özgün metinde bulunmuyor

Sağlanan bilginin sınırları

  • Özgün metinde düzenleme sonuçları veya karşılaştırma içeriğine dair somut bir açıklama yok
  • Bu nedenle karşılaştırmanın amacı, kullanılan yapay zeka modelleri, değerlendirme yöntemi gibi unsurlar açıkça belirtilmiyor
  • Genel olarak içerik yüklenme aşamasında görünüyor; bu yüzden kayda değer bir bilgi sunulmuyor

1 yorum

 
GN⁺ 2025-10-30
Hacker News görüşleri
  • Herkes Gemini 2.5 Flash Image / Nano Banana'yı küçümsüyor
    Diğer modellere kıyasla çok daha güçlü ama görsel başına fiyatı aynı ve metin kodlayıcısı sayesinde çok daha karmaşık ve nüanslı prompt'ları işleyebiliyor
    Hazırladığım gemimg Python paketi ile örnekleri paylaştım, daha çeşitli vakaları içeren bir blog yazısı da yolda
    Google'ın AI Studio platformunda en-boy oranı kontrolü de sunan ücretsiz üretim de var
    Yine de Seedream 4.0'ın bu testte kazanması şaşırtıcıydı

    • Aslında Nano Banana çıktığında epey viral olmuştu
      ChatGPT'ye gömülü özellikler ya da Ghibli tarzı akımı hariç tutarsak, en bilinen görsel düzenleme modellerinden biri olduğunu düşünüyorum
    • Seedream, prompt'a sadakat açısından öndeydi ama biraz renk gradyanı değişimi yaratma eğilimi var
      Benim kullanımımda bu büyük bir sorun değil ama renk tutarlılığının önemli olduğu kişiler için Nano Banana daha iyi olabilir
    • Nano Banana kullanırken vakaların yaklaşık yarısında AI Studio sebepsiz yere başarısız dedi
      Telif sınırında istekler de değildi ama bu tür hatalar sık oluyor
      Yine de çalıştığında sonuçlar çok etkileyici oluyor
    • Dağınık mutfak fotoğrafımı toparlamak için Nano Banana kullandım ama ilk denemede tamamen başarısız oldu
      İkinci denemede önce görsel analiziyle dağınık eşyaların listesini çıkardım, sonra bunları prompt ile kaldırınca çok daha iyi sonuç aldım
      Sonunda prompt engineering'in önemini yeniden hissettim
    • Gemini düzgün çalıştığında harika ama bazen tamamen alakasız sonuçlar veriyor ve hangi prompt'u yazarsan yaz tutmuyor
      Flux şaşırtıcı derecede iyi ama çoğu insanın (ben dahil) sonunda varsayılan olarak ChatGPT ya da Gemini gibi alışık olduğu modellere yöneldiğini düşünüyorum
  • Bu tür karşılaştırmalar benchmark grafiklerinden çok daha pratik
    Nano Banana'yı sık kullanıyorum ama dış cephe ya da peyzaj düzenlemelerinde zayıf
    Kaldırım, drenaj kanalı, renk eşleme gibi şeyler neredeyse imkansız

    • Ben Qwen Image Edit ile gündüz fotoğraflarını geceye çevirme denemeleri yapıyorum ve modellerin çoğu kenar hizalamasını kaçırıyor
      Nano Banana da sınır işlemede hatalı davranıyor, bu yüzden fotoğraf kayıyor
  • 2022'de çıtayı görmüş biri olarak bugünkü demolara bakınca, SD1·2·3 dönemleriyle kıyaslanamayacak kadar etkileyici olduklarını düşünüyorum
    Artık modellerin prompt'ları ve görselleri gerçekten anladığı bir döneme gelmişiz gibi duruyor
    Mühendislik ilerlemeye devam ettikçe yaratıcılık da patlayıcı biçimde genişliyor

  • Prompt'u ya da deneme sayısını değiştirip sadece en beğenilen sonucu göstermek, testin nesnelliğini zayıflatıyor
    Tüm modeller için aynı prompt ve seed ile 5 üretim gibi standart koşullar gerekli
    Örneğin Gemini 2.5 Flash, “Girl with Pearl Earring” testinde gereğinden fazla serbestlik kazanmıştı,
    buna karşılık OpenAI gpt-image-1 çok daha az denemeyle çok daha iyi sonuç verdiği halde başarısız sayıldı

    • Not olarak, gpt-image-1 örneği “You Only Move Twice” testi içindi
    • Hatta “en kötü görsel” yarışması düzenlense, hangi modelin daha az sinir bozucu olduğu daha net ortaya çıkabilir
  • Replicate blog yazımda çeşitli modelleri doğrudan karşılaştırdım
    Bunların içinde Qwen Image Edit en ucuz ve en hızlı olanıydı, ayrıca çoğu düzenleme işini de iyi yaptı
    Bir görsel düzenleme uygulaması yapacak olsam muhtemelen bu modeli seçerdim

  • Karşılaştırmanın kendisi ilginçti ama sondaki zürafa görselinde aslında sadece gövde bükülmüş, kısalmamıştı
    Yine de sık sık Gemini sonucunu seçtim ve pass/fail yerine 10 puanlık ölçekle değerlendirme olmasını isterdim

    • “Tuhaf biçimde bükülmüş zürafa” ifadesi çok komikti
      Böyle bir sergi gerçekten olsa kesin giderdim
  • Son zamanlarda neredeyse hiç AI görsel üretmiyorum
    Yaklaşık bir buçuk yıl önce modelleri yerelde çalıştırmak modaydı ama artık çoğu şey bulut tabanlı hale geldi
    Yine de gerçek fotoğraf düzenlemede hâlâ bir tür doğal olmayan doku hissi var
    Mesela insan saçı gereğinden fazla parlak görünüyor ya da ağaçlar plastik gibi duruyor

    • Görsel modellerin boyutu ve hesaplama gereksinimi o kadar büyüdü ki bireysel olarak self-hosting yapmak zorlaştı
      Flux Kontext yerelde çalıştırılabiliyor ama kuantize modelle yavaş üretim yapmak gerektiği için verimsiz
      Üstelik ChatGPT'de ücretsiz görsel üretilebildiğinden, yerelde ısrar etmek için güçlü bir neden de kalmadı
      Saç testinde yalnızca Gemini 2.5 Flash renk ve dokuyu gerçekten doğru eşleştirdi,
      Seedream 4 ise genel renk düzeltmesini değiştirdiği için tercih etmiyorum
  • Reve'nin de teste dahil edilmesi iyi olurdu diye düşünüyorum

    • Nano Banana ile karakterin bakış yönünü değiştirmek iyi sonuç vermedi ama Reve ilk denemede kusursuz sonuç verdi
      Karakterin elindeki nesneyi kaldırdı, bakışı kameraya çevirdi ve pozu da doğal şekilde ayarladı
      Üstelik çıkan 4 sonucun dördü de kullanılabilecek kadar yüksek kalitedeydi
      Sonrasında Reve'nin model tanıtım yazısını okuyunca hemen kaydolmaya karar verdim
    • Öneri için teşekkürler, daha sonra test listesine eklemeyi planlıyorum
    • İyi tüyo, teşekkürler
  • Deneme iyiydi ama “Resimdeki kule sağa eğik” gibi hatalı prompt'lar modeli daha da fazla eğmeye itiyor

    • O cümle aslında gerçek giriş prompt'u değil, başlangıç cümlesiydi
      Modele göre prompt'lar ayarlandığı için deneme sayıları da farklıydı
  • Genel olarak eğlenceli bir testti
    Prompt'ların kusursuz olmadığı yönünde eleştiriler var ama bence tam da bu yüzden normal bir kullanıcının yazabileceği düzeyde ve gerçekçi

    • Ben SD 1.5 döneminden beri prompt'larla uğraştığım için model bazında gereken prompt varyasyonlarını iyi biliyorum
      SSS'de açıklandığı gibi, modelin belirli kelimelere takılıp kalmaması için prompt'un farklı sürümlerini deniyorum
      Örneğin “Turn on the lights” gibi emir cümleleri basit bir komuttan ibaret değil,
      multimodal LLM'in anlama yetisini sınamak için kullanılan prompt'lardır
      Bu tür cümleler SDXL gibi geleneksel modellerde asla işe yaramaz