3 puan yazan GN⁺ 2025-05-08 | 1 yorum | WhatsApp'ta paylaş
  • Google, Gemini 2.0 Flash modeli üzerinden görsel oluşturma özelliğini geliştirici önizlemesi olarak yayınladı
  • Metin tabanlı komutlarla görsel oluşturma, düzenleme ve kısmi düzenleme mümkün; görsel kalite ve metin render etme de iyileştirildi
  • Ürün reskin işlemleri, SKU oluşturma, gerçek zamanlı ortak düzenleme gibi çeşitli kullanım örnekleri paylaşıldı
  • [Google AI Studio] ve [Vertex AI] üzerinden hemen test edilebiliyor; API kullanım limitleri de artırıldı

Gemini 2.0 Flash görsel oluşturma özelliği önizlemesi yayınlandı

  • Geliştiricilerden gelen geri bildirimler doğrultusunda Google, Gemini 2.0 Flash modeli aracılığıyla görsel oluşturma özelliğini önizleme sürümü olarak sunuyor
  • Kullanıcılar buna Google AI Studio veya Vertex AI üzerinden erişebiliyor

Başlıca iyileştirmeler

  • Görsel kalitesinde artış (önceki deneysel sürüme kıyasla)
  • Metin render etme doğruluğunda iyileşme
  • Filtre engelleme oranında azalma

Kullanılabilecek görsel oluşturma özelliklerine örnekler

  • Ürün görselini yeniden arka planlama: Mevcut ürün fotoğrafları farklı arka planlar ve ortamlarla yeniden kurgulanabiliyor
  • Gerçek zamanlı işbirlikçi düzenleme: Gemini Co-Drawing uygulaması içinde birden fazla kullanıcının gerçek zamanlı görsel düzenlemesi destekleniyor
  • Görselin yalnızca bir bölümünü konuşmalı olarak düzenleme: Tamamını değiştirmeden yalnızca belirli bir alan etkileşimli komutlarla düzenlenebiliyor
  • Ürün SKU’larını dinamik oluşturma: Görsel ve metni birleştirerek yeni ürün varyasyonları (renk, etiket vb.) otomatik oluşturulabiliyor
  • Gemini ile fikir geliştirmede işbirliği: Metin + görsel kombinasyonuyla yemek, ürün, planlama gibi çeşitli senaryolar hayata geçirilebiliyor

API kullanım örneği (Python)

from google import genai  
from google.genai import types  
  
client = genai.Client(api_key="GEMINI_API_KEY")  
response = client.models.generate_content(  
    model="gemini-2.0-flash-preview-image-generation",  
    contents=("Show me how to bake a macaron with images."),  
    config=types.GenerateContentConfig(  
        response_modalities=["TEXT", "IMAGE"]  
    ),  
)  

Gelecek planları

  • Google, gelecekte daha yüksek kalite, ek özellikler, daha yüksek hız ve fiyatlandırma iyileştirmeleri ile bu yeteneği genişletmeyi sürdürecek
  • Ayrıntılı belgeler için Gemini API görsel oluşturma kılavuzu incelenebilir

1 yorum

 
GN⁺ 2025-05-08
Hacker News görüşü
  • Gemini 2.0, birden fazla görsel üretim modeliyle karşılaştırmalı olarak test edildi. Google’ın Imagen 3.0’ının ne kadarının buna dahil olduğunu bilmiyorum ama genel estetik kalite oldukça düşük görünüyor
    • Başlıca avantajları, OpenAI ürünleriyle denkliği korumaya çalışan multimodal yönü ve OpenAI 4o görsel üretimine kıyasla çok daha hızlı olması
  • Aracı her kullandığınızda istediğiniz sonucu almak için çoğu zaman birden fazla deneme yapmanız gerekiyor. Sohbet tabanlı arayüzün kullanımı konusunda soru işaretlerim var
  • Dikkatli kullanılmalı. Örneğin, vejetaryen butter chicken tarifi istediğimde 41MB JSON ve 28 adet base64 görsel döndü. Görsel başına 4 sent ile tek bir istek 1 doların üzerine çıktı
  • Gemini 2.0 kullanarak 100 tarif ve görsel ürettim; sonuçlar oldukça iyiydi. Metin istemleri yerine ham veri ve tablo metadata’sı kullandım
  • Gemini 2.0 görsel üretiminde görsel başına fiyat $0.039 ve bu da Imagen 3’ten daha pahalı. Gemini, konuşma üzerinden görsel üretebiliyor; Imagen 3 ise metin girişi/görsel çıktısı biçiminde çalışıyor
  • Karalama-çizim demosunda karışık sonuçlar aldım. Bir sahne çizip modelin bunu genişletmesini bekledim ama 3D render edilmiş çöp adamlar üretildi
  • Model çıktısı fena değil ve yakın zamanda yeni modeli bir projeye ekledim. Hâlâ birçok hata modu var ama iyi bir iş akışını gösteren kapsamlı bir yemek kitabına ihtiyaç var
  • Google ve diğer yapay zeka şirketlerinin hedeflediği şey, alışverişte veya e-ticarette kullanılabilecek sonsuz bir yapay zeka üretimli nesneler dünyası. Bu, gerçek insan zanaatkârlığına ve gerçekten var olan nesnelere yönelik bir meydan okuma