- Google, Gemini 2.0 Flash modeli üzerinden görsel oluşturma özelliğini geliştirici önizlemesi olarak yayınladı
- Metin tabanlı komutlarla görsel oluşturma, düzenleme ve kısmi düzenleme mümkün; görsel kalite ve metin render etme de iyileştirildi
- Ürün reskin işlemleri, SKU oluşturma, gerçek zamanlı ortak düzenleme gibi çeşitli kullanım örnekleri paylaşıldı
- [Google AI Studio] ve [Vertex AI] üzerinden hemen test edilebiliyor; API kullanım limitleri de artırıldı
Gemini 2.0 Flash görsel oluşturma özelliği önizlemesi yayınlandı
- Geliştiricilerden gelen geri bildirimler doğrultusunda Google, Gemini 2.0 Flash modeli aracılığıyla görsel oluşturma özelliğini önizleme sürümü olarak sunuyor
- Kullanıcılar buna Google AI Studio veya Vertex AI üzerinden erişebiliyor
Başlıca iyileştirmeler
- Görsel kalitesinde artış (önceki deneysel sürüme kıyasla)
- Metin render etme doğruluğunda iyileşme
- Filtre engelleme oranında azalma
Kullanılabilecek görsel oluşturma özelliklerine örnekler
- Ürün görselini yeniden arka planlama: Mevcut ürün fotoğrafları farklı arka planlar ve ortamlarla yeniden kurgulanabiliyor
- Gerçek zamanlı işbirlikçi düzenleme: Gemini Co-Drawing uygulaması içinde birden fazla kullanıcının gerçek zamanlı görsel düzenlemesi destekleniyor
- Görselin yalnızca bir bölümünü konuşmalı olarak düzenleme: Tamamını değiştirmeden yalnızca belirli bir alan etkileşimli komutlarla düzenlenebiliyor
- Ürün SKU’larını dinamik oluşturma: Görsel ve metni birleştirerek yeni ürün varyasyonları (renk, etiket vb.) otomatik oluşturulabiliyor
- Gemini ile fikir geliştirmede işbirliği: Metin + görsel kombinasyonuyla yemek, ürün, planlama gibi çeşitli senaryolar hayata geçirilebiliyor
API kullanım örneği (Python)
from google import genai
from google.genai import types
client = genai.Client(api_key="GEMINI_API_KEY")
response = client.models.generate_content(
model="gemini-2.0-flash-preview-image-generation",
contents=("Show me how to bake a macaron with images."),
config=types.GenerateContentConfig(
response_modalities=["TEXT", "IMAGE"]
),
)
Gelecek planları
- Google, gelecekte daha yüksek kalite, ek özellikler, daha yüksek hız ve fiyatlandırma iyileştirmeleri ile bu yeteneği genişletmeyi sürdürecek
- Ayrıntılı belgeler için Gemini API görsel oluşturma kılavuzu incelenebilir
1 yorum
Hacker News görüşü