- Gemini ve Whisk üzerinden metin tabanlı istemleri yüksek çözünürlüklü 8 saniyelik videolara dönüştürme özelliği sunuluyor
- Veo 2 modeli kullanılarak gerçekçi videolar üretilebiliyor ve bu özellik Google One AI Premium abonelerine sunuluyor
- Whisk Animate ile görseller 8 saniyelik animasyon kliplere dönüştürülebiliyor
- Güvenlik için üretilen tüm videolara SynthID dijital filigranı ekleniyor
Gemini'de video oluşturma yöntemi
- Veo 2, yüksek çözünürlüklü ve ayrıntılı videolar üretebilen bir modeldir; gerçekçi fizik ve insan hareketlerini anlayarak canlı karakter hareketleri ve gerçekçi sahneler sunar
- Kullanıcılar Gemini içinde Veo 2'yi seçerek 720p çözünürlükte 8 saniyelik video klipler oluşturabilir
- Sahneyi tarif ettiğinizde Gemini fikirleri videoya dönüştürür; açıklama ne kadar ayrıntılı olursa nihai video üzerindeki kontrol de o kadar artar
- Oluşturulan videolar TikTok veya YouTube Shorts gibi platformlarda kolayca paylaşılabilir
Whisk Animate ile görsellere hayat vermek
- Whisk, metin ve görsel istemleri kullanarak yeni fikirleri görselleştirmeyi sağlayan bir Google Labs deneyidir
- Whisk Animate ile görseller canlı 8 saniyelik videolara dönüştürülebilir ve bu özellik Google One AI Premium abonelerine sunulur
Güvenlik yaklaşımı
- Video üretiminde güvenlik için Veo 2 ile oluşturulan tüm videolara SynthID dijital filigranı eklenir
- Kullanıcı geri bildirimleriyle sürekli iyileştirme yapılması planlanıyor ve politika ihlali içeren içerik üretimini önlemeye yönelik değerlendirmeler sürdürülüyor
2 yorum
Google DeepMind, video oluşturma modeli Veo 2'yi tanıttı
Hacker News görüşleri
Whisk birkaç ay önce Imagen 3 demosu olarak sessizce kullanıma sunuldu. Şaşırtıcı derecede eğlenceli ve uygulaması sağlam
2027'ye kadar tek bir kişinin yaptığı bir filmin 100 milyon doların üzerinde hasılat elde edeceğine dair Polymarket etkinliğinde "evet" hissesi almak istiyorum
Veo2'de 8 saniyelik 12 video oluşturmak 48 dolarlık GCP kredisi harcadı. Dikkatli olmak gerek
Ücretli API dışında 8 saniyelik video üretmenin mümkün olacağını düşünmemiştim
Bu alanda teknik olarak yetkin değilim ama neden her şeyin text-to-X olduğunu merak ediyorum
Ghibli tarzında reklam yapmak cesur bir iş. Artık o tarzın tükenmiş olacağını düşünmüştüm
Google Vids de Veo 2 kullanıyor. Ürün karmaşası var
İçerik moderasyonu çok sinir bozucu. Veo2 ve Gemini'nin eninde sonunda başarısız olmasının başlıca nedeni bu olabilir
Bütün bunlar teknik olarak etkileyici ama bu alanda çok emek vermiş biri için büyük bir uyarı var
Krita'ya bağlanan ve img2img, maskeleme ve txt2img'yi birleştiren Krita-ai-diffusion, sanatçıları güçlendirmeye en çok yaklaşan araç
1 yıl öncesiyle kıyaslandığında son derece etkileyici bir çıkış. Şu anda ML tarafında bütün büyük şirketlerin birbirleriyle yarışıp teknolojiyi ilerletmesi iyi bir durum. Bu, ABD'de (ya da genel olarak) nadir görülen bir şey