1 puan yazan GN⁺ 2025-04-17 | 2 yorum | WhatsApp'ta paylaş
  • Gemini ve Whisk üzerinden metin tabanlı istemleri yüksek çözünürlüklü 8 saniyelik videolara dönüştürme özelliği sunuluyor
  • Veo 2 modeli kullanılarak gerçekçi videolar üretilebiliyor ve bu özellik Google One AI Premium abonelerine sunuluyor
  • Whisk Animate ile görseller 8 saniyelik animasyon kliplere dönüştürülebiliyor
  • Güvenlik için üretilen tüm videolara SynthID dijital filigranı ekleniyor

Gemini'de video oluşturma yöntemi

  • Veo 2, yüksek çözünürlüklü ve ayrıntılı videolar üretebilen bir modeldir; gerçekçi fizik ve insan hareketlerini anlayarak canlı karakter hareketleri ve gerçekçi sahneler sunar
  • Kullanıcılar Gemini içinde Veo 2'yi seçerek 720p çözünürlükte 8 saniyelik video klipler oluşturabilir
  • Sahneyi tarif ettiğinizde Gemini fikirleri videoya dönüştürür; açıklama ne kadar ayrıntılı olursa nihai video üzerindeki kontrol de o kadar artar
  • Oluşturulan videolar TikTok veya YouTube Shorts gibi platformlarda kolayca paylaşılabilir

Whisk Animate ile görsellere hayat vermek

  • Whisk, metin ve görsel istemleri kullanarak yeni fikirleri görselleştirmeyi sağlayan bir Google Labs deneyidir
  • Whisk Animate ile görseller canlı 8 saniyelik videolara dönüştürülebilir ve bu özellik Google One AI Premium abonelerine sunulur

Güvenlik yaklaşımı

  • Video üretiminde güvenlik için Veo 2 ile oluşturulan tüm videolara SynthID dijital filigranı eklenir
  • Kullanıcı geri bildirimleriyle sürekli iyileştirme yapılması planlanıyor ve politika ihlali içeren içerik üretimini önlemeye yönelik değerlendirmeler sürdürülüyor

2 yorum

 
GN⁺ 2025-04-17
Hacker News görüşleri
  • Whisk birkaç ay önce Imagen 3 demosu olarak sessizce kullanıma sunuldu. Şaşırtıcı derecede eğlenceli ve uygulaması sağlam

    • Yüklenen görselleri metin açıklamalarına dönüştüren bir numara kullanıyor
    • Imagen 3'ün modern metin kodlayıcısının güçlü yanlarından yararlanarak uzun dönüştürülmüş açıklamaları takip edebiliyor
  • 2027'ye kadar tek bir kişinin yaptığı bir filmin 100 milyon doların üzerinde hasılat elde edeceğine dair Polymarket etkinliğinde "evet" hissesi almak istiyorum

  • Veo2'de 8 saniyelik 12 video oluşturmak 48 dolarlık GCP kredisi harcadı. Dikkatli olmak gerek

  • Ücretli API dışında 8 saniyelik video üretmenin mümkün olacağını düşünmemiştim

  • Bu alanda teknik olarak yetkin değilim ama neden her şeyin text-to-X olduğunu merak ediyorum

    • Geleneksel bir keyframe tarzı düzenleyici kullanırken arazinin kabaca bir taslağını çizip karakter fotoğrafları ekleyerek ve 3D spline çizerek ayrıntılı yaratıcı kontrol sağlamanın mümkün olup olmayacağını düşünüyorum
  • Ghibli tarzında reklam yapmak cesur bir iş. Artık o tarzın tükenmiş olacağını düşünmüştüm

  • Google Vids de Veo 2 kullanıyor. Ürün karmaşası var

  • İçerik moderasyonu çok sinir bozucu. Veo2 ve Gemini'nin eninde sonunda başarısız olmasının başlıca nedeni bu olabilir

    • Süper kahraman gibi oynayan bir çocuğun eğlenceli videosunu yapmak istiyorum ama sürekli başarısız oluyor
  • Bütün bunlar teknik olarak etkileyici ama bu alanda çok emek vermiş biri için büyük bir uyarı var

    • text-to-anything çok yorucu. Sonuçlar havalı olsa bile onu ben yapmadığım için hiçbir şey hissetmiyorum
    • Vakaların %97'sinde sonuç istediğim şey değil. Metni biraz değiştirince bu kez başka bir yanlış sonuç çıkıyor
    • Bütün bu süreç cüzdanımı, sabrımı ve ruhumu tüketiyor
    • Bu tür "araçların" yaratıcı insanlara nasıl yardımcı olacağını bilmiyorum. Şu ana kadar bu araçlardan çıkan ürünler sadece TikTok/genel internet spam şirketleri oldu
  • Krita'ya bağlanan ve img2img, maskeleme ve txt2img'yi birleştiren Krita-ai-diffusion, sanatçıları güçlendirmeye en çok yaklaşan araç

  • 1 yıl öncesiyle kıyaslandığında son derece etkileyici bir çıkış. Şu anda ML tarafında bütün büyük şirketlerin birbirleriyle yarışıp teknolojiyi ilerletmesi iyi bir durum. Bu, ABD'de (ya da genel olarak) nadir görülen bir şey