9 puan yazan xguru 2022-10-07 | 1 yorum | WhatsApp'ta paylaş
  • Video Diffusion Model ile metin girdisinden video oluşturan bir "Text-conditional Video Generation System"
  • Metinden düşük çözünürlüklü video (24x48 piksel, 16 kare, 3 fps) üretip bunu 7 diffusion modelini art arda bağlayarak (cascade) upscale etmesiyle öne çıkıyor
  • Nihai çıktı 1280x768 24 fps. 5,3 saniye uzunluğunda video üretebiliyor
  • Makale: Imagen Video : High Definition Video Generation with Diffusion Models