VideoLDM - Latent Diffusion Model ile yüksek çözünürlüklü Text-to-Video sentezi

xguru · 2023-04-22T10:18:01+09:00

LDM, sıkıştırılmış düşük boyutlu latent uzayda bir Diffusion Model eğiterek çok fazla hesaplama kaynağı olmadan da yüksek çözünürlüklü görüntü sentezini mümkün kılar Bu LDM'yi yüksek çözünürlüklü videoya uygulayan NVIDIA makalesi LDM, önce yalnızca görüntü için önceden eğitiliyor; ardından temporal dimension eklenerek kodlanmış görüntü dizileri ince ayardan geçiriliyor ve görüntü üreticisi video üreticisine dönüştürülüyor Diffusion model upsampler hizalanarak zamansal tutarlılığa sahip ultra yüksek çözünürlüklü bir video modeline dönüştürülüyor

(research.nvidia.com)

7 puan yazan xguru 2023-04-22 | Henüz yorum yok. | WhatsApp'ta paylaş

LDM, sıkıştırılmış düşük boyutlu latent uzayda bir Diffusion Model eğiterek çok fazla hesaplama kaynağı olmadan da yüksek çözünürlüklü görüntü sentezini mümkün kılar
Bu LDM'yi yüksek çözünürlüklü videoya uygulayan NVIDIA makalesi
LDM, önce yalnızca görüntü için önceden eğitiliyor; ardından temporal dimension eklenerek kodlanmış görüntü dizileri ince ayardan geçiriliyor ve görüntü üreticisi video üreticisine dönüştürülüyor
Diffusion model upsampler hizalanarak zamansal tutarlılığa sahip ultra yüksek çözünürlüklü bir video modeline dönüştürülüyor

VideoLDM - Latent Diffusion Model ile yüksek çözünürlüklü Text-to-Video sentezi

İlgili okumalar

Henüz yorum yok.