- Diffusion modelleri, görüntü, ses ve video üretiminde devrim yarattı
- Ancak yinelemeli bir üretim süreci gerektirdikleri için yavaştırlar ve bu nedenle gerçek zamanlı kullanımda uygulanmaları zordur
- Consistency modeli, Adversarial Training olmadan yalnızca 1~2 adımda yüksek kalitede üretim yapabiliyor
- Bu modelde de birden fazla örnekleme yapıldığında kalite daha da artıyor
- Zero-shot veri düzenleme, görüntü inpainting, renklendirme, Super-Resolution gibi işlemleri de özel bir eğitim olmadan destekliyor
- Önceden eğitilmiş bir Diffusion Model’i damıtma yoluyla çıkarma yöntemiyle ya da bağımsız bir üretici model olarak eğitilebiliyor
1 yorum
Makale daha önce yayımlanmıştı: Consistency Models https://arxiv.org/abs/2303.01469
Diffusion modelinin ilk makalesinde üretim 1000 adımda yapılıyordu; günümüzde ise gelişmelerle birlikte bu sayı 50 adımın altına indi.
Bunu 1~4 adıma indiren Distilled StableDiffusion2 de geçen yılın sonunda gündeme gelmişti, ancak makalesi hâlâ yayımlanmadı.
https://twitter.com/EMostaque/status/1598131202044866560