SnapFusion - Mobil cihazlarda 2 saniyede üretim yapabilen bir Text-to-Image difüzyon modeli
(snap-research.github.io)- Verimli ağ mimarisi ve aşamalı distillation'ın iyileştirilmesiyle elde edildi
- Orijinal modeldeki gereksiz tekrarları tespit edip, veri damıtımıyla görüntü çözücünün hesaplama yükünü azaltan verimli bir UNet sunuyor
- MS-COCO deney sonuçlarına göre, yalnızca 8 gürültü giderme adımına sahip SnapFusion modeli, 50 adımlı Stable Diffusion v1.5'ten daha iyi FID ve CLIP puanları elde etti
1 yorum
Bu, Snapchat'in yayımladığı bir makale ama kod henüz yayımlanmadığı için... gerçekten mümkün mü? diye tartışan yorumlar var.
https://news.ycombinator.com/item?id=36304716
En azından demo videosu uçak modunda çalıştırılıyor gibi görünüyor