- Google Research ve Cornell Üniversitesi tarafından geliştirilen, görüntü tamamlama için yeni bir üretken yaklaşım
- RealFill, görüntünün eksik kısımlarını aslında orada olması gereken içerikle doldurarak daha gerçekçi görüntüler üretmeyi hedefler
- Model, hedef görüntüyle tam eşleşmesi gerekmeyen; bakış açısı, ışık koşulları, kamera diyaframı veya görüntü stili açısından çeşitlilik gösterebilen birkaç referans görüntü kullanılarak kişiselleştirilir
- RealFill, çeşitli ve zorlu senaryoları kapsayan yeni bir görüntü tamamlama kıyaslamasında mevcut yaklaşımları açık farkla geride bırakır
- Süreç, referans ve hedef görüntüler üzerinde önceden eğitilmiş bir inpainting difüzyon modelinin ince ayarını içerir; bu model, giriş görüntüsündeki sahnenin içeriğini, ışığını ve stilini öğrenir
- İnce ayarlanmış model daha sonra standart difüzyon örnekleme süreciyle hedef görüntünün eksik bölgelerini doldurmak için kullanılır
- RealFill, referans ile hedef arasında büyük farklar olsa bile, özgün sahneye sadık ve görsel açıdan etkileyici yüksek kaliteli görüntüler üretir
- RealFill'in sınırlamaları arasında nispeten yavaş gradyan tabanlı ince ayar süreci ve referans ile hedef görüntü arasındaki bakış açısı değişimi çok büyük olduğunda 3D sahneyi geri kurmadaki zorluk yer alır
- RealFill, Stable Diffusion gibi temel önceden eğitilmiş modeller için zorlu örneklerde de zorlanır
1 yorum
Hacker News görüşü