- Mevcut metinden görüntü sentezi, onlarca milyar görüntü-metin çiftiyle eğitilmiş diffusion modelleri sayesinde mümkün hale geldi
- Bu yaklaşımı 3D'ye uygulamak için büyük ölçekli, etiketlenmiş 3D veri kümeleri ve gürültü giderme için bir mimari gerekir, ancak bunlar mevcut değil
- Bu nedenle, önceden eğitilmiş 2D Text-to-Image diffusion modeli kullanılarak Text-to-3D sentezi gerçekleştiriliyor
- Metin üzerinden oluşturulan 3D model her açıdan görüntülenebiliyor; aydınlatması değiştirilebiliyor veya farklı 3D ortamlara birleştirilebiliyor
Henüz yorum yok.