NVIDIA, 100 kB model boyutunda kişiselleştirilmiş görüntü üretim modeli 'Perfusion'ı duyurdu
(research.nvidia.com)NVIDIA, kısa süre önce SIGGRAPH 2023'te kabul edilen 'Key_Locked Rank One Editing for Text-to-Image Personalization' çalışmasıyla, yaklaşık 100 kB boyutunda ve yaklaşık 4 dakikalık eğitimle kişiselleştirilmiş görüntü üretimi yapabilen 'Perfusion' adlı modeli tanıttı.
Bu yöntem, yalnızca saf metinden tüm görüntüyü üretmek yerine, kavramı belirtmek için birkaç örnek görüntü girdikten sonra o kavramı içeren bir metin girildiğinde buna uygun bir görüntü üretme şeklinde çalışıyor.
Tanıtım sayfası ve makalede yer alan sonuçlar oldukça etkileyici görünüyor.
Kodun da yakında yayımlanmasının planlandığı söyleniyor.
1 yorum
A100'de 4 dakika falan sürüyor gibi bir şey değildir, değil mi..?