Imagen - Google'ın text-to-image diffusion modeli
(imagen.research.google)- Dili derinlemesine anlayarak gerçekçi görüntüler üreten bir yapay zeka modeli
- İnsanlarla yapılan değerlendirmelerde OpenAI'nin DALL-E 2'sine kıyasla daha çok tercih edilen görüntüler üretiyor
→ kalite ve görüntü-metin hizalaması açısından - Yalnızca araştırma makalesi ve örnek görseller yayımlandı
→ etik sorunlar gibi nedenlerle dışarıdan kullanılabilecek bir demo sürümünün yayımlanmamasına karar verildi
2 yorum
Dün kitapçıda, Disney animasyonlarından alınmış karelerin illüstrasyon olarak eklendiği bir Alice Harikalar Diyarında kitabı gördüm; böyle bir modele Alice Harikalar Diyarında'ndaki her sahneyi verirsek nasıl bir sonuç üreteceğini merak ediyorum.
DALL·E 2 tanıtıldı
DALL-E 2 nasıl çalışıyor?