Imagen - Google'ın text-to-image diffusion modeli

xguru · 2022-05-25T09:32:41+09:00

Dili derinlemesine anlayarak gerçekçi görüntüler üreten bir yapay zeka modeli İnsanlarla yapılan değerlendirmelerde OpenAI'nin DALL-E 2'sine kıyasla daha çok tercih edilen görüntüler üretiyor → kalite ve görüntü-metin hizalaması açısından Yalnızca araştırma makalesi ve örnek görseller yayımlandı → etik sorunlar gibi nedenlerle dışarıdan kullanılabilecek bir demo sürümünün yayımlanmamasına karar verildi

(imagen.research.google)

10 puan yazan xguru 2022-05-25 | 2 yorum | WhatsApp'ta paylaş

Dili derinlemesine anlayarak gerçekçi görüntüler üreten bir yapay zeka modeli
İnsanlarla yapılan değerlendirmelerde OpenAI'nin DALL-E 2'sine kıyasla daha çok tercih edilen görüntüler üretiyor
→ kalite ve görüntü-metin hizalaması açısından
Yalnızca araştırma makalesi ve örnek görseller yayımlandı
→ etik sorunlar gibi nedenlerle dışarıdan kullanılabilecek bir demo sürümünün yayımlanmamasına karar verildi

2 yorum

kunggom 2022-05-25

Dün kitapçıda, Disney animasyonlarından alınmış karelerin illüstrasyon olarak eklendiği bir Alice Harikalar Diyarında kitabı gördüm; böyle bir modele Alice Harikalar Diyarında'ndaki her sahneyi verirsek nasıl bir sonuç üreteceğini merak ediyorum.

xguru 2022-05-25

DALL·E 2 tanıtıldı
DALL-E 2 nasıl çalışıyor?

Imagen - Google'ın text-to-image diffusion modeli

İlgili okumalar

2 yorum