DeepFloyd IF - Açık kaynak Text-to-Image modeli

xguru · 2023-04-30T10:03:02+09:00

Stability AI'ın yeni görüntü modeli Mevcut modellere kıyasla dil anlama yeteneği daha yüksek ve fotogerçekçi görüntüler üretiyor T5 Transformer tabanlı Frozen metin kodlayıcısı ile 3 aşamalı piksel difüzyon modülünün birleşimi 64x64, 256x256, 1024x1024px Zero-shot FID skoru 6.66 (COCO veri kümesi)

(github.com/deep-floyd)

14 puan yazan xguru 2023-04-30 | Henüz yorum yok. | WhatsApp'ta paylaş

Stability AI'ın yeni görüntü modeli
Mevcut modellere kıyasla dil anlama yeteneği daha yüksek ve fotogerçekçi görüntüler üretiyor
T5 Transformer tabanlı Frozen metin kodlayıcısı ile 3 aşamalı piksel difüzyon modülünün birleşimi
- 64x64, 256x256, 1024x1024px
Zero-shot FID skoru 6.66 (COCO veri kümesi)

DeepFloyd IF - Açık kaynak Text-to-Image modeli

İlgili okumalar

Henüz yorum yok.