11 puan yazan xguru 2022-08-16 | 1 yorum | WhatsApp'ta paylaş
  • Latent Diffusion modeli, LAION-5B veritabanındaki 512x512 görseller üzerinde eğitildi
  • Google'ın Imagen'ine benzer şekilde CLIP ViT-L/14 metin kodlayıcısını kullanıyor
  • Hafif yapısı sayesinde 10 GB'tan fazla VRAM'e sahip tek bir GPU ile de çalışabiliyor
  • Stability AI ve LAION araştırmacıları tarafından ortaklaşa geliştirildi ve desteklendi

1 yorum

 
xguru 2022-08-16

Modern sanat illüstrasyonu gibi alanlarda sonuçların DALL-E 2 veya MidJourney'den daha iyi olduğu söyleniyor.
Geliştirici Discord'unda söylendiğine göre M1 Mac'te de çalışıyormuş.
Öncelikle donanım kısıtlarının az olması, herkesin kolayca kullanabilmesi açısından büyük bir avantaj gibi görünüyor.
Elbette açık kaynak olsa da, şimdilik yalnızca akademik kullanım için erişilebiliyor.

DALL-E benzeri bir yapay zeka görüntü üreticisini doğrudan işletmek
Imagen - Google'ın text-to-image diffusion modeli
LAION-400M - 400 milyonluk görüntü-metin çifti veri kümesi