9 puan yazan xguru 2023-07-28 | 2 yorum | WhatsApp'ta paylaş
  • En gelişmiş metinden görsele model
    • Önceki sürüme kıyasla daha canlı ve doğru renkler ile daha iyi kontrast, gölgeler ve aydınlatma sunuyor
    • 3,5 milyar parametre
  • Birkaç saniye içinde 1 megapiksel çözünürlükte görseller üretebiliyor
  • Özelleştirilebilir ve kavramlar ile stiller için fine-tuning yapılabiliyor
  • Metin üretimi de iyileştirildi; gelişmiş metin üretimi ve okunabilirlik artırıldı
  • Inpainting, outpainting ve image-to-image prompt'larını destekliyor

2 yorum

 
ninebow 2023-07-28

Resmî duyuru yazısını GPT-4 ile ayrıntılı açıklama olarak otomatik oluşturmaya çalıştım.


SDXL 1.0 duyurusu (ANNOUNCING SDXL 1.0)

Giriş

Stability AI ekibi, metinden görsele üretim modellerinin evrimindeki bir sonraki adım olan SDXL 1.0'ı açık model olarak yayımlamaktan gurur duyuyor. SDXL 0.9'un sınırlı ve yalnızca araştırma amaçlı sürümünün ardından, SDXL'in tam sürümü dünyanın en iyi açık görsel üretim modeli olacak şekilde geliştirildi.

Özet

  • SDXL 1.0, Stability AI'ın amiral gemisi görsel modelidir ve görsel üretimi için en iyi açık modeldir. Bunu çeşitli diğer modellerle karşılaştırdık ve sonuç olarak insanların, diğer açık modeller yerine SDXL 1.0 tarafından üretilen görselleri tercih ettiği sonucuna vardık. Bu araştırma sonucu, Discord'umuzda deneysel modellerin üretimlerinden toplanan haftalar süren tercih verileri ile dış testlerden elde edilen bulgulara dayanmaktadır.

  • SDXL, neredeyse tüm sanat stillerinde yüksek kaliteli görseller üretir ve fotogerçekçilik için en iyi açık modeldir. Benzersiz görseller, modele özgü belirli bir "his" dayatılmadan prompt'lanabilir; bu da stil açısından mutlak özgürlük sağlar. SDXL 1.0 özellikle canlı ve doğru renklere iyi ayarlanmıştır; önceki sürümüne göre daha iyi kontrast, aydınlatma ve gölgelere sahiptir. Ayrıca SDXL, görsel modellerin render etmekte zorlandığı kavramları da üretebilir; örneğin eller ve metin ya da mekânsal olarak düzenlenmiş kompozisyonlar (ör. arka planda bir köpeği kovalayan bir kadın).

  • SDXL, karmaşık, ayrıntılı ve estetik açıdan tatmin edici görseller üretmek için yalnızca birkaç kelimeye ihtiyaç duyar. Kullanıcıların artık yüksek kaliteli görseller elde etmek için "şaheser" gibi niteleyici terimleri kullanması gerekmez. Ayrıca SDXL, 'The Red Square' (ünlü bir yer) ile 'red square' (bir şekil) gibi kavramlar arasındaki farkı anlayabilir.

  • SDXL 1.0, açık erişimli görsel modeller arasında en yüksek parametre sayısına sahiptir ve 3.5B parametreli bir base model ile 6.6B parametreli bir refiner'dan oluşan yenilikçi yeni bir mimariyi temel alır. Tüm model, latent diffusion için bir uzman karışımı pipeline'ından oluşur: ilk aşamada base model, (gürültülü) latent'leri üretir; bunlar daha sonra son denoising adımına uzmanlaşmış bir refinement modeli tarafından işlenir. Referans olması açısından, base model bağımsız bir modül olarak da kullanılabilir. Bu iki aşamalı mimari, görsel üretimi için sağlam bir yaklaşım sunar ve daha da iyileştirilmiş sonuçlar sağlar.

Referanslar

Stability AI Blog: Stability AI blogu, şirketin en son araştırmaları ve duyuruları hakkında ayrıntılı bilgi sunar. Bu blog aracılığıyla SDXL 1.0 gibi en yeni modeller hakkında ek bilgiler edinebilirsiniz.
https://stability.ai/blog

Stable Diffusion: Bu web sitesi, Stability AI'ın Stable Diffusion teknolojisi hakkında ayrıntılı bilgi sunar. Bu teknoloji, SDXL 1.0'ın temel bileşenlerinden biridir ve bu site aracılığıyla teknoloji hakkında daha derin bir anlayış kazanabilirsiniz.
https://stability.ai/stable-diffusion

Discord Community: Bu Discord topluluğu, Stability AI araştırmacıları ile kullanıcılarının bir araya gelerek çalışmalarını paylaştığı ve tartıştığı yerdir. Bu topluluk aracılığıyla SDXL 1.0 gibi modelleri kullanan diğer kişilerin deneyimlerini duyabilirsiniz.
https://discord.gg/stablediffusion

 
ninebow 2023-07-28

StabilityAI'nin resmi duyuru yazısında biraz daha ayrıntılı bilgi var; bağlantıyı bırakayım. :)

https://stability.ai/blog/stable-diffusion-sdxl-1-announcement