Stable Diffusion 3 duyurusu

xguru · 2024-02-23T09:16:02+09:00

Stable Diffusion 3, çoklu konu istemleri, görüntü kalitesi ve yazım doğruluğunda büyük ölçüde iyileştirilmiş performans sunan en güçlü metin-görüntü modelidir Henüz geniş kitlelerce kullanılamasa da, erken önizleme için bekleme listesine kayıt alınmaya başlandı Bu önizleme aşaması, önceki modellerde olduğu gibi, performans ve güvenliği iyileştirmek için içgörü elde etmek açısından kritik öneme sahiptir Model kapsamı ve teknoloji Stable Diffusion 3 model paketi 800M ile 8B parametre arasında değişen bir aralığa sahiptir Bu yaklaşım, temel değerlerle uyumlu ve herkesin erişebileceği bir hedefle şekillendirilmiştir; kullanıcının yaratıcı ihtiyaçlarına en iyi karşılık veren ölçeklenebilirlik ve kalite seçenekleri sunar SD3, Diffusion Transformer mimarisini Flow Matching ile birleştirir Ayrıntılı teknik rapor yakında yayınlanacak Güvenli ve sorumlu yapay zeka uygulamaları Güvenli ve sorumlu yapay zekaya önem verilir Stable Diffusion 3'ün kötüye kullanılmasını engellemek için makul önlemler alınmaktadır; bu, model eğitiminin başından test, değerlendirme ve dağıtım süreçlerine kadar sürdürülen bir süreçtir Erken önizlemeye hazırlanırken çok sayıda güvenlik önlemi uygulanmıştır Araştırmacılarla, uzmanlarla ve toplulukla sürekli işbirliğiyle modelin açılmasına yaklaşılırken daha yenilikçi adımlar atılacağı beklentisi taşınmaktadır Taahhüt ve yaratıcılığı canlandırma Üretken yapay zekanın açık, güvenli ve herkesin erişebileceği şekilde kalmasını sağlama taahhüdü güçlüdür Stable Diffusion 3 ile bireylerin, geliştiricilerin ve şirketlerin yaratıcılıklarını ortaya koymalarına olanak tanıyan uyarlanabilir çözümler sunulacak Stable Diffusion 3 piyasaya çıkmadan önce farklı bir görüntü modelini ticari olarak kullanmak isterseniz, Stability AI üyelik sayfasını ziyaret edebilir veya geliştirici platformu üzerinden API'ye erişebilirsiniz

(stability.ai)

9 puan yazan xguru 2024-02-23 | 1 yorum | WhatsApp'ta paylaş

Stable Diffusion 3, çoklu konu istemleri, görüntü kalitesi ve yazım doğruluğunda büyük ölçüde iyileştirilmiş performans sunan en güçlü metin-görüntü modelidir
Henüz geniş kitlelerce kullanılamasa da, erken önizleme için bekleme listesine kayıt alınmaya başlandı
Bu önizleme aşaması, önceki modellerde olduğu gibi, performans ve güvenliği iyileştirmek için içgörü elde etmek açısından kritik öneme sahiptir

Model kapsamı ve teknoloji

Stable Diffusion 3 model paketi 800M ile 8B parametre arasında değişen bir aralığa sahiptir
Bu yaklaşım, temel değerlerle uyumlu ve herkesin erişebileceği bir hedefle şekillendirilmiştir; kullanıcının yaratıcı ihtiyaçlarına en iyi karşılık veren ölçeklenebilirlik ve kalite seçenekleri sunar
SD3, Diffusion Transformer mimarisini Flow Matching ile birleştirir
Ayrıntılı teknik rapor yakında yayınlanacak

Güvenli ve sorumlu yapay zeka uygulamaları

Güvenli ve sorumlu yapay zekaya önem verilir
Stable Diffusion 3'ün kötüye kullanılmasını engellemek için makul önlemler alınmaktadır; bu, model eğitiminin başından test, değerlendirme ve dağıtım süreçlerine kadar sürdürülen bir süreçtir
Erken önizlemeye hazırlanırken çok sayıda güvenlik önlemi uygulanmıştır
Araştırmacılarla, uzmanlarla ve toplulukla sürekli işbirliğiyle modelin açılmasına yaklaşılırken daha yenilikçi adımlar atılacağı beklentisi taşınmaktadır

Taahhüt ve yaratıcılığı canlandırma

Üretken yapay zekanın açık, güvenli ve herkesin erişebileceği şekilde kalmasını sağlama taahhüdü güçlüdür
Stable Diffusion 3 ile bireylerin, geliştiricilerin ve şirketlerin yaratıcılıklarını ortaya koymalarına olanak tanıyan uyarlanabilir çözümler sunulacak
Stable Diffusion 3 piyasaya çıkmadan önce farklı bir görüntü modelini ticari olarak kullanmak isterseniz, Stability AI üyelik sayfasını ziyaret edebilir veya geliştirici platformu üzerinden API'ye erişebilirsiniz

1 yorum

xguru 2024-02-23

Hacker News yorumları

Yeni bir difüzyon dönüştürücü türü kullanarak akış eşleme ve diğer geliştirmelerle birleştiriyor.
- Dönüştürücü iyileştirmeleri sayesinde daha iyi ölçeklenebiliyor ve çok modlu girdi alabiliyor.
- Kalite ve güvenliği artırmak için yayınlanacak, ayrıca tüm araç ekosistemiyle birlikte çıkacak.
- En yeni donanımı kullanan yeni bir temel ve tüm boyutlarda sunuluyor.
- Video, 3D gibi alanları mümkün kılıyor.
- Daha fazla GPU'ya ihtiyaç duyuyor.
- Teknik ayrıntılar çok yakında açıklanacak.
- Yeterli GPU ve iyi bir veri setiniz varsa, Sora'ya benzer video üretimi yapılabiliyor.
- 8 milyon ila 80 milyar parametre arasında farklı boyutlarda sunuluyor, bu yüzden her tür GPU'da kullanılabiliyor.
Güvenliğe dair takıntılı yaklaşım, yakın zamandaki Gemini vakasını düşündüğümüzde bir pazarlama fırsatını kaçırmış gibi görünüyor.
- Güvenliğin fazla artırılması nedeniyle çoğu görsel bulanık geliyor; önceki sürümde çalışan istemler SDXL'de bulanık görünüyor.
- Bir sonraki sürümde durum böyleyse Stability API kullanımını bırakacağım.
- Bulanıklık olmadan Stable Diffusion'a yakın kalite ve değer sunan başka bir metin-görsel servisi var mı merak ediyorum.
Mevcut sansür ortamında, bu sefer "güvenlik"in ne anlama geldiğini görmek ilginç olacak.
- DallE ile oyun varlıkları için bir silah görseli üretmeye çalışırken ciddi zorluk yaşadım.
Duyuru metninin yarısı, "gerçekten gerçekten sorumlu ve güvenliyiz" demekten ibaret.
Demo görselleri hep 'artwork'.
- Modelin fotoğraf, teknik çizim ve diğer grafik medya formatlarını da iyi üretebildiğini merak ediyorum.
Metin/yanlış yazım tarafında büyük ilerleme var.
"Güvenlik" kısmını yeniden yazmışlar ama bu sefer AI aracı yerine hayali bir bıçak olan 'Big Knife' koymuşlar.
- "Güvenli ve sorumlu bir bıçak kullanımı olduğuna inanıyoruz. Bu, Big Knife'ın kötü niyetli aktörler tarafından kötüye kullanılmasını engellemek adına mantıklı adımlar attığımızı ifade eder."