- Stable Diffusion 3, çoklu konu istemleri, görüntü kalitesi ve yazım doğruluğunda büyük ölçüde iyileştirilmiş performans sunan en güçlü metin-görüntü modelidir
- Henüz geniş kitlelerce kullanılamasa da, erken önizleme için bekleme listesine kayıt alınmaya başlandı
- Bu önizleme aşaması, önceki modellerde olduğu gibi, performans ve güvenliği iyileştirmek için içgörü elde etmek açısından kritik öneme sahiptir
Model kapsamı ve teknoloji
- Stable Diffusion 3 model paketi 800M ile 8B parametre arasında değişen bir aralığa sahiptir
- Bu yaklaşım, temel değerlerle uyumlu ve herkesin erişebileceği bir hedefle şekillendirilmiştir; kullanıcının yaratıcı ihtiyaçlarına en iyi karşılık veren ölçeklenebilirlik ve kalite seçenekleri sunar
- SD3, Diffusion Transformer mimarisini Flow Matching ile birleştirir
- Ayrıntılı teknik rapor yakında yayınlanacak
Güvenli ve sorumlu yapay zeka uygulamaları
- Güvenli ve sorumlu yapay zekaya önem verilir
- Stable Diffusion 3'ün kötüye kullanılmasını engellemek için makul önlemler alınmaktadır; bu, model eğitiminin başından test, değerlendirme ve dağıtım süreçlerine kadar sürdürülen bir süreçtir
- Erken önizlemeye hazırlanırken çok sayıda güvenlik önlemi uygulanmıştır
- Araştırmacılarla, uzmanlarla ve toplulukla sürekli işbirliğiyle modelin açılmasına yaklaşılırken daha yenilikçi adımlar atılacağı beklentisi taşınmaktadır
Taahhüt ve yaratıcılığı canlandırma
- Üretken yapay zekanın açık, güvenli ve herkesin erişebileceği şekilde kalmasını sağlama taahhüdü güçlüdür
- Stable Diffusion 3 ile bireylerin, geliştiricilerin ve şirketlerin yaratıcılıklarını ortaya koymalarına olanak tanıyan uyarlanabilir çözümler sunulacak
- Stable Diffusion 3 piyasaya çıkmadan önce farklı bir görüntü modelini ticari olarak kullanmak isterseniz, Stability AI üyelik sayfasını ziyaret edebilir veya geliştirici platformu üzerinden API'ye erişebilirsiniz
1 yorum
Hacker News yorumları
Yeni bir difüzyon dönüştürücü türü kullanarak akış eşleme ve diğer geliştirmelerle birleştiriyor.
Güvenliğe dair takıntılı yaklaşım, yakın zamandaki Gemini vakasını düşündüğümüzde bir pazarlama fırsatını kaçırmış gibi görünüyor.
Mevcut sansür ortamında, bu sefer "güvenlik"in ne anlama geldiğini görmek ilginç olacak.
Duyuru metninin yarısı, "gerçekten gerçekten sorumlu ve güvenliyiz" demekten ibaret.
Demo görselleri hep 'artwork'.
Metin/yanlış yazım tarafında büyük ilerleme var.
"Güvenlik" kısmını yeniden yazmışlar ama bu sefer AI aracı yerine hayali bir bıçak olan 'Big Knife' koymuşlar.