9 puan yazan xguru 2024-02-23 | 1 yorum | WhatsApp'ta paylaş
  • Stable Diffusion 3, çoklu konu istemleri, görüntü kalitesi ve yazım doğruluğunda büyük ölçüde iyileştirilmiş performans sunan en güçlü metin-görüntü modelidir
  • Henüz geniş kitlelerce kullanılamasa da, erken önizleme için bekleme listesine kayıt alınmaya başlandı
  • Bu önizleme aşaması, önceki modellerde olduğu gibi, performans ve güvenliği iyileştirmek için içgörü elde etmek açısından kritik öneme sahiptir

Model kapsamı ve teknoloji

  • Stable Diffusion 3 model paketi 800M ile 8B parametre arasında değişen bir aralığa sahiptir
  • Bu yaklaşım, temel değerlerle uyumlu ve herkesin erişebileceği bir hedefle şekillendirilmiştir; kullanıcının yaratıcı ihtiyaçlarına en iyi karşılık veren ölçeklenebilirlik ve kalite seçenekleri sunar
  • SD3, Diffusion Transformer mimarisini Flow Matching ile birleştirir
  • Ayrıntılı teknik rapor yakında yayınlanacak

Güvenli ve sorumlu yapay zeka uygulamaları

  • Güvenli ve sorumlu yapay zekaya önem verilir
  • Stable Diffusion 3'ün kötüye kullanılmasını engellemek için makul önlemler alınmaktadır; bu, model eğitiminin başından test, değerlendirme ve dağıtım süreçlerine kadar sürdürülen bir süreçtir
  • Erken önizlemeye hazırlanırken çok sayıda güvenlik önlemi uygulanmıştır
  • Araştırmacılarla, uzmanlarla ve toplulukla sürekli işbirliğiyle modelin açılmasına yaklaşılırken daha yenilikçi adımlar atılacağı beklentisi taşınmaktadır

Taahhüt ve yaratıcılığı canlandırma

  • Üretken yapay zekanın açık, güvenli ve herkesin erişebileceği şekilde kalmasını sağlama taahhüdü güçlüdür
  • Stable Diffusion 3 ile bireylerin, geliştiricilerin ve şirketlerin yaratıcılıklarını ortaya koymalarına olanak tanıyan uyarlanabilir çözümler sunulacak
  • Stable Diffusion 3 piyasaya çıkmadan önce farklı bir görüntü modelini ticari olarak kullanmak isterseniz, Stability AI üyelik sayfasını ziyaret edebilir veya geliştirici platformu üzerinden API'ye erişebilirsiniz

1 yorum

 
xguru 2024-02-23

Hacker News yorumları

  • Yeni bir difüzyon dönüştürücü türü kullanarak akış eşleme ve diğer geliştirmelerle birleştiriyor.

    • Dönüştürücü iyileştirmeleri sayesinde daha iyi ölçeklenebiliyor ve çok modlu girdi alabiliyor.
    • Kalite ve güvenliği artırmak için yayınlanacak, ayrıca tüm araç ekosistemiyle birlikte çıkacak.
    • En yeni donanımı kullanan yeni bir temel ve tüm boyutlarda sunuluyor.
    • Video, 3D gibi alanları mümkün kılıyor.
    • Daha fazla GPU'ya ihtiyaç duyuyor.
    • Teknik ayrıntılar çok yakında açıklanacak.
    • Yeterli GPU ve iyi bir veri setiniz varsa, Sora'ya benzer video üretimi yapılabiliyor.
    • 8 milyon ila 80 milyar parametre arasında farklı boyutlarda sunuluyor, bu yüzden her tür GPU'da kullanılabiliyor.
  • Güvenliğe dair takıntılı yaklaşım, yakın zamandaki Gemini vakasını düşündüğümüzde bir pazarlama fırsatını kaçırmış gibi görünüyor.

    • Güvenliğin fazla artırılması nedeniyle çoğu görsel bulanık geliyor; önceki sürümde çalışan istemler SDXL'de bulanık görünüyor.
    • Bir sonraki sürümde durum böyleyse Stability API kullanımını bırakacağım.
    • Bulanıklık olmadan Stable Diffusion'a yakın kalite ve değer sunan başka bir metin-görsel servisi var mı merak ediyorum.
  • Mevcut sansür ortamında, bu sefer "güvenlik"in ne anlama geldiğini görmek ilginç olacak.

    • DallE ile oyun varlıkları için bir silah görseli üretmeye çalışırken ciddi zorluk yaşadım.
  • Duyuru metninin yarısı, "gerçekten gerçekten sorumlu ve güvenliyiz" demekten ibaret.

  • Demo görselleri hep 'artwork'.

    • Modelin fotoğraf, teknik çizim ve diğer grafik medya formatlarını da iyi üretebildiğini merak ediyorum.
  • Metin/yanlış yazım tarafında büyük ilerleme var.

  • "Güvenlik" kısmını yeniden yazmışlar ama bu sefer AI aracı yerine hayali bir bıçak olan 'Big Knife' koymuşlar.

    • "Güvenli ve sorumlu bir bıçak kullanımı olduğuna inanıyoruz. Bu, Big Knife'ın kötü niyetli aktörler tarafından kötüye kullanılmasını engellemek adına mantıklı adımlar attığımızı ifade eder."