- Sora, metin komutlarına göre gerçekçi ve hayal gücü yüksek sahneler üreten bir yapay zeka modeli
- Kullanıcının prompt'una sadık kalırken görsel kaliteyi koruyor ve 1 dakikaya kadar video üretebiliyor
- Ayrıntılı senaryolar sunan çeşitli prompt'lara göre üretilen video örnekleri tanıtılıyor
- Bu sayfadaki tüm videolar doğrudan Sora tarafından üretildi ve hiç düzenlenmedi
- Sora şu anda risk değerlendirmesi için 'red team' ekiplerine sunuluyor ve görsel sanatçılar, tasarımcılar ve film yapımcılarından geri bildirim alıyor
- OpenAI, araştırmadaki ilerlemeyi paylaşarak dışarıdan geri bildirim almak ve yapay zeka yeteneklerinin geleceğini kamuya göstermek istiyor
Sora'nın yetenekleri
- Karmaşık sahneler, çok sayıda karakter, belirli hareketler ile konu ve arka planın doğru ayrıntılarını üretebiliyor
- Yalnızca kullanıcının prompt'unu değil, fiziksel dünyada şeylerin nasıl var olduğunu da anlıyor
Sora'nın güvenliği
- OpenAI, Sora'yı ürünlerine entegre etmeden önce çeşitli güvenlik önlemleri almayı planlıyor
- Buna yanıltıcı içeriği tespit eden araçların geliştirilmesi ve videonun Sora tarafından üretilip üretilmediğini ayırt edebilen bir sınıflandırıcının geliştirilmesi de dahil
Araştırma teknolojisi
- Sora, gürültüyle dolu bir videodan başlayıp gürültüyü kademeli olarak temizleyerek video üreten bir diffusion modelidir
- GPT modellerine benzer bir transformer mimarisi kullanarak üstün ölçeklenme performansı sunar
GN⁺'un görüşü
- Sora, metin tabanlı komutlarla video üreten yenilikçi bir yapay zeka teknolojisi olarak yaratıcı profesyonellere yeni olanaklar sunuyor
- Güvenlik önlemleri ve geri bildirimler sayesinde gerçek dünyadaki kullanımı öğrenmede ve yapay zeka sistemlerini kademeli olarak güvenli hale getirmede önemli bir rol oynuyor
- Bu teknolojinin, gelecekte AGI'ye (yapay genel zeka) ulaşma yolunda önemli bir kilometre taşı olacağı düşünülüyor
6 yorum
Gerçekten hayran kalmaktan başka bir şey gelmiyor insanın içinden.
7 trilyon alır herhalde...?
Bunun gerçek bir video mu yoksa yapay zekanın oluşturduğu bir video mu olduğunu kabaca bakınca anlamak zor.
Vay... bir an önce denemek istiyorum.
Difüzyon modeli denilen şey, stable diffusion ile aynı yöntem demek oluyor, değil mi?
stock photo veya stock video pazarının işi zor görünüyor..
Üretim kalitesi inanılmaz. Bu kadar hızlı gelişiyor mu?
Hacker News görüşleri