🔑 Öne Çıkanlar
• Daha gerçekçi fizik simülasyonu
• Önceki model nesneleri “ışınlayarak” başarıyı sergilerken, Sora 2 gerçek fiziksel başarısızlıkları ve sekmeleri de uyguluyor.
• Basketbol topunun çembere çarpıp geri sektiği durumlar gibi, fizik kurallarına daha yakın sonuçlar sunuyor.
• Gelişmiş kontrol ve tutarlılık
• Karmaşık talimatları (birden fazla çekim, sahne geçişi, durumun korunması) doğru şekilde takip edebiliyor.
• Sahneler arasında karakterlerin/nesnelerin dünya durumunu (world state) koruyor.
• Stil çeşitliliği
• Gerçekçilik, sinematik, animasyon gibi stillerde yüksek kaliteli video üretimi mümkün.
• Arka plan müziği, ses efektleri ve diyaloğa kadar senkronize ses üretimini destekliyor.
• “Upload yourself” özelliği (Cameos)
• Kullanıcı kısa video ve ses yükliyor → model ilgili kişiyi herhangi bir sahneye ekleyebiliyor.
• Hem görünüşü hem sesi yansıtılıyor.
• Kontrol kullanıcıda kalıyor; erişim izni verme ve silme mümkün.
• iOS için sosyal uygulama ‘Sora’ yayınlandı
• Üretim/remiks/paylaşım işlevleri etrafında kurulu yeni bir sosyal ağ.
• Davetiyeyle başlıyor; önce ABD ve Kanada'da kullanıma sunuluyor.
• Temel kullanım ücretsiz + belirli kullanım sınırı var, Pro model ve ek üretimler ücretli olacak.
• Güvenlik ve sorumlu lansman
• Akış algoritması: geçirilen süreyi optimize etmek yerine “yaratımı teşvik etmeye” odaklı.
• Gençlerin korunması: akış gösterim miktarı sınırlanıyor, ebeveyn kontrolü sunuluyor.
• Telif/hak ve onay: Cameo kullanıcılarına erişim ve silme hakları güvence altına alınıyor.
• Zorbalık/kötüye kullanıma karşı insan moderasyonu güçlendiriliyor.
• Teknik bağlam
• Sora 1 “video için GPT-1” idiyse, Sora 2 bir “GPT-3.5 moment”.
• Daha büyük video verisiyle ön eğitim (pre-training) ve sonradan eğitim (post-training) → dünya simülasyonu modeline bir adım daha.
• Gelecek planları
• sora.com üzerinden de erişilebilecek.
• Pro kullanıcıları için Sora 2 Pro sunulacak.
• API yayınlama planı var.
• Mevcut Sora 1 Turbo kullanılmaya devam edebilecek.
⸻
📝 Kısaca
• Sora 2 = fiziksel olarak daha gelişmiş video ve ses üretim modeli
• İnsan/nesne cameo eklenebiliyor → deneyim sosyal uygulama Sora içinde sunuluyor
• Sosyal + üretim odaklı platform → zaman tüketiminden çok içerik üretimini hedefliyor
• İlk lansman: ABD/Kanada iOS → web/Pro/API genişlemesi planlanıyor
2 yorum
Böyle videoların üretimi artarsa, belki de insanları Shorts bağımlılığından uzaklaştırabilir. Süper araba kullandığım Shorts videolarını kendi yüzümle de yapabiliyorsam, süper araba Shorts videoları ne kadar değerli olur ki?
Hacker News görüşleri
OpenAI'nin Sora'yı bir sosyal ağ, yani TikTok'un yapay zeka versiyonu (AITok) hâline getirmeye çalıştığı görülüyor
Web uygulaması; akış, gönderi beğenileri∙yorumları, kullanıcı profilleri gibi tüketime odaklı bir yapıya yoğunlaşıyor
Video üretimi ikincil bir unsur gibi duruyor; üretilen videolar çok kısa ve ayarlar da basit (yalnızca yatay/dikey seçilebiliyor)
Uzun ya da hikâye odaklı videolar, gelişmiş düzenleme özellikleri gibi şeylerden ne bahsediliyor ne de bunlara dair bir girişim var; Google Flow gibi diğer platformlarla kıyaslandığında işlevsel sınırlamalar büyük
Fizik doğruluğunu test eden videolar eklenmiş, ancak Veo da aynı promptlarda düzgün çalışamıyor
Ayrıca hem oldukça etkileyici hem de epey kötü videoların birlikte paylaşılıyor olması ilginç
Sora physics örnek1
Sora physics örnek2
Veo örnek1
Veo örnek2
Kişisel olarak yenilikçi teknolojiyi ve yapay zekayı seviyorum, ama "TikTok ama yapay zeka"nın toplumsal olarak arzu edilir bir girişim olup olmadığından emin değilim
Bunun hangi belirgin olumlu etkiyi sağlayabileceğini merak ediyorum
Video üretiminin enerji verimliliği dramatik biçimde artmadıkça ya da enerji maliyeti neredeyse sıfıra düşmedikçe
TikTok ölçeğinde büyük çaplı gerçek zamanlı video tüketim hizmetlerinin kârlılık açısından sürdürülebilir olmasının zor olduğunu düşünüyorum
Şu anda gerçek insanların doğrudan yüklediği videolar çok daha düşük enerji ve maliyet gerektiriyor
OpenAI'nin Sora'yı bir sosyal ağ olarak büyütme stratejisi, aslında Midjourney'nin görseller için uzun süredir uyguladığı yaklaşımın aynısı
Midjourney Explore - Videos
Pek çok kişi Midjourney'nin kendine özgü görsel stilini seviyor ve model, puanlama ile etkileşim üzerinden öğreniyor
Görsel üretiminde "estetik" düzeyini ele almak da daha kolay
Meta da yakın zamanda benzer bir girişimde bulundu
Meta, Vibes AI Video'yu duyurdu
Tüketime odaklı akış özelliklerini güçlendirmek kesinlikle net yönlerden biri
Bir başka neden de, birçok kullanıcının aynı boş prompt kutusuna ayrı ayrı kaynak harcayıp benzer sonuçlar üretmesindense
önce iyi örnekler gösterip, ilgili tartışmalar üzerinden daha hızlı şekilde yüksek kaliteli sonuçlara ulaşmanın daha verimli olması
Bu tür teknolojileri her gördüğümde aklıma Jurassic Park'taki Jeff Goldblum repliği geliyor
Patronumuz böyle araçlarla yapılmış, pek de başarılı olmayan yapay zeka videoları gösterip "gelecek bu" diye bağırıyor
Ama bir kez olsun "Bunu gerçekten kim istiyor ve kim izleyecek?" gibi temel soruları sormuyor gibi
Yapay zeka içeriği hâlâ ilk bakışta kendini belli eden sınırlara sahip
Tamamen yapay zekayla üretilmiş bir video akışını kim keyifle izler? Meta açısından insanlara para ödemekten daha ucuza içerik sağlamak güzel olabilir ama
gerçekte bu yalnızca düşük kaliteli bir "slop"
Telif hakkı meselesi fazla gevşek ele alınıyor
Sora, varsayılan olarak kullanıcının fikri mülkiyetini yapay zeka videolarında kullanmaya ayarlı ve kullanıcı ancak açıkça reddederse bunun dışında kalıyor
İlgili haber
Ayrıca bu kadar büyük etki alanına sahip projeleri yürüten kişilerin gerçek hayat deneyiminin az, ışıltılı yeni teknoloji takıntısının ise fazla olduğu ve etkiyle sonuçlara pek aldırmadıkları hissi var
(Meta'nın Vibes'ı da aynı bağlamda)
Haberde bu kısmın bir bot tarafından yazıldığının belirtilmesi nedeniyle, daha güvenilir bir kaynak olup olmadığını merak ediyorum
Grok'ta bir yılı aşkın süredir telifli karakterler serbestçe kullanılıyor ama henüz dava açılmadı
Bu teknolojinin ileride markalara lisanslanarak
çok daha kişiselleştirilmiş reklam videoları üretme imkânı sağlayabileceği akla geliyor
Örneğin gerçekten o kıyafeti sipariş etmeden önce, onu üzerimde göründüğü bir videoyu izleyebilsem bu çok etkileyici olurdu
Eğer gerçek zamanlı üretim de mümkün olursa, bir mağazada aynanın önünden her geçtiğimde üzerimdeki kıyafetin otomatik olarak farklı seçeneklere dönüştüğünü hayal etmek mümkün
Gerçekten heyecan verici bir dönem
İş buraya varırsa fiziksel olarak kıyafet satın alma ihtiyacı da ortadan kalkabilir gibi geliyor
Influencer'lar kendi simüle edilmiş videolarını sosyal medyada paylaşmakla yetinir, fiziksel olarak oraya gitmeden yalnızca deneyim üzerinden tanıtım yapabilir
İlgili meme tweet
Hatta dışarı gerçekten çıkmadan bile arkadaşlarla partideymiş gibi sahte videolar üretip paylaşmak mümkün olacağından
sonuçta evde dondurma yerken bile sosyal medyada hareketli bir hayat sergilenebilir
Buna benzer bir sahneyi zaten Minority Report'ta görmüş gibiyim
Filmde Tom Cruise'un adının reklamlarda doğrudan söylenmesi akılda kalıcıydı
Minority Report - film vikisi
Buna "Virtual Try On (VTO)" deniyor ve statik görsellerde zaten yaygın biçimde kullanılıyor
Video VTO'nun da yakında gelmesi doğal bir beklenti
Sonuçta bu tür video modellerinin en yaygın kullanım alanı, ürünlerin sanal olarak denenmesi gibi kişiselleştirilmiş görselleştirme olabilir
Çünkü insanlar nihayetinde yapay zekadan ziyade insanlarla bağ kurmayı tercih ediyor
Sora ya da VEO, film ve TV içeriği üretiminde de büyük değişiklikler yaratabilir
AR ile mobilya yerleştirme (mobilyayı evde sanal olarak önceden konumlandırma) da zamanında devrim diye sunulmuştu
ama gerçekte neredeyse kimse kullanmıyor
ChatGPT'nin görsel üretiminin ilk haftasında 100 milyondan fazla kullanıcı çekmesinin başlıca nedeni
insanların arkadaşlarının, ailelerinin ve evcil hayvanlarının fotoğraflarını yapay zekayla üretmeyi çok sevmesi
"cameo özelliği"nin de bu viral çekiciliği bir kez daha hedefleyen bir girişim olduğu tahmin ediliyor
PETA itiraz etmediği sürece sorun olmayacaktır
En ilginç nokta şu:
kullanıcı bir kişinin ya da ürünün video klibini prompta eklediğinde
yapay zekanın bu metadata üzerinden gerçekçi videolar üretebilmesi
Teknik olarak bu, önceden gelişmiş veri setleriyle eğitilmiş olmanın sonucu gibi görünüyor
Kullanıcı açısından ise gerçekten işe yarar ticari bir özellik olabilir
Ancak veri odaklı bu tür yenilikler, Google'ın YouTube sayesinde yakında yetişebileceği ve
hatta benzer teknolojileri içeride zaten kullanıyor olabileceği şeyler
Değerli paramı harcayan biri olarak, gerçekte var olmayan bir görüntü ya da manipüle edilmiş ürün görseli aldatmacaya çok yakın
Gerçek ürüne değil, hayale dayanan inceleme ve reklamlar etik açıdan sorunlu
Tüm bu inşa süreci fiilen sonsuz bir yapay zeka kişiselleştirilmiş içerik akışına doğru ilerleme anlamına geliyor
Bireyin dopamin salgısını en üst düzeye çıkarmaya optimize edilmiş bir yapı bu
Bu bana, zevk uğruna tekrarlayan davranışlar üretmeye zorlayan bir düzenek olan Skinner box benzeri bir Torment Nexus hissi veriyor
Şu an için böyle bir yapının enerji ya da kaynak açısından sürdürülebilir olduğu söylenemez
Örnek promptlardan biri olan "mavi ateşten bir kılıç taşıyan bir çocukla şeytani bir ruhun çarpıştığı yoğun bir anime savaşı"
Japon mangası Blue Exorcist ile neredeyse aynı konseptte
Blue Exorcist (viki)
Hatta örnek promptlardan birinde doğrudan "'Studio Ghibli animasyon tarzında, bir çocukla köpeği mavi dağlara tırmanıyor ve uzakta bir köy görünüyor'" ifadesi var
Ejderha karakteri de neredeyse doğrudan How to Train Your Dragon'dan alınmış gibi hissettiriyor
Hak sahipleriyle bir anlaşma mı var, yoksa dava riskini medya ilgisi için mi kullanıyorlar merak ediyorum
Mühendislik açısından bakınca sonuç gerçekten etkileyici
Video kalitesi dikkat çekebilecek kadar yükselmiş ve uncanny valley hissi de oluşuyor
OpenAI'nin bu tür yeni teknolojilere halkı kademeli olarak alıştırma biçimi başarılı
Bu sürümde kısıt çok ama bir iki nesil sonra teknolojik eşiğin aşılacağı hissi var
Örneğin LLM pazarında Gemini 2.5 Pro gerçek bir eşik noktasıydı; Sora da yakında böyle bir dönüm noktasına ulaşabilir
Bir içerik üreticisi açısından, önce çeşitli varlıkları (arka planlar, nesneler vb.) bir set hâlinde oluşturup sonra bunları birçok sahne arasında doğal biçimde bağlayabilen bir özellik ideal olurdu
Süreklilik (
continuity) açısından şaşırtıcı derecede gelişmiş bir videoYine de bazı hatalar hemen göze çarpıyor
Daha karmaşık storyboard sorunlarını nasıl çözeceklerini merak ediyorum
Video, muazzam miktarda kesme ve hızlı kamera geçişiyle süreklilik sorunlarını gizlemiş
Dikkat edilirse her kesitte su mercimeği, snowmobile ve diğer tüm öğeler sürekli değişiyor
Sonuçta yalnızca yüz kısmı tutarlı kalıyor
Genel olarak yapay zeka videolarının tipik sorunları sürüyor; tek bir ortamda 5 saniyeden uzun kalan sahne neredeyse yok
Ördek yarışı sahnesinde de Sam göründüğünde çimen zaten tamamen başka bir şeye dönüşmüş oluyor
Bu demo bile çok sayıda hata içeriyorsa
sıradan kullanıcıların sonuçları muhtemelen çok daha zayıf olacaktır
Gölette baston dövüşü yapılan sahnede bilek açısı anormal biçimde bükülüyor
Gölet dövüşü demosunda tahta sopa bir anda yay biçimine dönüşüyor gibi açıkça "bu yapay zeka" dedirten anlar kolayca fark ediliyor