10 puan yazan clumsypupil 2025-10-01 | 2 yorum | WhatsApp'ta paylaş

🔑 Öne Çıkanlar
• Daha gerçekçi fizik simülasyonu
• Önceki model nesneleri “ışınlayarak” başarıyı sergilerken, Sora 2 gerçek fiziksel başarısızlıkları ve sekmeleri de uyguluyor.
• Basketbol topunun çembere çarpıp geri sektiği durumlar gibi, fizik kurallarına daha yakın sonuçlar sunuyor.
• Gelişmiş kontrol ve tutarlılık
• Karmaşık talimatları (birden fazla çekim, sahne geçişi, durumun korunması) doğru şekilde takip edebiliyor.
• Sahneler arasında karakterlerin/nesnelerin dünya durumunu (world state) koruyor.
• Stil çeşitliliği
• Gerçekçilik, sinematik, animasyon gibi stillerde yüksek kaliteli video üretimi mümkün.
• Arka plan müziği, ses efektleri ve diyaloğa kadar senkronize ses üretimini destekliyor.
• “Upload yourself” özelliği (Cameos)
• Kullanıcı kısa video ve ses yükliyor → model ilgili kişiyi herhangi bir sahneye ekleyebiliyor.
• Hem görünüşü hem sesi yansıtılıyor.
• Kontrol kullanıcıda kalıyor; erişim izni verme ve silme mümkün.
• iOS için sosyal uygulama ‘Sora’ yayınlandı
• Üretim/remiks/paylaşım işlevleri etrafında kurulu yeni bir sosyal ağ.
• Davetiyeyle başlıyor; önce ABD ve Kanada'da kullanıma sunuluyor.
• Temel kullanım ücretsiz + belirli kullanım sınırı var, Pro model ve ek üretimler ücretli olacak.
• Güvenlik ve sorumlu lansman
• Akış algoritması: geçirilen süreyi optimize etmek yerine “yaratımı teşvik etmeye” odaklı.
• Gençlerin korunması: akış gösterim miktarı sınırlanıyor, ebeveyn kontrolü sunuluyor.
• Telif/hak ve onay: Cameo kullanıcılarına erişim ve silme hakları güvence altına alınıyor.
• Zorbalık/kötüye kullanıma karşı insan moderasyonu güçlendiriliyor.
• Teknik bağlam
• Sora 1 “video için GPT-1” idiyse, Sora 2 bir “GPT-3.5 moment”.
• Daha büyük video verisiyle ön eğitim (pre-training) ve sonradan eğitim (post-training) → dünya simülasyonu modeline bir adım daha.
• Gelecek planları
• sora.com üzerinden de erişilebilecek.
• Pro kullanıcıları için Sora 2 Pro sunulacak.
• API yayınlama planı var.
• Mevcut Sora 1 Turbo kullanılmaya devam edebilecek.

📝 Kısaca
• Sora 2 = fiziksel olarak daha gelişmiş video ve ses üretim modeli
• İnsan/nesne cameo eklenebiliyor → deneyim sosyal uygulama Sora içinde sunuluyor
• Sosyal + üretim odaklı platform → zaman tüketiminden çok içerik üretimini hedefliyor
• İlk lansman: ABD/Kanada iOS → web/Pro/API genişlemesi planlanıyor

2 yorum

 
colus001 2025-10-01

Böyle videoların üretimi artarsa, belki de insanları Shorts bağımlılığından uzaklaştırabilir. Süper araba kullandığım Shorts videolarını kendi yüzümle de yapabiliyorsam, süper araba Shorts videoları ne kadar değerli olur ki?

 
GN⁺ 2025-10-01
Hacker News görüşleri
  • OpenAI'nin Sora'yı bir sosyal ağ, yani TikTok'un yapay zeka versiyonu (AITok) hâline getirmeye çalıştığı görülüyor
    Web uygulaması; akış, gönderi beğenileri∙yorumları, kullanıcı profilleri gibi tüketime odaklı bir yapıya yoğunlaşıyor
    Video üretimi ikincil bir unsur gibi duruyor; üretilen videolar çok kısa ve ayarlar da basit (yalnızca yatay/dikey seçilebiliyor)
    Uzun ya da hikâye odaklı videolar, gelişmiş düzenleme özellikleri gibi şeylerden ne bahsediliyor ne de bunlara dair bir girişim var; Google Flow gibi diğer platformlarla kıyaslandığında işlevsel sınırlamalar büyük
    Fizik doğruluğunu test eden videolar eklenmiş, ancak Veo da aynı promptlarda düzgün çalışamıyor
    Ayrıca hem oldukça etkileyici hem de epey kötü videoların birlikte paylaşılıyor olması ilginç
    Sora physics örnek1
    Sora physics örnek2
    Veo örnek1
    Veo örnek2

    • Kişisel olarak yenilikçi teknolojiyi ve yapay zekayı seviyorum, ama "TikTok ama yapay zeka"nın toplumsal olarak arzu edilir bir girişim olup olmadığından emin değilim
      Bunun hangi belirgin olumlu etkiyi sağlayabileceğini merak ediyorum

    • Video üretiminin enerji verimliliği dramatik biçimde artmadıkça ya da enerji maliyeti neredeyse sıfıra düşmedikçe
      TikTok ölçeğinde büyük çaplı gerçek zamanlı video tüketim hizmetlerinin kârlılık açısından sürdürülebilir olmasının zor olduğunu düşünüyorum
      Şu anda gerçek insanların doğrudan yüklediği videolar çok daha düşük enerji ve maliyet gerektiriyor

    • OpenAI'nin Sora'yı bir sosyal ağ olarak büyütme stratejisi, aslında Midjourney'nin görseller için uzun süredir uyguladığı yaklaşımın aynısı
      Midjourney Explore - Videos
      Pek çok kişi Midjourney'nin kendine özgü görsel stilini seviyor ve model, puanlama ile etkileşim üzerinden öğreniyor
      Görsel üretiminde "estetik" düzeyini ele almak da daha kolay

    • Meta da yakın zamanda benzer bir girişimde bulundu
      Meta, Vibes AI Video'yu duyurdu

    • Tüketime odaklı akış özelliklerini güçlendirmek kesinlikle net yönlerden biri
      Bir başka neden de, birçok kullanıcının aynı boş prompt kutusuna ayrı ayrı kaynak harcayıp benzer sonuçlar üretmesindense
      önce iyi örnekler gösterip, ilgili tartışmalar üzerinden daha hızlı şekilde yüksek kaliteli sonuçlara ulaşmanın daha verimli olması

  • Bu tür teknolojileri her gördüğümde aklıma Jurassic Park'taki Jeff Goldblum repliği geliyor
    Patronumuz böyle araçlarla yapılmış, pek de başarılı olmayan yapay zeka videoları gösterip "gelecek bu" diye bağırıyor
    Ama bir kez olsun "Bunu gerçekten kim istiyor ve kim izleyecek?" gibi temel soruları sormuyor gibi
    Yapay zeka içeriği hâlâ ilk bakışta kendini belli eden sınırlara sahip

    • Meta'nın Vibes uygulamasını görünce de benzer şeyi düşündüm
      Tamamen yapay zekayla üretilmiş bir video akışını kim keyifle izler? Meta açısından insanlara para ödemekten daha ucuza içerik sağlamak güzel olabilir ama
      gerçekte bu yalnızca düşük kaliteli bir "slop"
  • Telif hakkı meselesi fazla gevşek ele alınıyor
    Sora, varsayılan olarak kullanıcının fikri mülkiyetini yapay zeka videolarında kullanmaya ayarlı ve kullanıcı ancak açıkça reddederse bunun dışında kalıyor
    İlgili haber
    Ayrıca bu kadar büyük etki alanına sahip projeleri yürüten kişilerin gerçek hayat deneyiminin az, ışıltılı yeni teknoloji takıntısının ise fazla olduğu ve etkiyle sonuçlara pek aldırmadıkları hissi var
    (Meta'nın Vibes'ı da aynı bağlamda)

    • Haberde bu kısmın bir bot tarafından yazıldığının belirtilmesi nedeniyle, daha güvenilir bir kaynak olup olmadığını merak ediyorum

    • Grok'ta bir yılı aşkın süredir telifli karakterler serbestçe kullanılıyor ama henüz dava açılmadı

  • Bu teknolojinin ileride markalara lisanslanarak
    çok daha kişiselleştirilmiş reklam videoları üretme imkânı sağlayabileceği akla geliyor
    Örneğin gerçekten o kıyafeti sipariş etmeden önce, onu üzerimde göründüğü bir videoyu izleyebilsem bu çok etkileyici olurdu
    Eğer gerçek zamanlı üretim de mümkün olursa, bir mağazada aynanın önünden her geçtiğimde üzerimdeki kıyafetin otomatik olarak farklı seçeneklere dönüştüğünü hayal etmek mümkün
    Gerçekten heyecan verici bir dönem

    • İş buraya varırsa fiziksel olarak kıyafet satın alma ihtiyacı da ortadan kalkabilir gibi geliyor
      Influencer'lar kendi simüle edilmiş videolarını sosyal medyada paylaşmakla yetinir, fiziksel olarak oraya gitmeden yalnızca deneyim üzerinden tanıtım yapabilir
      İlgili meme tweet
      Hatta dışarı gerçekten çıkmadan bile arkadaşlarla partideymiş gibi sahte videolar üretip paylaşmak mümkün olacağından
      sonuçta evde dondurma yerken bile sosyal medyada hareketli bir hayat sergilenebilir

    • Buna benzer bir sahneyi zaten Minority Report'ta görmüş gibiyim
      Filmde Tom Cruise'un adının reklamlarda doğrudan söylenmesi akılda kalıcıydı
      Minority Report - film vikisi

    • Buna "Virtual Try On (VTO)" deniyor ve statik görsellerde zaten yaygın biçimde kullanılıyor
      Video VTO'nun da yakında gelmesi doğal bir beklenti

    • Sonuçta bu tür video modellerinin en yaygın kullanım alanı, ürünlerin sanal olarak denenmesi gibi kişiselleştirilmiş görselleştirme olabilir
      Çünkü insanlar nihayetinde yapay zekadan ziyade insanlarla bağ kurmayı tercih ediyor
      Sora ya da VEO, film ve TV içeriği üretiminde de büyük değişiklikler yaratabilir

    • AR ile mobilya yerleştirme (mobilyayı evde sanal olarak önceden konumlandırma) da zamanında devrim diye sunulmuştu
      ama gerçekte neredeyse kimse kullanmıyor

  • ChatGPT'nin görsel üretiminin ilk haftasında 100 milyondan fazla kullanıcı çekmesinin başlıca nedeni
    insanların arkadaşlarının, ailelerinin ve evcil hayvanlarının fotoğraflarını yapay zekayla üretmeyi çok sevmesi
    "cameo özelliği"nin de bu viral çekiciliği bir kez daha hedefleyen bir girişim olduğu tahmin ediliyor

    • Neyse ki evcil hayvanları yapay zeka videolarında kullanmak için ayrıca onay gerekmiyor
      PETA itiraz etmediği sürece sorun olmayacaktır
  • En ilginç nokta şu:
    kullanıcı bir kişinin ya da ürünün video klibini prompta eklediğinde
    yapay zekanın bu metadata üzerinden gerçekçi videolar üretebilmesi
    Teknik olarak bu, önceden gelişmiş veri setleriyle eğitilmiş olmanın sonucu gibi görünüyor
    Kullanıcı açısından ise gerçekten işe yarar ticari bir özellik olabilir
    Ancak veri odaklı bu tür yenilikler, Google'ın YouTube sayesinde yakında yetişebileceği ve
    hatta benzer teknolojileri içeride zaten kullanıyor olabileceği şeyler

    • Yapay zekanın ürün videolarına eklenmesini hiç istemiyorum
      Değerli paramı harcayan biri olarak, gerçekte var olmayan bir görüntü ya da manipüle edilmiş ürün görseli aldatmacaya çok yakın
      Gerçek ürüne değil, hayale dayanan inceleme ve reklamlar etik açıdan sorunlu
  • Tüm bu inşa süreci fiilen sonsuz bir yapay zeka kişiselleştirilmiş içerik akışına doğru ilerleme anlamına geliyor
    Bireyin dopamin salgısını en üst düzeye çıkarmaya optimize edilmiş bir yapı bu

    • Bu bana, zevk uğruna tekrarlayan davranışlar üretmeye zorlayan bir düzenek olan Skinner box benzeri bir Torment Nexus hissi veriyor

    • Şu an için böyle bir yapının enerji ya da kaynak açısından sürdürülebilir olduğu söylenemez

  • Örnek promptlardan biri olan "mavi ateşten bir kılıç taşıyan bir çocukla şeytani bir ruhun çarpıştığı yoğun bir anime savaşı"
    Japon mangası Blue Exorcist ile neredeyse aynı konseptte
    Blue Exorcist (viki)

    • Hatta örnek promptlardan birinde doğrudan "'Studio Ghibli animasyon tarzında, bir çocukla köpeği mavi dağlara tırmanıyor ve uzakta bir köy görünüyor'" ifadesi var

    • Ejderha karakteri de neredeyse doğrudan How to Train Your Dragon'dan alınmış gibi hissettiriyor
      Hak sahipleriyle bir anlaşma mı var, yoksa dava riskini medya ilgisi için mi kullanıyorlar merak ediyorum

  • Mühendislik açısından bakınca sonuç gerçekten etkileyici
    Video kalitesi dikkat çekebilecek kadar yükselmiş ve uncanny valley hissi de oluşuyor
    OpenAI'nin bu tür yeni teknolojilere halkı kademeli olarak alıştırma biçimi başarılı
    Bu sürümde kısıt çok ama bir iki nesil sonra teknolojik eşiğin aşılacağı hissi var
    Örneğin LLM pazarında Gemini 2.5 Pro gerçek bir eşik noktasıydı; Sora da yakında böyle bir dönüm noktasına ulaşabilir
    Bir içerik üreticisi açısından, önce çeşitli varlıkları (arka planlar, nesneler vb.) bir set hâlinde oluşturup sonra bunları birçok sahne arasında doğal biçimde bağlayabilen bir özellik ideal olurdu

  • Süreklilik (continuity) açısından şaşırtıcı derecede gelişmiş bir video
    Yine de bazı hatalar hemen göze çarpıyor

    1. 0:23 - kırmızı montlu polo oyuncusu eldiven giyiyor ama sonraki sahnede eldivenler yok
    2. 1:05 - ejderha uçurum boyunca yükselirken yakın planda yönü tersine dönüyor, karakterlerin kıyafetleri de değişiyor
    3. 1:45 - ördek yarışı sahnesinde ördek virajı düzgün alamayıp duvara yöneliyor
      Daha karmaşık storyboard sorunlarını nasıl çözeceklerini merak ediyorum
    • Video, muazzam miktarda kesme ve hızlı kamera geçişiyle süreklilik sorunlarını gizlemiş
      Dikkat edilirse her kesitte su mercimeği, snowmobile ve diğer tüm öğeler sürekli değişiyor
      Sonuçta yalnızca yüz kısmı tutarlı kalıyor
      Genel olarak yapay zeka videolarının tipik sorunları sürüyor; tek bir ortamda 5 saniyeden uzun kalan sahne neredeyse yok

    • Ördek yarışı sahnesinde de Sam göründüğünde çimen zaten tamamen başka bir şeye dönüşmüş oluyor

    • Bu demo bile çok sayıda hata içeriyorsa
      sıradan kullanıcıların sonuçları muhtemelen çok daha zayıf olacaktır

    • Gölette baston dövüşü yapılan sahnede bilek açısı anormal biçimde bükülüyor

    • Gölet dövüşü demosunda tahta sopa bir anda yay biçimine dönüşüyor gibi açıkça "bu yapay zeka" dedirten anlar kolayca fark ediliyor