7 puan yazan GN⁺ 2024-12-17 | 1 yorum | WhatsApp'ta paylaş
  • Veo 2, gerçekçi hareketler ve 4K'ya kadar yüksek kaliteli çıktı sunan son teknoloji bir video üretim modeli
  • Farklı stilleri keşfetmeye ve kapsamlı kamera kontrolleriyle kendi tarzınızı bulmaya olanak tanıyor
  • Kalite ve kontrolün yeniden tanımlanması
    • Veo 2, basit ve karmaşık komutları sadakatle takip ediyor; gerçek dünyadaki fiziği ve çeşitli görsel stilleri ikna edici biçimde simüle ediyor
    • Geliştirilmiş gerçekçilik ve sadakat: Ayrıntı, gerçekçilik ve artefaktların azaltılması açısından diğer yapay zeka video modellerine göre önemli ölçüde iyileştirildi
    • Gelişmiş hareket yetenekleri: Fizik anlayışı ve ayrıntılı komutları izleme becerisi sayesinde hareketleri yüksek doğrulukla ifade ediyor
    • Daha fazla kamera kontrol seçeneği: Çeşitli çekim stillerini, açıları ve hareketleri doğru şekilde yorumlayıp üretiyor
  • Benchmark
    • Veo, insan değerlendiricilerin diğer önde gelen video üretim modelleriyle yaptığı karşılaştırmalarda son teknoloji sonuçlara ulaştı
    • 1003 prompt ve bunlara karşılık gelen videolar MovieGenBench'te değerlendirildi; Veo 2, genel tercih ve promptları doğru şekilde takip etme yeteneğinde en yüksek performansı gösterdi
  • Sınırlamalar
    • Veo 2, gerçekçi, dinamik ve karmaşık videolar üretmede kayda değer ilerleme göstermiş olsa da karmaşık sahnelerde veya karmaşık hareketler içeren sahnelerde tam tutarlılığı korumak hâlâ bir zorluk
    • Bu alanlardaki performansı geliştirmeye ve iyileştirmeye devam etmeyi planlıyorlar

1 yorum

 
GN⁺ 2024-12-17
Hacker News yorumu
  • Bir kullanıcı, "A pelican riding a bicycle along a coastal path overlooking a harbor" istemiyle üretilen videoya dair geri bildirim paylaştı. Dört sürümden ikisinde bisiklete binen pelikan, birinde yolda koşan pelikan, birinde bisikletin üzerinde oturan pelikan vardı; sonuncusunda ise garip bir kask takan bir pelikan yer alıyordu. Sonuçlar Sora'dan daha iyiydi

  • Kullanıcı tercihinde Sora Turbo'yu 2:1 yenmesi etkileyici. Sora'ya benzer kısıtlamaları var, ancak doğal hareketi ve fiziği biraz daha iyi taklit ediyor gibi görünüyor. Blog gönderisinde, 4K çözünürlüğe kadar ölçeklenebildiği ve süresinin birkaç dakikaya kadar uzayabildiği anlatılıyor

  • Duyuruda sunulan örneklerle eğitim verisi arasındaki benzerlik merak ediliyor. İstemdeki ayrıntıların sonuca ne kadar yansıdığı sorgulanıyor. Örneğin, DJ'in çekici varlığı ve müziğin gücüne dair açıklamanın videoyu nasıl etkilediği merak ediliyor

  • Kaykay videosu gerçekçi değil, ancak bazı videolar oldukça inandırıcı görünüyor

  • Sayfanın iPad'de Chrome'da çöktüğü belirtiliyor

  • Google'ın büyük duyurusundan sonra OpenAI, Sora ön izlemesini yayımlayarak Google'ı gölgede bırakmıştı; ancak Veo 2, Sora'dan daha ileri görünüyor

  • Bir TV kanalında çalışan arkadaşının, bu araçları kamu spotu programları için şimdiden kullandığı söyleniyor

  • Google'ın, YouTube'a erişimi sayesinde metin/görüntüden videoya geçiş alanına hakim olabileceği düşünülüyor

  • Veo 2'nin örnek uzunluğunun 8 saniye, VideoGen'in 10 saniye ve diğer modellerin 5 saniye olması kafa karıştırıcı bulunuyor. Veo 2'nin olumlu sonuçlarının, daha uzun videoları tercih eden değerlendiricilerden kaynaklanıp kaynaklanmadığı sorgulanıyor

  • Google'ın yapay zeka birimi, OpenAI'nin gösterişli yatına kıyasla devasa bir nükleer denizaltıya benzetiliyor. Google'ın AGI'ye yaklaşmış olabileceği öne sürülüyor; Microsoft ve Amazon'un durumu da anılıyor