11 puan yazan GN⁺ 2024-05-15 | 2 yorum | WhatsApp'ta paylaş
  • Veo, şu ana kadarki en güçlü video üretim modeli.
  • Yüksek kaliteli 1080p çözünürlükte 1 dakikadan uzun videolar üretebiliyor.
  • Çeşitli sinematik ve görsel stilleri destekliyor.
  • Prompt’lardaki nüansı ve tonu doğru şekilde yakalıyor, yaratıcı kontrol sağlıyor.
  • Time-lapse çekim veya manzaranın havadan çekimi gibi sinematik efektleri anlıyor.
  • Video üretimini herkes için erişilebilir hale getirmeye yardımcı oluyor.
  • Deneyimli film yapımcıları, içerik üreticileri, eğitimciler ve diğerleri için yeni olanaklar açıyor.
  • Bazı özelliklerini VideoFX adlı yeni deneysel araç üzerinden sunmayı planlıyor.
  • Gelecekte Veo’nun yeteneklerini YouTube Shorts ve diğer ürünlere de uygulamayı hedefliyor.

Dil ve görseli daha derin anlama

  • Metin prompt’larını doğru yorumlaması ve bunları ilgili görsel referanslarla birleştirmesi gerekiyor.
  • Doğal dili ve görsel anlamı ileri düzeyde anlayarak prompt’lara sadık videolar üretiyor.
  • Karmaşık sahnelerde ayrıntıları incelikli biçimde render ediyor.

Film yapımı için kontrol özellikleri

  • Girdi videosu ve düzenleme komutları verildiğinde, Veo bunları uygulayarak yeni düzenlenmiş bir video üretiyor.
  • Maske düzenlemeyi destekleyerek videonun belirli alanlarını değiştirebiliyor.
  • Görsel ve metin prompt’ları birlikte verildiğinde, bu stil ve yönergeleri izleyen videolar üretiyor.
  • Tek bir prompt veya bir prompt dizisiyle 60 saniyeden uzun video klipleri üretebiliyor ve genişletebiliyor.

Video kareleri arasında tutarlılığı koruma

  • Video üretim modellerinde görsel tutarlılığı korumak önemli bir zorluk.
  • Veo’nun en yeni latent diffusion transformer’ı bu tür tutarsızlıkların ortaya çıkmasını azaltıyor.
  • Karakterleri, nesneleri ve stili gerçekçi biçimde koruyor.

Yıllara dayanan video üretim araştırmalarına dayanıyor

  • Veo; Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet, Lumiere ve benzeri araştırmalara dayanıyor.
  • Transformer mimarisini ve Gemini’ı kullanıyor.
  • Prompt’ları daha doğru anlamak ve izlemek için her videonun açıklamasına daha fazla ayrıntı ekliyor.
  • Performansı artırmak için yüksek kaliteli sıkıştırılmış video temsilleri kullanıyor.

Sorumlu tasarım

  • Veo’nun dünyaya sorumlu biçimde sunulması önemli.
  • Veo tarafından üretilen videolara SynthID kullanılarak filigran ekleniyor.
  • Güvenlik filtreleri ve bellek kontrol süreçleriyle gizlilik, telif hakkı ve önyargı risklerini azaltıyor.
  • Veo’nun geleceğini, önde gelen içerik üreticileri ve film yapımcılarıyla iş birliği içinde şekillendiriyor.
  • Onların geri bildirimleriyle üretken video teknolojisini geliştirip daha geniş yaratıcı topluluğa fayda sağlamayı hedefliyor.

GN⁺ görüşü

  • Veo’nun yenilikçiliği: Veo, yüksek kaliteli bir video üretim modeli olarak yaratıcılar için yeni olanaklar açıyor.
  • Eğitimde kullanım: Eğitimcilerin videolar aracılığıyla bilgi aktarmasında büyük fayda sağlayabilir.
  • Sorumlu teknoloji kullanımı: Veo, filigran ve güvenlik filtreleri sayesinde sorumlu biçimde kullanılabilir.
  • Rakip ürünler: Benzer özellikler sunan diğer video üretim modelleriyle karşılaştırılması gerekiyor.
  • Teknoloji benimseme değerlendirmeleri: Veo’yu kullanıma alırken gizlilik ve telif hakkı konuları yeterince dikkate alınmalı.

2 yorum

 
xguru 2024-05-15

Yine de Sora olmasaydı gayet harika olurdu ama... insan karşılaştırmadan edemiyor. Google nasıl oldu da bu hale geldi hüzün

 
GN⁺ 2024-05-15
Hacker News görüşü

Hacker News yorumları özeti

  • Film yapımı açısından sınırlamalar

    • Görüş: Mevcut teknoloji film yapımı üzerinde henüz büyük bir etki yaratmıyor. Yönetmenin somut talimatlar verebileceği özelliklere ihtiyaç var. Şu anda daha çok B-roll içeriği düzeyinde.
  • Google'ın SynthID teknolojisi

    • Görüş: Google, yapay zeka tarafından üretilen videolara filigran eklemek için SynthID teknolojisini kullanıyor. Bu teknoloji yalnızca videolara değil, görsellere, metne ve sese de uygulanıyor.
  • Sora ile karşılaştırma

    • Görüş: Sora daha etkileyici görünüyor. Sora, uzun klipleri ve hızlı hareketleri iyi işliyor. Buna karşılık, mevcut demoda yalnızca kısa klipler ve yavaş hareketler var. Karşılaştırmaya en yakın örnek yalnızca siberpunk video, ancak onda da tutarlılık eksik.
  • 60 saniyelik örnek video

  • İnsan videolarının yokluğu

    • Görüş: İnsanların yer aldığı videoların olmaması, teknolojinin insan üretmekte zorlandığını gösteriyor olabilir.
  • Film çekim süresindeki değişim

    • Görüş: 2014 tarihli bir Wired makalesine göre, İngilizce filmlerde ortalama çekim süresi 1930'larda 12 saniyeyken bugün 2,5 saniyeye düşmüş durumda. Bu teknolojinin gerçek dünyada daha büyük bir etkisi olabilir. Wired makalesi bağlantısı
  • Demo videoya dair izlenim

    • Görüş: Demo video ilgi çekici. Ancak Sora demosuyla karşılaştırıldığında etkileyici değil. Google'dan gelen bir duyuru için beklentinin altında kalıyor. Sora henüz yayımlanmadı ve Veo'nun daha fazlasını sunması mümkün olabilir.
  • Tutarlılığın nasıl korunduğu

    • Görüş: Veo'nun en güncel teknolojisinin tutarlılığı nasıl koruduğu merak ediliyor. Kareler arasında zamansal hafıza olup olmadığı sorgulanıyor.
  • Westworld ile benzerlik

    • Görüş: İlk örnek prompt'un küçük görseli, 1973 yapımı Westworld'deki Gunslinger androidine benziyor. Bu, o dönemde bilgisayar grafiğinin erken kullanım örneklerinden biriydi. YouTube bağlantısı
  • Donald Glover segmentindeki kafa karışıklığı

    • Görüş: Donald Glover segmenti kafa karıştırıcı bulundu. Yalnızca birkaç kısa klip sunulduğu için kısa film beklentisi oluştu, ancak sonuç hayal kırıklığı yarattı.