5 puan yazan davespark 2025-10-26 | Henüz yorum yok. | WhatsApp'ta paylaş

📝 TL;DR

  • LTX-2 = açık kaynak çok modlu video üretim modelleri için yeni ölçüt
  • 4K+ses, tüketici sınıfı donanımda gerçek zamanlı üretiliyor
  • Kasım sonundan itibaren model ağırlıkları+kod+benchmark’ların tamamı açık olacak
  • Lightricks tarafından geliştirildi, arXiv makalesi yayımlandı

🔑 Öne Çıkanlar

  • Açık kaynakta ilk ses-video senkronize üretim modeli

    • Sora 2 ve Movie Gen ticari/kapalıyken, LTX-2 kasım sonunda tamamen açık kaynak olarak yayımlanacak
    • 4K 50fps, en fazla 10 saniyelik video + senkronize ses üretimi
  • Gerçek zamandan daha hızlı üretim hızı

    • H100: 768x512 çözünürlükte, 5 saniyelik 24fps videoyu sadece 2 saniyede üretiyor
    • Mevcut modellere kıyasla hesaplama maliyeti %50 azaltıldı
    • Tüketici sınıfı GPU’larda da (RTX 4090 vb.) çalışabiliyor
  • Hibrit DiT mimarisinde yenilik

    • Video-VAE: 1:192 sıkıştırma oranı (32x32x8 downscaling)
    • VAE decoder son denoising aşamasını da üstleniyor → ek upsampling olmadan ince ayrıntılar korunuyor
    • Çoklu GPU çıkarım yığınıyla gerçek zamanlı performans sağlanıyor
  • İnce ayarlı yaratıcı kontrol

    • Çoklu keyframe conditioning, 3D kamera mantığı
    • LoRA fine-tuning ile marka stili/IP tutarlılığı korunuyor
    • Hız-kalite ayarı için 3 mod: Fast/Pro/Ultra
  • Hemen kullanılabilecek ekosistem

    • Fal.ai, Replicate, ComfyUI entegrasyonu tamamlandı
    • API Playground üzerinden test edilebilir
    • Düzenleme araçları, VFX stack’leri ve oyun motorlarına doğrudan entegrasyon desteği

Henüz yorum yok.

Henüz yorum yok.