📝 TL;DR
- LTX-2 = açık kaynak çok modlu video üretim modelleri için yeni ölçüt
- 4K+ses, tüketici sınıfı donanımda gerçek zamanlı üretiliyor
- Kasım sonundan itibaren model ağırlıkları+kod+benchmark’ların tamamı açık olacak
- Lightricks tarafından geliştirildi, arXiv makalesi yayımlandı
🔑 Öne Çıkanlar
-
Açık kaynakta ilk ses-video senkronize üretim modeli
- Sora 2 ve Movie Gen ticari/kapalıyken, LTX-2 kasım sonunda tamamen açık kaynak olarak yayımlanacak
- 4K 50fps, en fazla 10 saniyelik video + senkronize ses üretimi
-
Gerçek zamandan daha hızlı üretim hızı
- H100: 768x512 çözünürlükte, 5 saniyelik 24fps videoyu sadece 2 saniyede üretiyor
- Mevcut modellere kıyasla hesaplama maliyeti %50 azaltıldı
- Tüketici sınıfı GPU’larda da (RTX 4090 vb.) çalışabiliyor
-
Hibrit DiT mimarisinde yenilik
- Video-VAE: 1:192 sıkıştırma oranı (32x32x8 downscaling)
- VAE decoder son denoising aşamasını da üstleniyor → ek upsampling olmadan ince ayrıntılar korunuyor
- Çoklu GPU çıkarım yığınıyla gerçek zamanlı performans sağlanıyor
-
İnce ayarlı yaratıcı kontrol
- Çoklu keyframe conditioning, 3D kamera mantığı
- LoRA fine-tuning ile marka stili/IP tutarlılığı korunuyor
- Hız-kalite ayarı için 3 mod: Fast/Pro/Ultra
-
Hemen kullanılabilecek ekosistem
- Fal.ai, Replicate, ComfyUI entegrasyonu tamamlandı
- API Playground üzerinden test edilebilir
- Düzenleme araçları, VFX stack’leri ve oyun motorlarına doğrudan entegrasyon desteği
Henüz yorum yok.