- Görüntü/metin üreten yapay zekalar gibi, çeşitli stillerde yüksek kaliteli ses klipleri üretiyor
- Verilen ses örneklerini de düzenleyebiliyor
- Yalnızca 6 dilde konuşma sentezlemekle kalmıyor; gürültü giderme, içerik düzenleme, stil dönüştürme ve çeşitli örnekler üretme de yapabiliyor
- Mevcut ses odaklı üretici yapay zekalar, her görev için özenle hazırlanmış eğitim verileri gerektiriyordu. Voicebox ise ham ses ve transcription verileriyle eğitilen yeni bir yöntem kullanıyor
- İngilizce, Fransızca, İspanyolca, Almanca, Lehçe ve Portekizce kamu malı sesli kitaplardan elde edilen 50 bin saatten fazla veriyle eğitildi
2 yorum
Şarkıdan yalnızca vokalleri çıkarıp yüksek kaliteli bir MR oluşturmakta kullanılıp kullanılamayacağını merak ediyorum.
Bunun için zaten kullanışlı bir açık kaynak var:
https://github.com/Anjok07/ultimatevocalremovergui