Belirli bir kişinin sesinden yalnızca 5 saniye alarak sesi gerçek zamanlı klonlayan açık kaynak
(github.com)Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis (SV2TTS) makalesinin uygulaması.
Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis (SV2TTS) makalesinin uygulaması.
2 yorum
Yüz sentezi ve ses sentezi teknolojileri geliştikçe, eninde sonunda dış görünüş ve sesin taşıdığı anlamın değişmeyeceğini düşünmek zor. Artık bireyi dış görünüşü ya da maddi özellikleriyle tanımlamak mümkün olmayacak. Sanırım insanın zihnine ve özüne daha çok odaklanan bir çağ gelecek.
YouTube demo videosu: https://www.youtube.com/watch?v=-O_hYhToKoA