Voice-Pro – ses tanıma, çeviri ve konuşma sentezini destekleyen Gradio WebUI
(github.com/abus-aikorea)Voice-Pro, ses tanıma, çeviri ve konuşma sentezini destekleyen bir Gradio WebUI'dir.
Başlıca özellikler:
- Zero-shot voice cloning. Yalnızca 15 saniyelik bir ses örneği yeterlidir. 50'den fazla ünlü sesi sunar
- YouTube ses indirme
- Vokal ayırma
- Çok dilli metinden konuşmaya dönüştürme (Edge-TTS, F5-TTS)
- Çok dilli çeviri
- Çeşitli Whisper motorlarını destekler (Whisper, Faster-Whisper, Whisper-Timestamped)
Video demoları:
-
Voice-Pro kullanım eğitimi: https://youtu.be/z8g8LMhoh_o
-
Voice-Cloning podcast üretim demosu: https://youtu.be/Wfo7vQCD4no
-
Demolar ve örnek videolar: https://youtube.com/playlist/?list=PLwx5dnMDVC9Y7dAjm9r26CZUw1uU5VIeq
1 yorum
Sanırım bunu bir Koreli yapmış.