9 puan yazan vulcanidic 2024-12-08 | 1 yorum | WhatsApp'ta paylaş

Voice-Pro, ses tanıma, çeviri ve konuşma sentezini destekleyen bir Gradio WebUI'dir.

Başlıca özellikler:

  • Zero-shot voice cloning. Yalnızca 15 saniyelik bir ses örneği yeterlidir. 50'den fazla ünlü sesi sunar
  • YouTube ses indirme
  • Vokal ayırma
  • Çok dilli metinden konuşmaya dönüştürme (Edge-TTS, F5-TTS)
  • Çok dilli çeviri
  • Çeşitli Whisper motorlarını destekler (Whisper, Faster-Whisper, Whisper-Timestamped)

Video demoları:

GitHub:
https://github.com/abus-aikorea/voice-pro

1 yorum

 
yangeok 2024-12-16

Sanırım bunu bir Koreli yapmış.