MetaVoice-1B - 1,2 milyar parametreli Text-To-Speech modeli
(github.com/metavoiceio)- 100 bin saatlik ses verisiyle eğitilmiş, 1,2 milyar parametreli bir TTS (metinden konuşmaya) modeli
- Duygusal konuşma ritmi ve tonlama (İngilizce)
- İnce ayarla voice cloning desteği (Hintli konuşmacılar için yalnızca yaklaşık 1 dakikalık ses verisiyle başarılı oldu)
- ABD/İngiltere aksanlı sesler için yalnızca 30 saniyelik referans sesle zero-shot cloning mümkün
- Uzun ses sentezini destekler
- Apache 2.0 lisansıyla herhangi bir kısıtlama olmadan kullanılabilir
Henüz yorum yok.