- Korece dahil 31 dil desteği
- Duygu etiketleri için yeni destek: metne <laugh>, <breath>, <scream> gibi 10 tür etiket eklenerek duygusal ifade mümkün
- Kalite iyileştirmeleri: telaffuz doğruluğu artırıldı, kelime tekrarı/atlanması hataları azaltıldı, ses klonlama performansı iyileştirildi
- Model boyutu: 99M Parameters
- On-device TTS: tam gizlilik garantisi, ağ gecikmesi yok
- Dağıtım kolaylığı: tarayıcı, PC, mobil, Raspberry Pi vb. üzerinde çalışabilir
- 10 hazır ses sunuluyor
- Açık model: ticari kullanıma uygun (OpenRAIL-M)
3 yorum
Diğer hafif modellere kıyasla oldukça kararlı görünüyor.
O zaman bunu Pi 5'te test etmem gerekecek sanırım.
Home Agent'te supertonic kullanıyordum; önceki sürüm de fena değildi ama güncellenmiş demek. Test etmem gerekecek gibi.