- Kitten TTS, hafiflik ile yüksek ses kalitesini aynı anda hedefleyen açık kaynak bir TTS (text-to-speech) modeli
- Yalnızca 15 milyon parametre kullanarak model boyutunu 25MB'ın altında tutuyor
- Diğer büyük TTS'lerden farklı olarak mobil, gömülü sistemler ve benzeri tüm ortamlarda çalışabilmesi en büyük özelliklerinden biri
- GPU olmadan da tüm cihazlarda yüksek kaliteli konuşma sentezi gerçekleştirebiliyor
- Çeşitli premium ses seçenekleri sunarak gerçek insan sesine yakın yüksek kaliteli ses sentezi sağlıyor
- Hızlı ses çıkarımı sayesinde gerçek zamanlı sentez için optimize edilmiş
- Geliştirici önizleme modeli yayımlanmış durumda; ileride eğitim tamamlanmış tam model ağırlıkları, mobil SDK, web sürümü gibi bileşenler kademeli olarak yayımlanacak
Henüz yorum yok.