Audiblez nedir?
.epub e-kitapları .m4b sesli kitaplara dönüştüren bir araç
- Kokoro-82M tabanlı yüksek kaliteli ses sentezi kullanır
- Apache lisansı ile sunuluyor ve 100 saatin altında ses verisiyle eğitildi
- Google Colab'in T4 GPU'sunda "saniyede 600 karakter dönüştürme hızı" ile "Animal Farm" yaklaşık 5 dakikada dönüştürülebiliyor
- M2 MacBook Pro'da (CPU modu) "saniyede 60 karakter hızında yaklaşık 1 saat sürüyor"
- Apple Silicon (M1, M2) üzerinde şu anda CUDA desteği yok (MLX desteği bekleniyor)
Audiblez 4.2 önemli güncellemeleri
- wxWidgets tabanlı çok platformlu GUI desteği (Mac, Windows, Linux)
- Birden fazla dil desteği (İngilizce, İspanyolca, Fransızca, Hintçe, İtalyanca, Japonca, Portekizce, Çince)
- ONNX'ten
kokoro paketini kullanan Torch tabanlı yapıya geçildi
- CUDA hızlandırma desteği eklendi (ancak Apple Silicon'da CPU modunda çalışır)
- Sesli kitaplara kapak görseli ve bölüm zaman damgaları ekleniyor
- Windows desteği iyileştirildi
2 yorum
Kokoro-82M modeliyle e-kitapları sesli kitaba dönüştürme
Bu buna dayanıyor, ancak burada yer alan Korece Audiblez'de yok gibi görünüyor (gerçi yorumlarda Kokoro'nun Korece kalitesinin pek iyi olmadığı söyleniyor)
kokoro projesinin geçmiş kayıtlarına bakınca Korece bir sesin kesinlikle var olduğu görülüyor; ancak Discord tarafındaki tartışmalara bakılırsa, Kore AIHub verilerinin yurt dışına çıkarılmasını yasaklayan hüküm nedeniyle dağıtım konusunda zorluk yaşanıyor gibi görünüyor…