8 puan yazan xguru 2025-02-19 | 2 yorum | WhatsApp'ta paylaş

Audiblez nedir?

  • .epub e-kitapları .m4b sesli kitaplara dönüştüren bir araç
  • Kokoro-82M tabanlı yüksek kaliteli ses sentezi kullanır
  • Apache lisansı ile sunuluyor ve 100 saatin altında ses verisiyle eğitildi
  • Google Colab'in T4 GPU'sunda "saniyede 600 karakter dönüştürme hızı" ile "Animal Farm" yaklaşık 5 dakikada dönüştürülebiliyor
  • M2 MacBook Pro'da (CPU modu) "saniyede 60 karakter hızında yaklaşık 1 saat sürüyor"
    • Apple Silicon (M1, M2) üzerinde şu anda CUDA desteği yok (MLX desteği bekleniyor)

Audiblez 4.2 önemli güncellemeleri

  • wxWidgets tabanlı çok platformlu GUI desteği (Mac, Windows, Linux)
  • Birden fazla dil desteği (İngilizce, İspanyolca, Fransızca, Hintçe, İtalyanca, Japonca, Portekizce, Çince)
  • ONNX'ten kokoro paketini kullanan Torch tabanlı yapıya geçildi
  • CUDA hızlandırma desteği eklendi (ancak Apple Silicon'da CPU modunda çalışır)
  • Sesli kitaplara kapak görseli ve bölüm zaman damgaları ekleniyor
  • Windows desteği iyileştirildi

2 yorum

 
xguru 2025-02-19

Kokoro-82M modeliyle e-kitapları sesli kitaba dönüştürme
Bu buna dayanıyor, ancak burada yer alan Korece Audiblez'de yok gibi görünüyor (gerçi yorumlarda Kokoro'nun Korece kalitesinin pek iyi olmadığı söyleniyor)

 
inosphe 2025-02-19

kokoro projesinin geçmiş kayıtlarına bakınca Korece bir sesin kesinlikle var olduğu görülüyor; ancak Discord tarafındaki tartışmalara bakılırsa, Kore AIHub verilerinin yurt dışına çıkarılmasını yasaklayan hüküm nedeniyle dağıtım konusunda zorluk yaşanıyor gibi görünüyor…