5 puan yazan xguru 2022-12-31 | Henüz yorum yok. | WhatsApp'ta paylaş
  • OpenAI Whisper çok doğru transkripsiyonlar üretir, ancak zaman damgaları kelime düzeyinde değil konuşma düzeyinde (utterance) olduğundan birkaç saniyelik sapma olabilir
  • Whisper modelinin zaman damgalarını iyileştirmek için Wav2vec2.0 gibi fonem tabanlı ASR ve zorunlu hizalama (forced alignment) kullanılır
  • Varsayılan olarak {en, fr, de, es, it, ja, zh, nl} dilleri sunulur. Ek diller için Huggingface Model Hub üzerinde bulunup test edilmesi gerekir

Henüz yorum yok.

Henüz yorum yok.