Omni SenseVoice - Kelime Bazında Zaman Damgası Destekleyen Yüksek Hızlı Konuşma Tanıma

xguru · 2024-11-10T09:31:01+09:00

Otomatik konuşma tanıma (ASR), konuşulan dil tanıma (LID), konuşma duygu tanıma (SER) ve ses olayı algılama (AED) gibi özelliklere sahip çok dilli konuşma anlama modeli SenseVoice tabanlı Ultra hızlı çıkarım ve hassas zaman damgaları için optimize edilmiştir; böylece ses transkripsiyonlarını daha akıllı ve daha hızlı işleyebilir Başlıca seçenekler --language: dili otomatik algılar/belirtir (auto, zh, en, yue, ja, ko) --textnorm: ters metin normalizasyonunun uygulanıp uygulanmayacağını seçer (ters normalize edilmiş durumda withitn, ham metin için woitn) --device-id: belirli bir GPU'da çalıştırır (varsayılan: CPU için -1) --quantize: daha hızlı işleme için nicemlenmiş modeli kullanır

(github.com/lifeiteng)

13 puan yazan xguru 2024-11-10 | 1 yorum | WhatsApp'ta paylaş

Otomatik konuşma tanıma (ASR), konuşulan dil tanıma (LID), konuşma duygu tanıma (SER) ve ses olayı algılama (AED) gibi özelliklere sahip çok dilli konuşma anlama modeli SenseVoice tabanlı
Ultra hızlı çıkarım ve hassas zaman damgaları için optimize edilmiştir; böylece ses transkripsiyonlarını daha akıllı ve daha hızlı işleyebilir
Başlıca seçenekler
- --language: dili otomatik algılar/belirtir (auto, zh, en, yue, ja, ko)
- --textnorm: ters metin normalizasyonunun uygulanıp uygulanmayacağını seçer (ters normalize edilmiş durumda withitn, ham metin için woitn)
- --device-id: belirli bir GPU'da çalıştırır (varsayılan: CPU için -1)
- --quantize: daha hızlı işleme için nicemlenmiş modeli kullanır

1 yorum

yangeok 2024-11-12

Seçenekler arasında Korece de var, test etmek istiyorum :)

Omni SenseVoice - Kelime Bazında Zaman Damgası Destekleyen Yüksek Hızlı Konuşma Tanıma

İlgili okumalar

1 yorum