wav2vec-U : Gözetim gerektirmeyen yüksek performanslı konuşma tanıma
(ai.facebook.com)-
Facebook AI ekibinin geliştirdiği konuşma tanıma çerçevesi
-
Transkribe edilmiş konuşma verisi olmadan çeşitli dillerin tanınmasını destekliyor
→ Yaklaşık 1000 saatlik konuşma ile eğitilmiş denetimli öğrenme modeliyle benzer performans
→ Fazla transkribe konuşma verisi bulunmayan Svahili ve Tatarca gibi dillerde test edildi
- Etiketlenmemiş sesin yapısını öğrenen bir yöntem
→ Konuşma kayıtlarını, tek tek seslerle gevşek biçimde eşleşen konuşma birimlerine ayırıyor
→ cat, “/K/”, “/AE/”, “/T/” olmak üzere üç sesi içerir
→ generator ve discriminatordan oluşan bir GAN ile eğitiliyor
- Kod ve makale yayımlandı
Henüz yorum yok.