- "parkta havlayan köpek", "rüzgar eserken ıslık sesi", "çok sayıda insanın tezahüratı önünde konuşma yapan adam" gibi sesler üretilebiliyor
- Ses üretiminin çeşitli zorlukları var
- Ses çıkaran nesneleri ayırmak zor; gerçek ortamdaki farklı kayıt koşulları bunu daha da karmaşık hale getiriyor ve bu tür durumlara ilişkin anotasyon eksikliği model geliştirmeyi zorlaştırıyor
- Bu sorunları hafifletmek için, çeşitli ses örneklerini karıştıran ve modelin birden fazla ses kaynağını ayırma tekniğini içsel olarak öğrenmesini sağlayan bir artırma tekniği öneriliyor
Henüz yorum yok.