- Google Research tarafından yayımlanan makale
- Metin açıklamalarına çok sadık müzik üretiyor: "Distorsiyonlu gitar riff'leri eşliğinde sakin bir keman melodisi"
- Hiyerarşik sequence-to-sequence modelleme görevi olarak kurgulanarak birkaç dakikalık 24kHz müzik üretiyor
- Mevcut sistemlere kıyasla hem ses kalitesi hem de metin açıklamasına uyum açısından çok daha üstün
- Ayrıca ıslık ya da mırıldanma biçimindeki melodi stilini de dönüştürebiliyor
- Birden fazla prompt art arda verilerek hikâye modunda ses üretimi yapılabiliyor
- 5.5k müzik-metin çiftinden oluşan MusicCaps veri seti yayımlandı
Henüz yorum yok.