MusicLM, metinden müzik üreten yapay zeka
(google-research.github.io)- Google Research tarafından yayımlanan makale
- Metin açıklamalarına çok sadık müzik üretiyor: "Distorsiyonlu gitar riff'leri eşliğinde sakin bir keman melodisi"
- Hiyerarşik sequence-to-sequence modelleme görevi olarak kurgulanarak birkaç dakikalık 24kHz müzik üretiyor
- Mevcut sistemlere kıyasla hem ses kalitesi hem de metin açıklamasına uyum açısından çok daha üstün
- Ayrıca ıslık ya da mırıldanma biçimindeki melodi stilini de dönüştürebiliyor
- Birden fazla prompt art arda verilerek hikâye modunda ses üretimi yapılabiliyor
- 5.5k müzik-metin çiftinden oluşan MusicCaps veri seti yayımlandı
2 yorum
Sadece metinden bile bu seviyede kalite çıkarabilmesi gerçekten etkileyici!
Ancak şimdilik hâlâ çok yapay duran şeyler de var; bu yüzden daha çok yaratıcıların fikir edinmek için kullandığı bir araç olarak öne çıkabilir gibi görünüyor.
Riffusion - müzik üretmek için ince ayar yapılmış Stable Diffusion