作者hunej (cookpro)
看板DigitalMusic
標題[閒聊] 分離音樂與人聲
時間Tue Mar 28 23:53:06 2017
http://danetapi.com/chimera
之前常有人問到要把音樂與人聲分離開來
在立體聲的環境下有時候可以靠相位來消掉一點背景
(人聲通常stereo image偏中間)
單聲道就不太行了
其實這個問題是很經典的語音處理/機器學習問題
也算有發展很長一段時間
當然最近深度學習的發展在這個議題上也有相當大的發揮
上面貼的這個團隊這兩年出了幾篇針對聲音分離的新架構
然後他們有提供分離的服務 可以丟你要分的音檔給他讓他分離
不過有限制 必須要單聲道 10秒以內 而且出來結果會downsample到16k (為了省運算量)
如果有興趣的朋友也可以看一下他原本的論文
https://arxiv.org/abs/1611.06265
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.110.237.10
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DigitalMusic/M.1490716396.A.BB1.html
※ 編輯: hunej (123.110.237.10), 03/28/2017 23:54:01
1F:→ ywc928: 真酷 03/29 16:10
2F:→ ywc928: 感覺已經很邱ㄌ 03/29 16:11