作者hunej (cookpro)
看板DigitalMusic
标题[闲聊] 分离音乐与人声
时间Tue Mar 28 23:53:06 2017
http://danetapi.com/chimera
之前常有人问到要把音乐与人声分离开来
在立体声的环境下有时候可以靠相位来消掉一点背景
(人声通常stereo image偏中间)
单声道就不太行了
其实这个问题是很经典的语音处理/机器学习问题
也算有发展很长一段时间
当然最近深度学习的发展在这个议题上也有相当大的发挥
上面贴的这个团队这两年出了几篇针对声音分离的新架构
然後他们有提供分离的服务 可以丢你要分的音档给他让他分离
不过有限制 必须要单声道 10秒以内 而且出来结果会downsample到16k (为了省运算量)
如果有兴趣的朋友也可以看一下他原本的论文
https://arxiv.org/abs/1611.06265
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 123.110.237.10
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DigitalMusic/M.1490716396.A.BB1.html
※ 编辑: hunej (123.110.237.10), 03/28/2017 23:54:01
1F:→ ywc928: 真酷 03/29 16:10
2F:→ ywc928: 感觉已经很邱ㄌ 03/29 16:11