作者oe725 ( )
看板CSSE
标题[问题] 有关语音辨识的问题
时间Tue Dec 4 00:39:19 2018
不确定这个问题是否可以在此版发问, 如果有其他更合适的版, 再请指正, 谢谢
最近在做语音辨识的research, 并对同事做了一些技术分享
当下被问到了一个问题, 我发现这部分我还真的不知道
我的问题如下, 以现今的语音辨识APP, 如apple的siri
Q1.
当我们输入唤醒词 "Hey siri" 或者其他内建的语音命令时
它的语音辨识机制应该是在手机(local)端做掉, 也可以说是离线处理的部分
而这边所谓的语音辨识机制, 也就是先将时域讯号透过傅立叶转成频域讯号, 然後经过特
徵提取, 再做声学辨识?
还是local端是采用其他较快速的辨识方式?
Q2.
比较复杂的声学/语意分析, 理论上都要上传到云端做
此时上传的data是原始的语音讯号? 还是会先做一些前处理, 比如降噪/转频域讯号...等
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 123.193.176.75
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/CSSE/M.1543855162.A.45B.html