作者apflake (圣人生而大盗起)
看板CSSE
标题Re: [问题] 语音输入的进展?
时间Wed Jan 18 11:13:01 2006
※ 引述《invalid (everlasting)》之铭言:
: 常常在网路上看到他们徵求受测者(不知道是不是)
: 一般来说这种东西大多是以类神经网路弄成的
: 也就是说要Train...
: 要让他听的懂你说的话前要先训练一下
: 不然错误率就是很高啊
: Train的好的话,当然就用的很顺啊
: 不过问题就是就算是同一个人,有的时候声音语调还是会差
: 更不用说取样程序的问题了( 换了新的麦克风? )
: 要找出一个能够通用的方法应该是大瓶颈吧...
这边说的train, 不一定是类神经网路, 语音辨识有人是用类神经网路
在做, 但主流还是用hidden Markov model, 利用机率, 预先建好的资
料是某些人大量的原始资料统各个子音母音的参数, 这些参数是许许
多多的机率分布, 每一个人的声音都不一样, 所以这些参数要调整到
适合某个使用者.
大致上最基本的每个音的分别, 不算是很困难, 但是再上去怎样组句
选字, 了解语意, 就牵涉到人工智慧, 是一个很困难的问题.
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 220.132.247.198
1F:推 kevin190:简单的说, HMM只能让电脑听出声音, 但却不了解句子的意义 01/18 23:40