作者ice80712 (打脸脑粉)
看板DataScience
标题[讨论] 为何版上讨论语音的很少?
时间Wed Feb 20 00:38:13 2019
如题,
深度学习首先最成功的应用是在连续大词汇的语音识别上,
印象中是2011年吧,
往後更延伸出不同的模型架构,
从传统的gmm-hmm到dnn-hmm,
以及chain-tdnn,
还有端到端的ctc架构,
除了上述的语音识别(ASR)之外,
还有关键词识别(KWS),
说话人识别/声纹识别,语音合成(TTS),
大概是这几个方向(不讨论NLP),
为何版上讨论这些相关的主题如此之少?
语音市场小?
门槛比较高?
这阵子在看相关的文章都是对岸写的。
-----
Sent from JPTT on my Sony G8142.
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.136.199.75
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1550594296.A.A0E.html
1F:推 f496328mm: 语音 google 几乎做到完美了,串个python api就结束了 02/20 01:01
2F:推 yiefaung: 这里本来就不适合做深度讨论 人太少了 社群生态起不来 02/20 01:27
3F:→ j6cl3: 真的? 台湾菜市场日常对话能完美? 02/20 01:48
4F:推 michellehot: 你可以把看到有趣的讨论翻成繁体po上来 02/20 08:27
5F:→ michellehot: 就会有人讨论了 02/20 08:27
6F:推 sma1033: 语音识别跟语音合成难度都偏高,业界会做的都很保密 02/20 09:40
7F:→ sma1033: 一般程度的学生做出来的东西品质又都很烂,称不上堪用 02/20 09:41
8F:→ pipidog: 这版不是讨论语音少,而是讨论任何主题都很少 02/20 17:54
9F:→ bobju: 太专业了 02/21 11:46
10F:推 whsunset: 门槛比较高,做的人比较少,很多 work 不是 end-to-end 02/21 13:47
11F:推 sma1033: 有价值的东西,资讯不会随意流出来,语音相关技术很值钱 02/22 10:32
12F:→ pups003: 1楼确定? 02/24 17:33
13F:推 chobit199685: 语音技术很贵 尤其是音乐生成 因创作价格是信仰值 03/06 21:23
14F:→ roccqqck: 没公开让别人transfer learning的 自然少人做 04/12 19:04
15F:→ roccqqck: 稿很久也根本看不到别人车尾灯 04/12 19:06