作者ice80712 (打臉腦粉)
看板DataScience
標題[討論] 為何版上討論語音的很少?
時間Wed Feb 20 00:38:13 2019
如題,
深度學習首先最成功的應用是在連續大詞彙的語音識別上,
印象中是2011年吧,
往後更延伸出不同的模型架構,
從傳統的gmm-hmm到dnn-hmm,
以及chain-tdnn,
還有端到端的ctc架構,
除了上述的語音識別(ASR)之外,
還有關鍵詞識別(KWS),
說話人識別/聲紋識別,語音合成(TTS),
大概是這幾個方向(不討論NLP),
為何版上討論這些相關的主題如此之少?
語音市場小?
門檻比較高?
這陣子在看相關的文章都是對岸寫的。
-----
Sent from JPTT on my Sony G8142.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.199.75
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1550594296.A.A0E.html
1F:推 f496328mm: 語音 google 幾乎做到完美了,串個python api就結束了 02/20 01:01
2F:推 yiefaung: 這裡本來就不適合做深度討論 人太少了 社群生態起不來 02/20 01:27
3F:→ j6cl3: 真的? 台灣菜市場日常對話能完美? 02/20 01:48
4F:推 michellehot: 你可以把看到有趣的討論翻成繁體po上來 02/20 08:27
5F:→ michellehot: 就會有人討論了 02/20 08:27
6F:推 sma1033: 語音識別跟語音合成難度都偏高,業界會做的都很保密 02/20 09:40
7F:→ sma1033: 一般程度的學生做出來的東西品質又都很爛,稱不上堪用 02/20 09:41
8F:→ pipidog: 這版不是討論語音少,而是討論任何主題都很少 02/20 17:54
9F:→ bobju: 太專業了 02/21 11:46
10F:推 whsunset: 門檻比較高,做的人比較少,很多 work 不是 end-to-end 02/21 13:47
11F:推 sma1033: 有價值的東西,資訊不會隨意流出來,語音相關技術很值錢 02/22 10:32
12F:→ pups003: 1樓確定? 02/24 17:33
13F:推 chobit199685: 語音技術很貴 尤其是音樂生成 因創作價格是信仰值 03/06 21:23
14F:→ roccqqck: 沒公開讓別人transfer learning的 自然少人做 04/12 19:04
15F:→ roccqqck: 稿很久也根本看不到別人車尾燈 04/12 19:06