作者ql4au04 (泡面)
看板Soft_Job
标题Re: [请益] 深度学习的实际应用
时间Sat Jan 28 14:03:41 2017
原文恕删
我进入职场後才发现
还是真的有些资讯人对机器学习或资料探勘认识不多
而且原po文底下对text领域的推文好像比较少
所以我简单分享一下我的领域还有实际应用
我研究所是做text mining, word embedding, topic model(LDA), NLP
(拜托公司有缺人做这块的请联络我XDD)
e.g. 1 LDA->推荐系统
LDA简单来讲就是分群 业界最常用的就是推荐系统
某家新创电商用LDA做推荐系统 在原本的计算能力下
推荐的命中率从原本的10%提升到45%~50%之间
e.g. 2 LDA+social network -> 热门议题发掘
这是小鲁做的研究之一
我们那时候跟某公司合作 挖掘社群网站内重要的议题
会依照不同人在社群内的领导性 迭代计算热门程度及重要性
後来实际运用是新产品推广和舆情分析 尽早发现对公司不利的言论以利後续灭火
e.g. 3 NLP -> 聊天问答机器人
这个是我现在主要做的领域
要处理的是对特定项目进行了解 还有给予使用者建议
这个其实蛮实际的 对组织来说 如何完整记载资讯还有提供给需要的人使用
这件事情一直都是人工处理
有这套系统後 员工遇到问题可以直接向机器人寻求协助
这可以降低沟通成本及加快开发效率
e.g. 4 word embedding -> 机器翻译
传统上对文字的处理大多是用one-hot的方式做输入
不过很容易遇到维度太大 而且罕见词浪费空间等问题
word embedding简单来说就是可以把所有文字转成固定大小的矩阵来处理
例如 queen = [0.1,0.5,0.2] king = [0.4,0.1,0.7] .....
那他神奇的地方在於 转完的矩阵有关联性
例如
queen - woman + man ~ king
I am starving ~ I am hungry (这个要额外做处理)
对不同文字间 可以再用NN做转换就变成
I am starving ~ 我肚子饿了
不过这套目前还有一些问题还没被解决
以上这四个例子其实都很常见
而且很难用非机器学习(可能不是NN)的方式得到更好的结果
简单来说 机器学习在"无法简单定义流程"的地方 通常可以获得更好的成效
以上是我在这领域待3年左右的分享
不过我刚上班没多久 看的可能比较狭隘
其他还请强者补充XD
--
Sent from my CASIO fx-991es .
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 61.227.49.28
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1485583424.A.573.html
1F:推 ian90911: 推 01/28 15:06
2F:推 zoko741235: 推 最近在尝试弄推荐系统 01/28 15:07
3F:推 winken2004: 推 01/28 15:15
4F:推 dark104: 推,也想往这个方向走 01/28 15:54
5F:推 herbacin: 推 01/28 15:54
6F:推 drajan: 1的难度是如何在资料量大时做出来 不然只是gensim 01/28 16:10
7F:→ DrTech: 整篇只有seq2seq 那段比较偏深度学习吧,其他根本跟深度 01/28 16:16
8F:→ DrTech: 学习没什麽关系。 01/28 16:16
9F:→ sunpedro0202: word2vec 应该也算啦,前面几个就不4了 01/28 16:22
10F:推 DrTech: 台湾需要 NLP 的公司好少阿,还需要大家一起推广 01/28 16:32
11F:→ sunpedro0202: 市场原罪呀,楼上大大不4要发文(擦眼睛 01/28 16:33
12F:推 DrTech: 现在放假,只有手机阿,打字不方便。等我有电脑时再来分 01/28 16:36
13F:→ DrTech: 享最近的市场状况喔,感谢 01/28 16:36
14F:→ sunpedro0202: 期待! 01/28 16:52
15F:推 pttworld: 原文根本是不查资料上来发文偷学别人整理的,认真给推。 01/28 17:08
16F:推 NCUking: 台湾惯老板:半年要做出像Siri的APP 01/28 17:27
17F:推 Telemio: 推 01/28 17:39
18F:推 gmoz: 原文深度钓鱼 01/28 18:11
19F:推 vallwesture: 自己用过LDA+NLP来产生摘要,真的好用 01/28 18:14
20F:推 chen1025: 推 01/28 18:47
21F:推 popxpopxpop: 推,做过判例text mining,觉得有趣+1 01/28 18:49
22F:→ remmurds: 推 01/28 20:59
23F:推 hanshsu: 台湾做ai太难了 市场风向不爱 01/28 22:28
24F:→ death06: 在台湾老板根本不爱 因为这东西很难马上有成效 而且 01/28 22:53
25F:→ death06: 我之前听一家做机器人客服的 程式判断文字永远卡在6-7成 01/28 22:54
26F:→ death06: 老板也是做了 然後放在那边=_=" 01/28 22:54
27F:推 ACEgolden: 深度学习=神经网路? 01/29 11:13
28F:推 chupiggy: 推 可惜现在台湾做NLP的还是不多 QQ 01/29 11:33
29F:推 nayd: Siri, Google Assistant这麽难用,大家还是觉得AI很厉害吗 01/30 01:13
30F:推 popxpopxpop: 推楼上,不要把ai神话,但这领域很有趣 01/31 17:32
31F:推 x81236900: 你喂资料准确率要0.7up感觉真的有点难 02/19 01:57