Soft_Job 板


LINE

原文恕删 我进入职场後才发现 还是真的有些资讯人对机器学习或资料探勘认识不多 而且原po文底下对text领域的推文好像比较少 所以我简单分享一下我的领域还有实际应用 我研究所是做text mining, word embedding, topic model(LDA), NLP (拜托公司有缺人做这块的请联络我XDD) e.g. 1 LDA->推荐系统 LDA简单来讲就是分群 业界最常用的就是推荐系统 某家新创电商用LDA做推荐系统 在原本的计算能力下 推荐的命中率从原本的10%提升到45%~50%之间 e.g. 2 LDA+social network -> 热门议题发掘 这是小鲁做的研究之一 我们那时候跟某公司合作 挖掘社群网站内重要的议题 会依照不同人在社群内的领导性 迭代计算热门程度及重要性 後来实际运用是新产品推广和舆情分析 尽早发现对公司不利的言论以利後续灭火 e.g. 3 NLP -> 聊天问答机器人 这个是我现在主要做的领域 要处理的是对特定项目进行了解 还有给予使用者建议 这个其实蛮实际的 对组织来说 如何完整记载资讯还有提供给需要的人使用 这件事情一直都是人工处理 有这套系统後 员工遇到问题可以直接向机器人寻求协助 这可以降低沟通成本及加快开发效率 e.g. 4 word embedding -> 机器翻译 传统上对文字的处理大多是用one-hot的方式做输入 不过很容易遇到维度太大 而且罕见词浪费空间等问题 word embedding简单来说就是可以把所有文字转成固定大小的矩阵来处理 例如 queen = [0.1,0.5,0.2] king = [0.4,0.1,0.7] ..... 那他神奇的地方在於 转完的矩阵有关联性 例如 queen - woman + man ~ king I am starving ~ I am hungry (这个要额外做处理) 对不同文字间 可以再用NN做转换就变成 I am starving ~ 我肚子饿了 不过这套目前还有一些问题还没被解决 以上这四个例子其实都很常见 而且很难用非机器学习(可能不是NN)的方式得到更好的结果 简单来说 机器学习在"无法简单定义流程"的地方 通常可以获得更好的成效 以上是我在这领域待3年左右的分享 不过我刚上班没多久 看的可能比较狭隘 其他还请强者补充XD -- Sent from my CASIO fx-991es . --
QR Code



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 61.227.49.28
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1485583424.A.573.html
1F:推 ian90911: 推 01/28 15:06
2F:推 zoko741235: 推 最近在尝试弄推荐系统 01/28 15:07
3F:推 winken2004: 推 01/28 15:15
4F:推 dark104: 推,也想往这个方向走 01/28 15:54
5F:推 herbacin: 推 01/28 15:54
6F:推 drajan: 1的难度是如何在资料量大时做出来 不然只是gensim 01/28 16:10
7F:→ DrTech: 整篇只有seq2seq 那段比较偏深度学习吧,其他根本跟深度 01/28 16:16
8F:→ DrTech: 学习没什麽关系。 01/28 16:16
9F:→ sunpedro0202: word2vec 应该也算啦,前面几个就不4了 01/28 16:22
10F:推 DrTech: 台湾需要 NLP 的公司好少阿,还需要大家一起推广 01/28 16:32
11F:→ sunpedro0202: 市场原罪呀,楼上大大不4要发文(擦眼睛 01/28 16:33
12F:推 DrTech: 现在放假,只有手机阿,打字不方便。等我有电脑时再来分 01/28 16:36
13F:→ DrTech: 享最近的市场状况喔,感谢 01/28 16:36
14F:→ sunpedro0202: 期待! 01/28 16:52
15F:推 pttworld: 原文根本是不查资料上来发文偷学别人整理的,认真给推。 01/28 17:08
16F:推 NCUking: 台湾惯老板:半年要做出像Siri的APP 01/28 17:27
17F:推 Telemio: 推 01/28 17:39
18F:推 gmoz: 原文深度钓鱼 01/28 18:11
19F:推 vallwesture: 自己用过LDA+NLP来产生摘要,真的好用 01/28 18:14
20F:推 chen1025: 推 01/28 18:47
21F:推 popxpopxpop: 推,做过判例text mining,觉得有趣+1 01/28 18:49
22F:→ remmurds: 推 01/28 20:59
23F:推 hanshsu: 台湾做ai太难了 市场风向不爱 01/28 22:28
24F:→ death06: 在台湾老板根本不爱 因为这东西很难马上有成效 而且 01/28 22:53
25F:→ death06: 我之前听一家做机器人客服的 程式判断文字永远卡在6-7成 01/28 22:54
26F:→ death06: 老板也是做了 然後放在那边=_=" 01/28 22:54
27F:推 ACEgolden: 深度学习=神经网路? 01/29 11:13
28F:推 chupiggy: 推 可惜现在台湾做NLP的还是不多 QQ 01/29 11:33
29F:推 nayd: Siri, Google Assistant这麽难用,大家还是觉得AI很厉害吗 01/30 01:13
30F:推 popxpopxpop: 推楼上,不要把ai神话,但这领域很有趣 01/31 17:32
31F:推 x81236900: 你喂资料准确率要0.7up感觉真的有点难 02/19 01:57







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:e-shopping站内搜寻

TOP