Soft_Job 板


LINE

原文恕刪 我進入職場後才發現 還是真的有些資訊人對機器學習或資料探勘認識不多 而且原po文底下對text領域的推文好像比較少 所以我簡單分享一下我的領域還有實際應用 我研究所是做text mining, word embedding, topic model(LDA), NLP (拜託公司有缺人做這塊的請聯絡我XDD) e.g. 1 LDA->推薦系統 LDA簡單來講就是分群 業界最常用的就是推薦系統 某家新創電商用LDA做推薦系統 在原本的計算能力下 推薦的命中率從原本的10%提升到45%~50%之間 e.g. 2 LDA+social network -> 熱門議題發掘 這是小魯做的研究之一 我們那時候跟某公司合作 挖掘社群網站內重要的議題 會依照不同人在社群內的領導性 迭代計算熱門程度及重要性 後來實際運用是新產品推廣和輿情分析 儘早發現對公司不利的言論以利後續滅火 e.g. 3 NLP -> 聊天問答機器人 這個是我現在主要做的領域 要處理的是對特定項目進行了解 還有給予使用者建議 這個其實蠻實際的 對組織來說 如何完整記載資訊還有提供給需要的人使用 這件事情一直都是人工處理 有這套系統後 員工遇到問題可以直接向機器人尋求協助 這可以降低溝通成本及加快開發效率 e.g. 4 word embedding -> 機器翻譯 傳統上對文字的處理大多是用one-hot的方式做輸入 不過很容易遇到維度太大 而且罕見詞浪費空間等問題 word embedding簡單來說就是可以把所有文字轉成固定大小的矩陣來處理 例如 queen = [0.1,0.5,0.2] king = [0.4,0.1,0.7] ..... 那他神奇的地方在於 轉完的矩陣有關聯性 例如 queen - woman + man ~ king I am starving ~ I am hungry (這個要額外做處理) 對不同文字間 可以再用NN做轉換就變成 I am starving ~ 我肚子餓了 不過這套目前還有一些問題還沒被解決 以上這四個例子其實都很常見 而且很難用非機器學習(可能不是NN)的方式得到更好的結果 簡單來說 機器學習在"無法簡單定義流程"的地方 通常可以獲得更好的成效 以上是我在這領域待3年左右的分享 不過我剛上班沒多久 看的可能比較狹隘 其他還請強者補充XD -- Sent from my CASIO fx-991es . --
QR Code



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.227.49.28
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Soft_Job/M.1485583424.A.573.html
1F:推 ian90911: 推 01/28 15:06
2F:推 zoko741235: 推 最近在嘗試弄推薦系統 01/28 15:07
3F:推 winken2004: 推 01/28 15:15
4F:推 dark104: 推,也想往這個方向走 01/28 15:54
5F:推 herbacin: 推 01/28 15:54
6F:推 drajan: 1的難度是如何在資料量大時做出來 不然只是gensim 01/28 16:10
7F:→ DrTech: 整篇只有seq2seq 那段比較偏深度學習吧,其他根本跟深度 01/28 16:16
8F:→ DrTech: 學習沒什麼關係。 01/28 16:16
9F:→ sunpedro0202: word2vec 應該也算啦,前面幾個就不4了 01/28 16:22
10F:推 DrTech: 台灣需要 NLP 的公司好少阿,還需要大家一起推廣 01/28 16:32
11F:→ sunpedro0202: 市場原罪呀,樓上大大不4要發文(擦眼睛 01/28 16:33
12F:推 DrTech: 現在放假,只有手機阿,打字不方便。等我有電腦時再來分 01/28 16:36
13F:→ DrTech: 享最近的市場狀況喔,感謝 01/28 16:36
14F:→ sunpedro0202: 期待! 01/28 16:52
15F:推 pttworld: 原文根本是不查資料上來發文偷學別人整理的,認真給推。 01/28 17:08
16F:推 NCUking: 台灣慣老闆:半年要做出像Siri的APP 01/28 17:27
17F:推 Telemio: 推 01/28 17:39
18F:推 gmoz: 原文深度釣魚 01/28 18:11
19F:推 vallwesture: 自己用過LDA+NLP來產生摘要,真的好用 01/28 18:14
20F:推 chen1025: 推 01/28 18:47
21F:推 popxpopxpop: 推,做過判例text mining,覺得有趣+1 01/28 18:49
22F:→ remmurds: 推 01/28 20:59
23F:推 hanshsu: 台灣做ai太難了 市場風向不愛 01/28 22:28
24F:→ death06: 在台灣老闆根本不愛 因為這東西很難馬上有成效 而且 01/28 22:53
25F:→ death06: 我之前聽一家做機器人客服的 程式判斷文字永遠卡在6-7成 01/28 22:54
26F:→ death06: 老闆也是做了 然後放在那邊=_=" 01/28 22:54
27F:推 ACEgolden: 深度學習=神經網路? 01/29 11:13
28F:推 chupiggy: 推 可惜現在台灣做NLP的還是不多 QQ 01/29 11:33
29F:推 nayd: Siri, Google Assistant這麼難用,大家還是覺得AI很厲害嗎 01/30 01:13
30F:推 popxpopxpop: 推樓上,不要把ai神話,但這領域很有趣 01/31 17:32
31F:推 x81236900: 你喂資料準確率要0.7up感覺真的有點難 02/19 01:57







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:WOW站內搜尋

TOP