作者del680202 (HANA)
看板Soft_Job
標題[心得] 原來真的有人用excel做機器學習
時間Thu Oct 3 07:55:29 2019
最近在幫某公司導機器學習的流程自動化
問問對方的principal data scientist原本流程是怎麼作的
對方說他excel man 所有作業用excel完成
也就是請助手把數據手動打成excel檔 然後套他用excel開發好的model去做預測輸出
公司最核心的算法都在他的excel檔裡面
然後看了一下歷史紀錄 哇 成千上百的excel檔
以前看過有書教人用excel作機器學習
想說現在這時代這種書誰會想看
還真的有人這樣用
大開眼界
-----
Sent from JPTT on my iPhone
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 126.233.116.244 (日本)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Soft_Job/M.1570060531.A.F70.html
1F:→ pelicanper: Excel用的好,工作沒煩惱 10/03 07:57
2F:推 yuigahamayui: 日本 10/03 08:03
3F:推 nosy098: 太神了吧~ 10/03 08:35
4F:→ ruthertw: 其實不會喔,某外商純用C做深度學習,還有閉門造車的APIs 10/03 08:56
5F:推 abc0922001: 創造工作機會欸 10/03 08:57
6F:→ ruthertw: 這間外商裡面很多神人,還滿好查的,幾年前狂找人,現在沒 10/03 08:57
7F:→ ruthertw: 有什麼職缺囉 10/03 08:58
8F:推 wrt: 十里坡劍神是什麼?劍神 10/03 09:36
9F:推 j0958322080: 一堆晶圓廠也是只用office阿 10/03 09:48
10F:→ DCTmaybe: 但人家可以跑出主管滿意的數據,而且這超難被取代 10/03 10:37
11F:推 chocopie: RPA 10/03 10:47
12F:推 BaGaJohn5566: 主管高興不就好了 他爽用matlab也可以 10/03 10:50
13F:推 ladyboy99: Domain know how 有了 工具只是其次 10/03 10:58
14F:推 gbd37: EXCEL神的話真的很神 10/03 11:26
15F:推 fishstay: 手動輸入數據?感覺很累 10/03 11:45
16F:推 neo5277: 可是excel其實蠻強大的,如果數據不是真的海量,我覺得ex 10/03 12:24
17F:→ neo5277: cel不錯用啊 10/03 12:24
18F:推 greenx: Excel很好用好不好 10/03 12:30
19F:→ xephon: 工具本來就不是重點 10/03 12:42
20F:→ joejoe14758: excel一堆巨集好嗎... 10/03 12:48
21F:推 automaton: 重點是model 的建立吧。 10/03 12:53
22F:→ AMG6000: excel可以畫圖 主管才看得懂 10/03 13:34
23F:推 james732: excel是神器啊 10/03 14:00
24F:→ odahawk: excel 本來就是數據分析的好工具阿 10/03 14:17
25F:推 mathrew: Excel 會用真的是神 10/03 14:18
26F:→ KernelChen: 用C做深度學習還敢拿出來說 不怕被笑? XD 10/03 14:19
27F:推 WayneHong: 弱弱問一下excel是只存data和label 10/03 14:21
28F:→ WayneHong: 還是連神經網路建模跟訓練都用excel跑啊? 10/03 14:22
29F:推 Apache: 不一定是用NN吧 10/03 14:55
30F:推 ag076810: 網路用excel跑真的神 10/03 15:05
31F:→ hsnuyi: 用紙跟筆也可以做DL啊 不就只是算數字? 10/03 15:16
32F:→ hsnuyi: 就只是個最佳化問題 套個AI當名稱就雞犬升天了XD 10/03 15:17
33F:推 aria0520: 用C做深度學習怎會被笑 tensorflow是用C++寫出來的某樓 10/03 15:56
34F:→ aria0520: 不知道嗎? 10/03 15:56
35F:→ aria0520: 難道你造輪子用python造? 10/03 15:56
36F:推 wang19980531: C++寫機器學習真的強 之前看過mnist手寫辨識就要百 10/03 16:26
37F:→ wang19980531: 行 10/03 16:26
38F:→ wellkom: 微軟應該要頒個匾額給這位大神的 10/03 17:06
39F:推 anguso: 傻孩子, Jeff Dean曾經有一次和team的下午咖啡時光, 和大 10/03 18:15
40F:→ anguso: 家說他一點都不愛Python, 最愛還是C++。那是在他們還在B 10/03 18:15
41F:→ anguso: uilding 2000的時候。 10/03 18:15
42F:推 antu1019: excel可以處理這麼大量的喔?是深度學習還是資料計算? 10/03 18:52
43F:→ xsoho: excel 可以做nn 10/03 19:19
44F:推 a11629933: 之前上課老師就用EXCEL VBA寫出SVM 10/03 19:38
45F:推 goldflower: 只能說真羨慕沒沒開發時程壓力 10/03 19:49
46F:推 jasonwu23: excel可以處理聯動資料 但是跑大量數據 讀檔之類就無 10/03 19:57
47F:→ jasonwu23: 法了 跟別的語言相容性也差 10/03 19:57
48F:推 s29940: excel幫助我跑完數據順利畢業耶 10/03 20:33
49F:推 sxy67230: excel原生就可以畫回歸分析啦,還有一堆外掛可以用,像e 10/03 23:17
50F:→ sxy67230: xcel2svm就設定好開啟分析外掛,結束。微軟自己本身也 10/03 23:17
51F:→ sxy67230: 有外掛支援excel直接分析,沒有說什麼要自己刻,除非你 10/03 23:17
52F:→ sxy67230: 有特殊需求要自己造輪子,要不然普通人用excel就很夠啦 10/03 23:17
53F:推 ando5566: Excel作有限差分法,too 10/03 23:19
54F:推 sxy67230: 你想用連matlab也可以寫機器學習,我研所就都用matlab 10/03 23:20
55F:→ sxy67230: 底層call C加速啦!python 大家也只是call call套件而已 10/03 23:20
56F:→ sxy67230: ,有很難嗎?又不是自己造輪子 10/03 23:20
57F:推 viper9709: 推十里坡劍神XD 10/04 00:21
58F:推 Infinair: 笑某樓說用C寫DL很好笑的人 你一定是只會call function 10/04 05:19
59F:→ Infinair: 的人 別出來丟臉啦 能用C++手刻出根本超強好嗎 10/04 05:19
60F:推 blackacre: 都是工具,只要結果友用就好了 10/04 05:39
61F:推 willy0206: 我當參三做的假資料都是靠excel自動產出的 科科 10/04 07:42
62F:推 sxy67230: 實際上是大家就算用c寫,大部分都是拿前人已經實現的部 10/04 09:14
63F:→ sxy67230: 分重新改寫而已,找不到資源的才會照著論文復刻在做測 10/04 09:14
64F:→ sxy67230: 試而已。 10/04 09:14
65F:推 sxy67230: 傅立葉、自動微分都有前人刻好了,剩下就是拼裝這些工 10/04 09:19
66F:→ sxy67230: 具。我反而看過有照著論文刻,重複檢查過每一個環節, 10/04 09:19
67F:→ sxy67230: 但就是最後跑出來的跟論文的數值不一樣的(後來綜合好幾 10/04 09:19
68F:→ sxy67230: 篇才發現他的實驗有點問題) 10/04 09:19
69F:→ KernelChen: 把造輪子當成在開車 我也是笑笑 10/04 13:25
70F:→ KernelChen: 真的不知道就不要亂說比較好。 10/04 13:25
71F:推 Morphee: 樓上 你有聽過 darknet 嗎? 10/04 15:22
72F:→ asdfghjklasd: Excel 後面有Power BI ?? 10/04 18:17
73F:推 sxy67230: 就算用c寫,大部分的人也不會從0開始有什麼問題嗎?我 10/04 18:19
74F:→ sxy67230: 碩論就用C++寫MCMC序列學習,上層才接matlab跑圖,會用m 10/04 18:19
75F:→ sxy67230: atlab跑圖也是教授說C++的圖表gui太醜了。我自己都不敢 10/04 18:19
76F:→ sxy67230: 說自己是從0開始的了,大部分都是看到可靠的實現先參考 10/04 18:19
77F:→ sxy67230: 改寫。 10/04 18:19
78F:推 sxy67230: 我都忘記還有darknet可以用了,連工作後要跑傅立葉用C也 10/04 18:23
79F:→ sxy67230: 是直接接fftw,後期要移植到手機才把進去裡面把lib瘦身 10/04 18:23
80F:→ sxy67230: 。 10/04 18:23
81F:推 Csongs: 我是覺得沒什麼問題..如果是教學的話 10/04 18:28
82F:推 wolfwolf: 程式語言的鄙視鏈要加入excel了嗎 10/04 19:13
83F:推 mike7689: 一般機器學習 迴歸分析哪些都算吧 10/04 21:19
84F:→ mike7689: 沒有人說nn based才算 10/04 21:20
85F:推 wang19980531: 突破盲腸 Naive Bayes 隨機森林也算機器學習啊 10/04 23:12
86F:推 senjor: Matlab跑NN跟SVM不是很常見嗎?我以為他是之前的常用工具 10/05 04:34
87F:→ alice78226: 迴歸 多變還有一堆統計公式,Excel很多年前就都有內 10/05 09:26
88F:→ alice78226: 建了阿,差別在能處理的資料量 10/05 09:26
89F:→ purpleboy01: 有些人是沒有搞懂機器學習裡包含哪些東西 10/05 14:06
90F:→ labbat: excel吃到1.5GB記憶體就準備爆炸 10/05 23:07
91F:→ y3k: 有阿 之前我家也很高興說Excel可以這樣搞 這樣大家都會了呢 10/10 23:26
92F:推 billy8407: 我都用pyqt5畫素描 10/24 00:38
93F:→ Edison4ever: 可能要靠微軟把工具都整合在一起吧...XD 12/24 17:46
94F:→ daniel021477: 數據量不大我覺得ok啦 07/09 09:25