作者del680202 (HANA)
看板Soft_Job
标题[心得] 原来真的有人用excel做机器学习
时间Thu Oct 3 07:55:29 2019
最近在帮某公司导机器学习的流程自动化
问问对方的principal data scientist原本流程是怎麽作的
对方说他excel man 所有作业用excel完成
也就是请助手把数据手动打成excel档 然後套他用excel开发好的model去做预测输出
公司最核心的算法都在他的excel档里面
然後看了一下历史纪录 哇 成千上百的excel档
以前看过有书教人用excel作机器学习
想说现在这时代这种书谁会想看
还真的有人这样用
大开眼界
-----
Sent from JPTT on my iPhone
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 126.233.116.244 (日本)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1570060531.A.F70.html
1F:→ pelicanper: Excel用的好,工作没烦恼 10/03 07:57
2F:推 yuigahamayui: 日本 10/03 08:03
3F:推 nosy098: 太神了吧~ 10/03 08:35
4F:→ ruthertw: 其实不会喔,某外商纯用C做深度学习,还有闭门造车的APIs 10/03 08:56
5F:推 abc0922001: 创造工作机会欸 10/03 08:57
6F:→ ruthertw: 这间外商里面很多神人,还满好查的,几年前狂找人,现在没 10/03 08:57
7F:→ ruthertw: 有什麽职缺罗 10/03 08:58
8F:推 wrt: 十里坡剑神是什麽?剑神 10/03 09:36
9F:推 j0958322080: 一堆晶圆厂也是只用office阿 10/03 09:48
10F:→ DCTmaybe: 但人家可以跑出主管满意的数据,而且这超难被取代 10/03 10:37
11F:推 chocopie: RPA 10/03 10:47
12F:推 BaGaJohn5566: 主管高兴不就好了 他爽用matlab也可以 10/03 10:50
13F:推 ladyboy99: Domain know how 有了 工具只是其次 10/03 10:58
14F:推 gbd37: EXCEL神的话真的很神 10/03 11:26
15F:推 fishstay: 手动输入数据?感觉很累 10/03 11:45
16F:推 neo5277: 可是excel其实蛮强大的,如果数据不是真的海量,我觉得ex 10/03 12:24
17F:→ neo5277: cel不错用啊 10/03 12:24
18F:推 greenx: Excel很好用好不好 10/03 12:30
19F:→ xephon: 工具本来就不是重点 10/03 12:42
20F:→ joejoe14758: excel一堆巨集好吗... 10/03 12:48
21F:推 automaton: 重点是model 的建立吧。 10/03 12:53
22F:→ AMG6000: excel可以画图 主管才看得懂 10/03 13:34
23F:推 james732: excel是神器啊 10/03 14:00
24F:→ odahawk: excel 本来就是数据分析的好工具阿 10/03 14:17
25F:推 mathrew: Excel 会用真的是神 10/03 14:18
26F:→ KernelChen: 用C做深度学习还敢拿出来说 不怕被笑? XD 10/03 14:19
27F:推 WayneHong: 弱弱问一下excel是只存data和label 10/03 14:21
28F:→ WayneHong: 还是连神经网路建模跟训练都用excel跑啊? 10/03 14:22
29F:推 Apache: 不一定是用NN吧 10/03 14:55
30F:推 ag076810: 网路用excel跑真的神 10/03 15:05
31F:→ hsnuyi: 用纸跟笔也可以做DL啊 不就只是算数字? 10/03 15:16
32F:→ hsnuyi: 就只是个最佳化问题 套个AI当名称就鸡犬升天了XD 10/03 15:17
33F:推 aria0520: 用C做深度学习怎会被笑 tensorflow是用C++写出来的某楼 10/03 15:56
34F:→ aria0520: 不知道吗? 10/03 15:56
35F:→ aria0520: 难道你造轮子用python造? 10/03 15:56
36F:推 wang19980531: C++写机器学习真的强 之前看过mnist手写辨识就要百 10/03 16:26
37F:→ wang19980531: 行 10/03 16:26
38F:→ wellkom: 微软应该要颁个匾额给这位大神的 10/03 17:06
39F:推 anguso: 傻孩子, Jeff Dean曾经有一次和team的下午咖啡时光, 和大 10/03 18:15
40F:→ anguso: 家说他一点都不爱Python, 最爱还是C++。那是在他们还在B 10/03 18:15
41F:→ anguso: uilding 2000的时候。 10/03 18:15
42F:推 antu1019: excel可以处理这麽大量的喔?是深度学习还是资料计算? 10/03 18:52
43F:→ xsoho: excel 可以做nn 10/03 19:19
44F:推 a11629933: 之前上课老师就用EXCEL VBA写出SVM 10/03 19:38
45F:推 goldflower: 只能说真羡慕没没开发时程压力 10/03 19:49
46F:推 jasonwu23: excel可以处理联动资料 但是跑大量数据 读档之类就无 10/03 19:57
47F:→ jasonwu23: 法了 跟别的语言相容性也差 10/03 19:57
48F:推 s29940: excel帮助我跑完数据顺利毕业耶 10/03 20:33
49F:推 sxy67230: excel原生就可以画回归分析啦,还有一堆外挂可以用,像e 10/03 23:17
50F:→ sxy67230: xcel2svm就设定好开启分析外挂,结束。微软自己本身也 10/03 23:17
51F:→ sxy67230: 有外挂支援excel直接分析,没有说什麽要自己刻,除非你 10/03 23:17
52F:→ sxy67230: 有特殊需求要自己造轮子,要不然普通人用excel就很够啦 10/03 23:17
53F:推 ando5566: Excel作有限差分法,too 10/03 23:19
54F:推 sxy67230: 你想用连matlab也可以写机器学习,我研所就都用matlab 10/03 23:20
55F:→ sxy67230: 底层call C加速啦!python 大家也只是call call套件而已 10/03 23:20
56F:→ sxy67230: ,有很难吗?又不是自己造轮子 10/03 23:20
57F:推 viper9709: 推十里坡剑神XD 10/04 00:21
58F:推 Infinair: 笑某楼说用C写DL很好笑的人 你一定是只会call function 10/04 05:19
59F:→ Infinair: 的人 别出来丢脸啦 能用C++手刻出根本超强好吗 10/04 05:19
60F:推 blackacre: 都是工具,只要结果友用就好了 10/04 05:39
61F:推 willy0206: 我当参三做的假资料都是靠excel自动产出的 科科 10/04 07:42
62F:推 sxy67230: 实际上是大家就算用c写,大部分都是拿前人已经实现的部 10/04 09:14
63F:→ sxy67230: 分重新改写而已,找不到资源的才会照着论文复刻在做测 10/04 09:14
64F:→ sxy67230: 试而已。 10/04 09:14
65F:推 sxy67230: 傅立叶、自动微分都有前人刻好了,剩下就是拼装这些工 10/04 09:19
66F:→ sxy67230: 具。我反而看过有照着论文刻,重复检查过每一个环节, 10/04 09:19
67F:→ sxy67230: 但就是最後跑出来的跟论文的数值不一样的(後来综合好几 10/04 09:19
68F:→ sxy67230: 篇才发现他的实验有点问题) 10/04 09:19
69F:→ KernelChen: 把造轮子当成在开车 我也是笑笑 10/04 13:25
70F:→ KernelChen: 真的不知道就不要乱说比较好。 10/04 13:25
71F:推 Morphee: 楼上 你有听过 darknet 吗? 10/04 15:22
72F:→ asdfghjklasd: Excel 後面有Power BI ?? 10/04 18:17
73F:推 sxy67230: 就算用c写,大部分的人也不会从0开始有什麽问题吗?我 10/04 18:19
74F:→ sxy67230: 硕论就用C++写MCMC序列学习,上层才接matlab跑图,会用m 10/04 18:19
75F:→ sxy67230: atlab跑图也是教授说C++的图表gui太丑了。我自己都不敢 10/04 18:19
76F:→ sxy67230: 说自己是从0开始的了,大部分都是看到可靠的实现先参考 10/04 18:19
77F:→ sxy67230: 改写。 10/04 18:19
78F:推 sxy67230: 我都忘记还有darknet可以用了,连工作後要跑傅立叶用C也 10/04 18:23
79F:→ sxy67230: 是直接接fftw,後期要移植到手机才把进去里面把lib瘦身 10/04 18:23
80F:→ sxy67230: 。 10/04 18:23
81F:推 Csongs: 我是觉得没什麽问题..如果是教学的话 10/04 18:28
82F:推 wolfwolf: 程式语言的鄙视链要加入excel了吗 10/04 19:13
83F:推 mike7689: 一般机器学习 回归分析哪些都算吧 10/04 21:19
84F:→ mike7689: 没有人说nn based才算 10/04 21:20
85F:推 wang19980531: 突破盲肠 Naive Bayes 随机森林也算机器学习啊 10/04 23:12
86F:推 senjor: Matlab跑NN跟SVM不是很常见吗?我以为他是之前的常用工具 10/05 04:34
87F:→ alice78226: 回归 多变还有一堆统计公式,Excel很多年前就都有内 10/05 09:26
88F:→ alice78226: 建了阿,差别在能处理的资料量 10/05 09:26
89F:→ purpleboy01: 有些人是没有搞懂机器学习里包含哪些东西 10/05 14:06
90F:→ labbat: excel吃到1.5GB记忆体就准备爆炸 10/05 23:07
91F:→ y3k: 有阿 之前我家也很高兴说Excel可以这样搞 这样大家都会了呢 10/10 23:26
92F:推 billy8407: 我都用pyqt5画素描 10/24 00:38
93F:→ Edison4ever: 可能要靠微软把工具都整合在一起吧...XD 12/24 17:46
94F:→ daniel021477: 数据量不大我觉得ok啦 07/09 09:25