作者backprog (back-propagation)
看板Soft_Job
标题Re: [请益] 徵大数据课程心得
时间Sun Apr 2 16:19:11 2017
我目前从事资料科学相关工作,
时间分配上,扣除泡咖啡、开会、喇赛等等时间以後
95% Data mining(包含资料视觉化)、5% Machine Learning
以下是我的大数据课程心得:
--
[机器学习 3学分]
最早在学校修这门课的时候,不知道需要什麽先备知识。
没有机率、统计等基础就傻傻跑去修,
线代只学过工程数学那些,而且还忘得差不多了...
结果,除了 k-mean 以外什麽都没学到,所以就被当了。
--
之後,我把田神的 HW0 拿来做,
想说:「写出这些题目,应该就有卷土重来的本钱了吧...」
当时 HW0 都是找某位经济系的同学请教才弄懂,给我看的都是五专会统科的课本。
我跟她说:「天啊你有超有做AI的天分,只要会写程式的话就超强惹!」
结果,她现在跑去绿地球当空姐。
--
[Pattern Recognition 3学分]
然後,我觉得自己应该准备好了,就去修这门课。
选课前,我还拿着 HW0 问老师:「懂这些够吗?」
修课以後学到特徵、资料正规化、训练集、测试集,交叉验证等等观念,
才慢慢建立起比较完整的资料科学观念轮廓。
虽然考数学题的时候,成绩还是很惨烈,
但是老师要求我们在纸上一步步推演 Perceptron 的运作过程,
推演完以後有一点点"奇妙的"感觉,但我说不清楚是什麽。
为了弄清楚,为了让这个感觉更强烈,我用C++自干出一个 Perceptron,
搭配 OpenCV 把过程视觉化。
跑训练的时候,看着自己写的 Perceptron 不停移动,
真的慢慢把两类 sample set 切得越来愈开。
我第一次感到自己写的程式有智慧,真的会自己发现些什麽,那种感动是难以言喻的~
这门课还有学到贝氏机率、kNN、SVM 等其他模型,
以及升维、降维等等一些入门的特徵处理手法。
--
当时深度学习在台湾还没红,至少在台湾学界并不是广为人知的。
TensorFlow 也还没出来。
之後更进阶的东西我大多数都是靠自修、或者和朋友同事讨论,
就没再上过这种正式的课程,但修了 Pattern Recognition 应该是把我带入门的关键。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 180.177.53.142
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1491121154.A.C9F.html
※ 编辑: backprog (180.177.53.142), 04/02/2017 16:31:31
1F:推 gerojeng: 赞赞赞 04/02 17:10
2F:推 cuteSquirrel: 推荐这篇文章。 04/02 18:48
3F:推 ahahahahah: 猛 04/02 18:59
4F:推 starcraftiii: 一般来说资料视觉化大概占了七八成的时间 04/02 19:28
5F:→ starcraftiii: 不然麻瓜会看不懂我们在做什麽 04/02 19:28
没错
6F:推 waterdisney: 经济系同学的图呢? 04/02 19:39
在我深深的脑海中~~
7F:推 popxpopxpop: 推 04/02 20:01
8F:推 kenshin528: 羡慕不用做 data clean 和 etl 04/03 00:58
没有不用,我只是把这两样当作 data mining 理所当然的一部分
9F:→ spiderway: 那你就视觉化啊 04/03 00:59
10F:→ angusyu: HWO是什麽? 04/03 02:24
homework 0
※ 编辑: backprog (125.227.205.43), 04/03/2017 12:17:28
11F:推 a1982213: 给一下楼上 林轩田 homework 0 04/04 19:17