作者sssh (叫我松高魂 ~~)
看板DataScience
标题Re: [心得] 自学AI资源分享
时间Tue Aug 13 03:58:51 2019
感谢原 PO 的分享,我也来分享一下我自己的学习清单
==== 前言 ====
去年因缘际会知道了有关大数据、资料科学、机器学习这些领域
本来考虑要去参加资策会的课程,但自己要在家带小孩
如果参加课程,小孩要找保母,整个机会成本太高,因此决定自学先
网路课程现在几乎是随手可得,想要自学的人根本不怕没有教材可以学习,但是五花八门
的课程中,怎麽去选择就是一个很重要的问题了。
我自己是一个门外汉,因此在选择课程以及安排上面花了蛮多时间,以下大多是我看过或
是大概浏览过觉得不错的课程,就推荐给想要自学又不知道怎麽开始的朋友们吧~
==== 概论 ====
由於自己虽为国立大学数学系毕业,但毕业非常多年,加上自己也非科班出身,因此想要
先了解整个领域的范畴、概要,之後再开始针对各个科目分进合击。
PS : 初期我自己都以大数据为出发点,所以上的课都是大数据概论取向,但再其中其实
对於资料科学、AI、机器学习都会讲到。
1.
[ Coursera ] 大数据分析:商业应用与策略管理 (Big Data Analytics: Business
Applications and Strategic Decisions)
这门课是台大与玉山银行合作开的线上课程,与其说是课程,我认为比较偏向讲座,在这
过程中可以对大数据、机器学习等在商业上的应用。这堂课可当作补充资料来上,会有一
些实务应用上的概念,当然,如果没时间也不一定非得要上。
2.
[ Coursera ] Big Data Specialization
University of California, San Diego 开设的这们课程,我个人还蛮推荐的,尤其是对
跨领域、无先备知识的学习者来说,可以在这一系列课程中很快速地对整个领域有蛮深入
的理解。
3.
[ Book ] 精通 Python
4.
[ Book ] Python 资料科学学习手册
这两本都是 O’REILLY 的经典书籍,我必须坦白说我没有完整的看完,精通 Python 我
针对资料科学的部分有完整看过,然後做习题,但里面很多章节稍微跟资料课学无关的我
几乎都暂先跳过,而资料科学学习手册我是都拿来当工具书翻阅。( 所以我 coding 能力
还是一样很差XDDDDD )
==== Python ====
第二阶段我开始以 Python 为主进行学习,因为我自己 coding 能力几乎是 0,这个部分
必然要作为初期学习的重点项目。另外,虽然说这是第二阶段,但其实这部分跟上述的概
论课程我几乎都是同时期一起上课。( 不过我坦承到现在我自己的 coding能力还是很差XDD )
1.
[ Coursera ] Python for Everybody Specialization
这门是 University of Michigan 所开设的 Python 专项课程,完全从 0 基础开始上课
,上完以後可以可以进行一些初阶的程式作业我想是没有问题的,这堂课并没有太多针对
资料科学的部分,主要是以各领域都会用到的基础工具为主。Charles Russell 的上课方
式我超喜欢,喜欢友去上课方式的人我想也会跟我一样喜欢这门课。
2.
[ Coursera ] Applied Data Science with Python Specialization
一样是 University of Michigan 开设的,这专项课程我作为上门课程的接续课程。前面
几堂会针对 python 在资料科学中会用到的模组、方法进行概略式的浏览,後面则会针对
视觉化、机器学习等领域做较为深入的介绍。整个课程较上一门来说困难度增加不少,因
为我自己有做手写笔记的习惯,这门课的许多东西在我现在 coding 遇到问题时都还能翻
阅笔记作为工具书使用,我觉得受益不少。
3.
[ Coursera ] Fundamentals of computing
Rice University 所开设的课程,之前应该也是在论坛看见推荐的,但课程难度较高,目
前我也是暂时先搁置还未进行这课程的学习。
===== Machine Learning =====
1.
[ YouTube ] 机器学习基石 & 技法
(Machine Learning Foundations and Techniques)
台大林轩田教授所开设的机器学习课程,在 Coursera 与 YouTube 军可以免费观看课程
内容。这门课主要以基础的机器学习演算法为主,但虽然说世纪处演算法,但内容包含的
数学比重较重,啃下来的确会有点困难,但整个课程的安排的确非常流畅,老师的讲述也
算是蛮清楚。而且教授对於课程教学十分用心,如果在 YouTube 或是 Coursera 上面提
问,教授 (或助教) 都会尽可能地回覆。( 即使课程已经是两三年前的课程了,现在也都
会看到教授的回覆,非常用心。 )
2.
[ YouTube ] Machine Learning — 李宏毅
台大李宏毅所开设的机器学习课程,一直以来都是台湾及中国学习者极力推荐的中文课程
之一。课程内容与时俱进,每一年都会将最新的机器学习、深度学习的演算法、模型加入
到课程内,让学习者能够跟上整个领域的发展。数学的比重比林轩田教授的课程低,而且
多了许多有趣的范例及讲述,上课起来轻松不少。然而,影片内容我个人觉得安排较为紊
乱,可能是每一年的课程进度剪接而成,在某一些地方的衔接度较差,这是上课时稍微让
人困惑的地方。不过瑕不掩瑜,这门课程我认为还是非常值得花时间上的。
[ 补充 ] 最近中国一些人将李宏毅的课程整理成一个 github 专案,完全复刻课程内容
,包含了课程中的所有 demo 以及课程作业内容,非常值得大家在上课的同时做参考使用
。
[ 补充 ] 李宏毅另外有一门课程 " Machine Learning and having it deep and
structured ",会更深入讲解机器学习的演算法跟架构,这也是後续上完 Machine
Learning 後可以深入补充的课程。
3.
[ Coursera ] Machine Learning — Andrew Ng
由 Stanford University 的吴恩达教授所开设的课程,这已经是全世界公认的经典了,
不过已经花了大半年上完前面两门课程的我,可能要稍作休息,待日後有机会再来进行这
门课程的学习。
4.
[ YouTube ] Large-Scale Machine Learning
清大吴尚鸿所开设的课程 (
http://www.cs.nthu.edu.tw/~shwu/courses/ml/),忘了在哪
看见推荐的,我有上去大概看了一下,就学习论的部分我觉得讲解的蛮清楚,就也是有空
可以再回头来看看。
===== Mathematics =====
整个 Machine Learning 所涵盖的数学领域其实是很广的,有一些甚至不是数学系四年会
碰触到的部分,而且某些部分甚至都是数学系、所一整学年的课程,我认为不用太纠结每
一个数学细节,找到一个可以说服自己的方式就好。( 当然,如果你真的想走演算法这条
路,要求就要再提高ㄧ些 )。如果有时间我会建议可以把机率统计以及线性代数的部分上
过一次(我大学机率统计实在学得惨不忍睹),我认为这两个领域如果可以上手,就会轻松
许多。
1.
[ 清大开放式课程 ] 机率论
2.
[ 清大开放式课程 ] 统计学
3.
[ 清大开放式课程 ] 数理统计
这三们都是清大郑少为老师所开的课,基本上他的机统普遍受到许多人的推荐,我自己有
看过前面几堂的机率论,我认为条理清楚,讲义也很详细,这是我真的很想找时间上的课
程。
4.
线性代数
这个部份我目前暂时没有重新上课的打算,大学教授上的非常好,我的笔记也都还留着,
就可以来回对照着参考,如果有推荐的课程也可以让我知道,一起推荐给所有人参考看看
。
===== 补充资料 =====
这里推荐几个我认为很有帮助的学习途径,有些是课程,有些并不算是。但我认为都可以
在上面这些基础课程以外作为增强实力的补充教材。(备注 : 这里我选出来的都是比较广
泛性的平台,但 Medium 或是ㄧ些个人部落格也有很多非常棒的补充资料可以看,但这样
的资料多且杂,我就暂时没收在下列推荐名单中。)
1.
AI 研习社 ( https://ai.yanxishe.com/ )
不得不说,中国在这领域的发展真的比台湾快而且丰富,当我在学习过程中找寻中文资料
时,九成都是从中国的论坛或是部落格中找到,台湾在这方面的分享上面的确比较少。
AI 研习社我会建议大家可以去他的线上课程看,里面有几个大师级的课程 ( 重点是有简
中字幕XD ),例如 Hinton 的课程我就会想要找时间来看一下。里面还有一些资料、论文
整理的部分,大家也是可以上去晃晃看。
PS:它有一门「机器学习必修之数学基础」系列课程其实我还蛮有兴趣的,但是学费不便
宜就…
2.
CSDN博客 ( https://blog.csdn.net/ )
不管阅读论文还是课程上面有疑问,绝对可以针对同一件事情再上面找到非常多样化的解
释。上面我曾经说过,很多时候不要拘泥,找到一个能说服自己的方式就好,通常我都会
在许多不同的解释当中选择一个我比较理解且能接受的方式作为我对这件事情的理解。
3.
知乎
这有点像是中国版的奇摩知识+ (?),针对一个问题也可以看到底下有许多不同角度的切
入,我觉得这样的学习其实蛮不错的。当我在找资料的时候,只要是CSDN跟知乎我都会点
进去看一下,许多时候都会有不错的收获。
4.
reddit/MachineLearing ( https://www.reddit.com/r/MachineLearning/ )
reddit 的 Machine Learning 版里面有许多的神人,还潜伏了许多论文的作者在里面,
时不时会有一些很新的论文发表、成果发表还有许多有趣的讨论在里面,我觉得可以收藏
起来看。
5.
微博公众号
好,我知道这部分争议很大,如果真的很介意的可以跳过这一 part。
我完全没有在用微博,但为了ㄧ些公众号的订阅我才开始使用。许多公众号会把很新的
AI 新知、或是一些知识整理放出来,虽然品质参差不齐,但也不得不说有时候真的能捡
到一些不错的好文章。另外,觉得阅读reddit 全英文资料很吃力的,有时候大概在
reddit 上面发表一两天之後公众号就有简体中文的说明出来,我觉得有时候偷吃步其实
也是蛮可以的啦XDDDDD。还有一个公众号会每天发送各种领域最新的论文内容出来,如果
阅读论文速度很快的,可以从这样的公众号中拿到很多最新的论文资讯。
=======END=======
以上是我自己的一些学习资讯,也提供给大家参考看看
当然还有很多非科班出身必须要修的 例如资料结构跟演算法等等
我目前还没有什麽概念,如果有人有推荐课程也希望不吝分享让我知道一下
--
听众散去了,希尔伯特却仍留在讲台上,
他等着看自己是否已经运用有利的例子,优越的论证,
以及具诱惑力的23个问题,
塑造他期盼见到的未来.....
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.45.98.201 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1565639939.A.F2F.html
1F:推 kumitang: 推分享 08/13 04:31
2F:推 y956403: 好奇这样学完能找到什麽类型的工作 08/13 06:18
3F:推 st1009: 推推 08/13 06:46
4F:推 sxy67230: 台湾的情况下,还是要补个硕班学历,要不然就是Kaggle竞 08/13 08:21
5F:→ sxy67230: 赛的成绩,要不然很难找到好的DS相关工作。毕竟DL跟ML 08/13 08:21
6F:→ sxy67230: 的门槛比较高,就算是资工很多新的算法还是要搭配硕班 08/13 08:21
7F:→ sxy67230: 的课程,像随机程序、消息理论这类高阶统计、资讯理论 08/13 08:21
8F:→ sxy67230: 的课程。 08/13 08:21
9F:推 sxy67230: 忘记了,还有电脑视觉,这门课以前我的学校也是开给硕班 08/13 08:23
10F:→ sxy67230: 的,现在不知道有没有下修。 08/13 08:23
11F:推 st1009: 是说板上有一些徵才讯息,有啥工作可以参考 08/13 08:50
12F:推 WilliamLFY: 帮推分享 08/13 09:25
13F:推 fishstay: 推分享 08/13 09:31
14F:推 DaLanPaa: 上过基石和李宏毅的课 其实不用再浪费时间看吴恩达在cou 08/13 14:59
15F:→ DaLanPaa: rsera的课了 08/13 14:59
16F:→ DaLanPaa: 太简单又太旧了 只适合给初新者入门 08/13 14:59
17F:推 filialpiety: 推推 08/13 18:09
18F:推 teamo123: 吴恩达的影片真的超旧,看到影片右下角的时间有吓一跳 08/13 18:10
19F:推 aocaoef: 推分享,我本身非二类组科系毕业,所以线代的部分是听清 08/13 18:54
20F:→ aocaoef: 大赵启超老师的课程,调理清晰又不会太难,适合一三类组 08/13 18:54
21F:→ aocaoef: 的学生~~ 08/13 18:54
22F:推 yougigun: 推 ps cousera 上也有 andrew 开的deep learning 的课也 08/13 19:14
23F:→ yougigun: 不错 08/13 19:14
24F:推 sxy67230: 吴恩达的课要去看他的新课程,课程不难,但是光是看采访 08/13 19:32
25F:→ sxy67230: hinton、pieter、Ian Goodfellow就值了 08/13 19:32
26F:推 sxy67230: 然後要上Coursera 的课建议每个都要跟着课程步调实作 08/13 19:34
27F:推 sxy67230: 然後吴恩达下半年好像还有新的课程,直接教tf2.0的,比 08/13 19:37
28F:→ sxy67230: 较针对不想懂太深理论的开发者面向,可以报名 08/13 19:37
29F:推 goldflower: if you don't understand, that's totally fine 08/13 23:18
30F:→ Kazimir: 线代最受好评的课应该是MIT的18.06 austin在edx上的那门 08/14 08:53
31F:→ Kazimir: 课教得很乾 不过作业设计的很好 08/14 08:53
32F:推 h5904098: 推原po分享 另外线代部分可以参考交大周志成教授的blog 08/15 20:53
33F:→ h5904098: 内容范围蛮广的 但推导细节跟概念讲的很清楚也很直观 08/15 20:53
34F:推 erre: 感觉还是掰陈直接call svm比线性回归比较AI 08/16 11:46
35F:推 futri752: 推分享 08/16 20:45
36F:推 FerLam: 推分享 11/05 12:15
37F:推 wahahahaaa: 推分享 11/13 00:50
38F:推 Fordevoted: 推 11/14 23:08
39F:推 abjw778899: 推 12/04 07:49
40F:推 LLVMBackend: 这本书觉得很适合初学者 05/30 12:09