作者Wush978 (拒看低质媒体)
看板Soft_Job
标题Re: [请益] 值得花十万到巨匠 学大数据软体吗?
时间Sun Dec 25 13:18:56 2016
※ 引述《s00771book (320)》之铭言:
: 想问问前辈们
: 目前小妹的工作只是个
: 用BI cognos 拉资料做数据分析的助理
: 再用Excel枢纽分析 写写函数
: 做报告给主管看的工作
: 薪水少之又少 也不算是一技之长
: 根本不足以与大数据相提并论
: 目前向往大数据工作的方向
: (也是很有未来的工作 大陆已经很成熟了)
: 查看了104人力银行
: 大数据分析工作需要的条件:
: MS SQL 资料探勘 R语言 Hedoop
: 所以我去巨匠谘询了一下
: 课程规划师说要学 MCSA MCSE
: 再考微软证照70-461.462.463.464.465
: 才算是完全学会这套软体
: 和证明给面试官看
: 但是学费竟然快要十万
: 想请问有在做这方面工作的朋友们
: 真的值得花这笔钱吗?
: P.S.我只是个国立科大 企管+金融的学士而已
: 没有漂亮的学历 只能学一技之长补足自己
: 也不是资工 资管的科系的
: 希望前辈们能给我建议 谢谢你们>////<
如果要走数据分析(抱歉,我不太喜欢用大数据这个词)的话,
从学R 入门也是一个方法。
资料科学有三个要素:programming, statistics, domain knowledge
我自己在台湾的职涯差不多是:
有programming --> 薪资为 n
有programming + statistics ( 差不多是 machine learning ) --> 2n
有programming + statistics + domain knowledge --> 4n
你目前已经在工作了,只要花心思就可以开始累积domain knowledge:
你们领域中在意的问题是什麽?哪些方向?各种问题的价值?... etc
Programming的话坊间已经有很多自学教材了。
我这边推荐我与社群做的: R语言翻转教室
http://datascienceandr.org
你可以自由的使用它做自学R 语言,大概会花你12-18小时。
教材中我自认写的最满意的是Data Engineer的那段,
感谢社群朋友的捐献,拿一个利用Open Data计算房地产泡沫化指数的小专案当成作业
因为原始资料完全没有清理,所以这个作业差不多是一个期末报告的难度
但是它非常的贴近实际做资料科学与Open Data相关工作的情境。
这个教材对没有程式基础的同学比较挑战,
有问题,网页的右下角有聊天室可以问我,
或是你也可以考虑先使用其他教材。
台湾的R社群中还有:
- ptt R_Language版的板主:andrew 的「R 演习室」
http://apansharing.blogspot.tw/p/r.html
- Tony Yao-Jen Kuo 与 Data Camp合作的教材:
https://goo.gl/KxjhIq
这套与R语言翻转教室很类似,差异在:
- 是不用搞安装环境,想尝试可以更快开始尝试
- 课程内容差不多是R语言翻转教室RBasic的范畴,但是难度应该对新手更友善
(我最近正计画要降低R语言翻转教室的难度 ...)
R还有非常多其他的线上自学资源,族繁不及备载
其实你也不一定要学R, python 也是和R 一样好的分析工具,网路上也可以找到很多
自学资源
我觉得你「能不能运用自学资源自学工具」其实是衡量自己Programming能力的指标。
如果不能的话,就先好好学一套工具,基本上就具备这个能力了。
最後分析的能力,我觉得这是自学比较难补充的部份。
如果数学够好,就去啃书本吧。
另一种作法,是去分析的单位做Data Engineer,或是做研究助理,然後一边工作一边学
但是最好还是去补个与你想投入领域相关的硕士学位。
因为分析这种事情,很看个人的信誉、声望,而且也离不开domain knowledge。
好的人做的分析报告,大家直接跳到结论。不好的人,就算你该做的都做了也没人信。
要走这条路,一辈子也都要学习,共勉之。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.163.178.87
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1482643139.A.2E2.html
1F:→ beaprayguy: 终於有人点出大数据不等於资料科学, 12/25 13:22
2F:→ beaprayguy: 我超觉得一直强调大数据根本有事一一... 12/25 13:22
大数据是个定义不明确的词汇,所以要介绍怎麽学大数据,
问100个人大概会有25个说法,然後就战了。
相对来说,资料科学是比较定义明确的词汇,
从公认的三个要素(programming, statistics, domain knowledge)分开来介绍,
也是比较好写的。
3F:→ YishengSu: 比较像统计工程? 12/25 13:26
4F:推 neo5277: 2n挺吸引人的 ,4n也是 12/25 13:39
5F:推 bronx0807: 推 12/25 13:41
※ 编辑: Wush978 (1.163.178.87), 12/25/2016 13:58:00
6F:推 sivid: 推推 12/25 15:04
7F:推 yahoo523: 吴大文必推 用过他的翻转教室课程 很厉害!! 12/25 15:19
8F:推 y800122155: 推学长! ....HW6还没做完>< 12/25 15:21
9F:推 cmelo1515: wush大就是帅 12/25 16:15
10F:推 wuchihsu: 推推 12/25 17:09
11F:推 Trick: 所以N是多少呢? 12/25 18:01
12F:推 LMY8684: 朝圣推 12/25 18:27
13F:推 kenshin528: 钓出神人 12/25 21:43
14F:推 joker0634: 看到WUSH只好推了 12/25 21:57
15F:推 babypanda: 推,资料科学 12/25 22:24
16F:推 jakert123: 到底哪里有开放的data可以让人学大数据 12/26 02:14
17F:→ beaprayguy: 开放政府 12/26 06:25
18F:→ vn509942: 感谢分享 12/26 07:38
19F:推 eric500g: 推 12/26 08:06
20F:推 mirage7714: 推Wish大大 12/26 12:26
21F:推 frankshih: 推 wush 12/26 23:31
22F:推 snakeooxx: 朝圣 Wush <(_ _)> 12/27 00:57
23F:推 powergreen: 推推推 12/27 08:35
24F:推 cywhale: 推Wush大~ 12/27 12:31
26F:→ cywhale: 借转R版,谢谢罗~ 12/27 13:24
27F:推 autumnal7: 推Wush 12/27 14:25
28F:→ f496328mm: data部分 kaggle不错 12/27 17:50
29F:→ f496328mm: 基本上很难碰到大数据拉,光是设备,一般人就没办法 12/27 17:50
30F:推 f496328mm: kaggle方面,我有做两个题目,都有前10% 12/27 17:55
32F:→ f496328mm: 分享给入门者 12/27 17:55
33F:推 f496328mm: data有7千万笔 可以慢慢玩 12/27 17:58
34F:推 pig0038: 推推 12/27 19:25
35F:→ pig0038: 一般能作data mining 就很不错了 12/27 19:26
36F:推 roger00: 推这篇 12/28 09:59
37F:推 yanchenglin: WUSH学长就是神! 推推推 12/29 02:02
38F:推 ConfusedDuck: 推推推~~ 12/31 08:36
39F:推 machia: 05/10 21:02