作者applehpsh ()
看板Soft_Job
标题Re: [请益]资料分析/科学的工作是不是几乎都要硕士..
时间Fri Feb 9 00:54:35 2018
※ 引述《HWSH (光的夜生活)》之铭言:
: 小弟去年从国立台北大学统计系毕业
: 计画先工作个两三年再去申请国外研究所
: 目前即将服完兵役 本来是希望年後可以开始上班
: 最近几天开始找工作 履历却一直被已读
: 感到一点小小的「挫折」
: 看了一下应徵者状况 六七成都是硕博
: 唉学历拚不过别人真的是硬伤
: 真的没有一些初阶的资料科学家助理工作可以做做看嘛哈哈
: 我很乐意从Data Cleansing的工作做起
: 交代一下背景
: 大概是大三决定要走资料科学家这条路
: 接触coding到现在大概两年
: 最常用的是R跟SAS
: 有去修资工的资结跟演算法
: 会一点C跟Matlab
: 最近在看线上课程学python
: 英文听说读写没问题
: SQL还真的完全没碰过(满多职缺都有要求)
: Deep learning几乎没有头绪(只知道ML)
: Hadoop跟Spark只知道是在干嘛的也没有实际操作过
: 唉唉真的是太嫩了
: 想请版上的前辈大大们点一盏明灯提供一点建议
: 谢谢谢谢 用力鞭没关系
身为这一块的弱弱从业人员给你建议
我觉得你心态可能要改
资料科学家 70%以上的时间都在做data cleansing
但你好像搞错状况了 以为这种东西是初阶的工作
但是实际上并不是这样 实战经验上需要想办法增进把资料清整时间到可以拿去建模
在台湾 有意愿想做这方面的公司在过去对於资料的管理上都很不严谨
你看到的会是杂乱无章又一堆莫名其妙的资料
光是处理资料encoding的问题就够你烧脑烧时间的 更别说还有一堆杂事
如果你以为资料科学家只要爽爽地建模就好了那真的是太天真了
加上从你内文中没接触过SQL 没玩过Deep learning 好像也不会爬虫
资料视觉化的工具也没提到会不会
ML到底接触多深也不知道 要走资料这块只会R却不会python 也是硬伤
劝你先去了解一下R和Python彼此的优缺点
另外有没有实际上玩过什麽专案也看不出来
讲白了如果我部门开缺你来应徵 我还真不知道有什麽诱因让你进来一同工作
有个建议是如果真的想增进实力
上去Kaggle看看其他人在干嘛 同样的dataset你能不能做出跟人家一样的结果
或是去挑个竞赛区的试试看自己做出来的结果到哪
另外就是最近吹很大的各种相关“前景”请审慎看待不要一头热
有时候实务面上跟这些投机客炒作的泡泡还是有不小的落差
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.34.121.188
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1518108879.A.FB1.html
1F:推 wilson85771: 推这篇 02/09 01:56
2F:→ jerry771210: 推推 02/09 02:13
3F:推 TAKADO: 10-15年前,大家都在跟风玩data warehousing 炒作data min 02/09 02:54
4F:→ TAKADO: ing种下的恶果啊,看过一堆奇葩系统各种没建pk fk constra 02/09 02:54
5F:→ TAKADO: ins,没有正规化,各种垃圾资料狂塞猛送,然後现在抱着这 02/09 02:54
6F:→ TAKADO: 些资料要来玩AI。 02/09 02:54
7F:推 laba5566: 嘴炮>>>>>>>狗屁ML+资料分析 不会嘴走这行是找死 02/09 08:52
8F:→ testPtt: nosql就是让你这样玩阿 02/09 09:40
9F:推 lichai: 正解… 02/09 09:43
10F:推 Abhoth: 楼上TA大的回覆深有同感QQ 02/09 11:29
11F:推 drajan: 你真的懂data warehouse吗?:) 正规化是要看场合来使用的 02/09 14:32
12F:→ askia: 推,一看就知道是内行。学术界老是讲一堆xxx方法、模型 02/09 19:26
13F:→ askia: 但是真正的实务只有三个要点:清资料、清资料还是清资料 02/09 19:27
14F:→ askia: 有乾净的资料一切都好谈,否则什麽都是屁。GIGO 02/09 19:27
15F:→ MOONY135: 哈哈哈清洁工 02/09 20:14
16F:推 lovdkkkk: 扫地僧4ni 02/09 21:01
17F:推 vfgce: 资料分析用'资料库正规化'会很想死吧...... 02/10 16:23
18F:→ vfgce: 至於清资料也不用讲得多神奇,主要是你对这个资料的了解... 02/10 16:24
19F:→ vfgce: 知道怎麽用,那些有用,那些杂讯.... 02/10 16:24
20F:推 vfgce: 资料分析常常是一个资料表拿来用,'正规化'反而造成麻烦... 02/10 16:27
21F:推 TAKADO: 楼上几楼说的没错 DW根本没有正规化的问题 02/10 16:46
22F:→ TAKADO: 但是在那个大家都在玩DW的年代一堆公司DB都刚起步 02/10 16:47
23F:→ TAKADO: 然後看是凹MIS去学或找便宜工作室帮忙弄 02/10 16:47
24F:→ TAKADO: 然後就出现了因为OLTP->DW时 ETL乱写进不去 02/10 16:48
25F:→ TAKADO: 但是DW是顾问开的 然後只好operational DB做去正规化到1NF 02/10 16:50
26F:→ TAKADO: 或是把DB跟DW混在一起做撒尿牛丸 设计成star-schema 02/10 16:53
27F:→ TAKADO: 这样就没有转资料的问题了,大家都开心 02/10 16:54
28F:→ TAKADO: 如果资料是靠爬虫或是open data去捞还好 02/10 16:56
29F:→ TAKADO: 如果是抱着整个资料库来的挺多雷 里面各种世界奇观都有 02/10 16:57
30F:推 shiauji: 推楼上大大跟这篇 02/11 10:18
31F:推 sailoruranu: 推 我之前做report也都一直在整理资料 老是有莫名奇 02/11 14:01
32F:→ sailoruranu: 妙的资料会被放进db 02/11 14:01