作者yanwu0105 (辉飞)
看板Soft_Job
标题[心得] 2018夏_学士毕业数据分析面试分享
时间Wed Aug 1 09:42:17 2018
各位大神安安
本版上面关於数据分析(data analyst)相关工作经验分享偏少
前两个月刚好面试了几间公司
公司类型为新创居多,没有保险金融、电信业及制造业
在此分享一下面试经验,也欢迎大家互相讨论
提醒:文长慎入
Medium好读版:
http://bit.ly/2M7dKWF
文章会针对
˙背景及经验介绍
˙履历投递
˙面试过程及结果
˙结论
四个部分分享
˙背景及经验
私校数学系毕业(非理工强校),在校成绩普通,没有被当,但有暑修物理。。。
大三开始接触数据分析,开始学习python及R语言,python学了一学期,大概就是回圈、
判断式等基础语法;稍微了解爬虫抓取技巧,但不深入。R语言起初也只是自行摸索,对
於资料整理及统计模型并不上手。
大四学校课程,使用R语言,开始了解资料处理及模型使用,大四下在新创公司的数据分
析部门实习,实习期间做过3个专案(包含独立专案及合作专案),真正使用R处理资料及分
析。
毕业後,因某些因素,留在学校当助教,负责微积分、统计演习课(非数学本科系),基本
上没有产出,只有自己摸索python,主要有看了几个课程
.政大MOOC课程_成为python数据分析达人的第一堂课(这个是免费的线上课程)
.Hahow_Python 资料分析&机器学习入门(这个要钱,当时候募资时购入,很详细还有
medium的课程档案可以看)
2018上半年,投履历前3个月左右,有跟朋友合作专案,主要负责爬虫及机器学习的
coding部分。算是这年来主要的产出……..吧。
◎实际自评
会使用R语言及python完成独立专案,包含网路爬虫、数据前处理,SQL搜寻及操作、模型
建立,视觉化报告。
○能够使用python串接API,每日自动化整理资料,并上传SQL。
○模型使用上基本的回归分类、k-means分群、sklearn套件包,都操作过,但并不会DL(例
如tensorflow)。
○分析经验以数值统计分析为主,缺少文字探勘的经验。
○视觉化部分,ggplot2、matplotlib都算熟悉。
○对於简报制作也稍微有点概念。
˙履历投递
◎履历部分
基本的中文履历,以及硬生出来的英文CV,整理过去制作过的专案(包含大学零零落落的
报告们)放在云端,还有把部分程式码上传至github,最後建立了linkedin,然後就打开
104开始撒履历了。
◎目标公司
本身对於金融业没有兴趣,对保险投资也没太大研究,然後不想穿西装上班。另外传统产
业(大公司)也不是我首选,毕竟制度规定很死,我也不是很喜欢。所以差不多就剩下科技
业与新创团队了,主要来说之前也待过新创公司,所以对新创的氛围比较熟悉。
就这样打开104,搜寻 数据分析 就会跑出很多职缺,Title是数据分析师、资料分析师都
会点进去看。条件部分,主要就看期望的工作年资,1-3年我都会投。再来看技术方面,
只要有写到使用python、R就会投。
关於职位内容,求职网都是写个大概:数据清理、数据探勘、分析报告、视觉化呈现、机
器学习、深度学习,真的要实际聊过才会比较清楚此职位定位在哪,工作内容是啥。
◎其他
除了104以外还有使用Yourator这里都是新创公司,相对的也比较多外商公司,在这里就
算是投中文履历过去,HR或公司回信也都是英文,但相对的几乎投过去都能得到回信或面
试邀约。
˙面试及结果
(依面试顺序写)
1.传统食品业(主力在大陆市场)_数据分析师
○面试
人资接洽後约面试,面试当天先考了30分钟术科笔试,笔试内容为手写SQL code(差点以
为我在考资管系期中考xdd),四大题都是 join 、 group by 等合并资料表,然後
where 筛选条件,最後是SQL计算。老实说,超级久没有写SQL,更何况是手写,就只能凭
着印象瞎写,勉强把四题掰完。
面试前两关是一对一,最後一关是部门主管+单位主管两人,第一关是同单位不同部门的
课长,主要了解我过去的专案经验,还有我对数据分析的了解及概念。还有介绍了主要这
个单位的工作内容及工作分配。
主要分成两个部门,一个是商业分析,比较偏重於商业应用分析,对程式能力要求较低,
主要就是会SQL捞资料。另一个是我投递的数据应用,包括了DB处理、数据分析、数据应
用,三个课。然後大概跟我介绍过去做过的一些专案分析;这部分有谈论到机器学习的部
分,得到的回答是,公司高层目前还无法接受,他们过去有尝试使用ML的分析,但高层比
较相信传统统计分析方法。(我有朋友过去也去应徵此单位的管理职缺,大约比我早三个
月左右,却因为对ML较不熟悉,而被炮轰;这件事也让我们很困惑)
第二关是我应徵的部门主管,主要跟我确认我对哪一块比较有兴趣,也大概聊了一下对於
资料处理、整理的概念;以及讲了职位的工作内容,主要是以捞SQL整理资料,做ETL为主
的工作。所以一直跟我强调,会一直进行数据蒐集(可能半年或一年以上),才会进行分析
;也有提到刚刚术科SQL写的还不错(这部分其实超惊讶,毕竟我超久没写SQL)。最後有聊
到pay的部分,当下也开给我,但有说,最後核定要以人资公布为主。
本以为面试到这边告一个段落,结果,第三关,单位主管进来,气场很强大,主要也是问
我对於资料处理的概念,以及数据分析跟商业模式之间的关系;谈话中,了解到公司决策
很注重是商业概念,数据分析是辅助决策。本以为在这边会被电得很惨,但也颇和平的结
束。
○结果
约莫一个礼拜後,就接到人资打来,稍微了解一下状况,还有了解可工作时间,就发
offer过来了。
2.软体公司(主力做校务分析系统)_大数据资料管理师 (Data Scientist)
○面试
第一次过去,主要看了我的履历,从中问了一些我的经验,也让我问问题了解公司的工作
,模式大概就是互相问对方问题的感觉,大概了解公司是微软代理商,负责卖软体,渐渐
往开发公司系统,配合企业需求去建置系统,最後发展到协助大专院校进行校务分析。然
後,也表示,公司主要使用Power Bi ,如果进来之後要学会,还有提到,公司有微软的
资源,可供学习(毕竟是经销商),最後就说会约下次面谈。结束後,看名片上网搜寻一下
,才发现是公司负责人(CEO的感觉)面试我,难怪名片上没有Title。
二面,是由部门PM面试,感觉是香港人,讲话口音不像是台湾人,针对我实习时的专案,
大概给了我一点建议,表示做的分析对象都是人,变因很大,对公司来说不会是好的研究
主题。最後有谈到会读大量paper,然後说我的英文能力可能不够好。
○结果
无声卡,接近两周的时间,我还有寄信过去询问,但也没有消息。
3.区块链交易平台(台湾的新创公司,混合式去中心化的交易平台)_ Data Analyst 数
据分析师
○程式测验
履历丢过去後,mail寄过来就是csv档跟测验说明,资料是给你一间交易所的交易纪录
(200Mb,差不多170万笔资料),请你针对题目分析,并制作报告。题目主要是要看能不能
从中找到高频交易对手或交易机器人等。
做完之後,丢过去会再决定能不能过去报告分析结果及面试。(但其实看超快,早上寄出
去,下午就打来跟我约面试时间了)
○面试及结果
本来以为要报告,还颇紧张,但因为主管开会,没有报告到;但有提到报告部分做的不错
,简单易懂,也看的出来是有美编过,就由人资主管直接与我面谈。公司正要成立data部
门,所以在招聘leader,也必须对区块链有深入研究,大概就知道没有望了。人资主管也
有询问,如果是以pt的方式愿不愿意,也说明人事部分也还在规划,所以也不排除未来再
通知我。
4.广告代理商_资料分析师
面试前有上求职天眼通,稍微了解一下这间公司,负评不少(大概是说公司流动很快,还
有会以罚钱逞罚员工?!)
○面试
直接由部门主管面试,一开始稍微介绍广告业的运作模式,及资料部门做的工作。就直接
进入专业问题,针对我过去做过的专案开始询问,问得非常深入,都是统计解释及演算法
部分;例如:罗吉斯回归中OR胜算比的解释、k-means的演算过程、计算中心距离的方法(
欧式距离等等)。没想到会得如此深入,我回答某些部分也不是很有把握。但最後主管却
说回答得还不错,观念没有太大问题,然後说这些模型可能不适合公司分析,进来之後会
看其他paper学其他模型,还有一开始进来要学spark、hadoop等分散式计算方法(感觉起
来,应该是蛮能学到东西的吧?!)。最後有聊到pay的部分,并说明试用期会扣3k这样。
○结果
回去大概两三天就收到offer letter了,薪资也是当下讨论到的。
5.新创行销平台_data engineer
○面试
从面试邀约就是CEO直接跟我联络,第一次去也是互相了解公司运作方式,也对我过去的
经验了解,并说明公司主要是以文字探勘为主,另外大多是分析国外论坛及部落格,所以
英文能力相对也很重要。最後就告诉我回去之後会有一个code challenge要回去做。
⊙Code challenge
给了200个网址,要你写爬虫程式抓取作者名字及其社群网站联络方式。
第二次面试,先大概聊到写程式的过程及方法,都做出来了,所以应该也知道没啥问题,
接着就和公司的data scientist了解实际工作内容及分析方法,大概了解之後会做些甚麽
。最後就是和CEO讨论我主要可以做的工作及pay;主要来说公司data team 有人负责爬虫
、有人负责文字分析,而我对数值分析比较有经验,也希望我之後能处理这一块,但当然
一开始也要我先熟悉公司分析的流程等。
○结果
二面最後就有讨论了pay及on board时间,也有问我什麽时候能给回覆。回到家offer
letter就来了。
6.国内新创影音平台_大数据分析工程师 (Big Data Analytics Engineer)
○测验
在面试前一天早上才打电话来,告知我有一个专业测验,要请我做,然後面试带过去。有
三题,第一题是设计一份问卷的资料属性,并针对此问卷看能够分析什麽、第二题设计一
套推荐系统,并规划流程,最後写如何评估成效、第三题问公司发展AI会遇到甚麽难题。
问的问题很有深度,我个人觉得很偏向PM,要规划流程,也要思考成效。
○面试
先由部门主管面试,主要是我在讲我做过的专案及经验,主管没有给太多回馈。接着讲公
司data部门工作内容,及接下来发展方向。再来是人资的深聊时间,主要针对个人特质的
部分询问了很多,但就是人资会聊的部分。最後有谈到大概2~3周,公司会有一个决定,
但如果没有录取,将不会另外通知
○结果
目前正在等待结果中,一个礼拜多过去,还未有消息。(如有消息将会更新
˙结论
先给结论数据部分:
约莫投递:60间(包含104及yourator)
开信:30间
寄信联络:13间(包含回信请你填写资料表,回传之後没有下文;还有二间履历过去後
,收到感谢信)
面试邀约:6间(上面详述)
拿到offer:3间
每阶段差不多是50%机率,拿到offer是投递的5%
实际统计下来,我觉得算非常好的结果,毕竟我这一年来的工作,其实并不算可以累计年
资,所以还是以一个新鲜人的身分求职,拿到的offer平均都是现在的N+5~N+7,其实还算
满意。
实际公司对於技术面的要求,其实也不会因为学历而有质疑(或许我不是面试金融、传产
、电信,这几个比较看重学历的产业,但其实也有收到金融和电信的面试邀约),只要有
专案经验,把专案呈现给公司,其实大概也都能知道能力、技术到哪边。公司写要会使用
ML/DL,有可能是公司希望有这样的技术能导入。以目前来说基本的分类分群回归预测等
,还有基本的资料整理套件都要会使用(有面试时看github,就说:「你会pandas,我们
也要用到。」但其实这应该算基本的)
在104上打入 数据分析 或 资料分析 就会有很多工作跑出来,都可以投递看看,能有面
试机会就去练刀,就当作了解该产业或者多去听听别的公司如何定义数据分析,或者公司
的数据团队在做些甚麽;面试下来,每间公司要求的都不一样,都一样是data analytics
,但做的事情可能不一样,又或者不少是要求有文字探勘经验。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.133.151.104
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1533087743.A.DF6.html
1F:推 fish0112: 推 08/01 09:51
2F:推 yougigun: 推仔细 08/01 10:50
3F:推 lordmi: 推 这篇还可以看出各行业da需求的方向 08/01 10:56
4F:推 bestchiao: 推 感谢分享 08/01 11:52
5F:推 wilson85771: 推 08/01 12:53
6F:推 langrisser19: 推 08/01 13:39
7F:推 bowin: 推面试心得分享!不过若能写出公司名称会更有趣:) 08/01 14:56
本来是有打算直接写公司名称,但好像不太妥,就提供一些线索让大家猜罗
8F:推 abc53: 推 08/01 15:17
9F:推 Hank82415: 推 帮助很大 08/01 15:59
10F:推 fig498: 推 感谢 08/01 17:17
11F:推 isolaXCC: 推 08/01 17:36
12F:推 ntddt: 推推 08/01 20:28
13F:推 GetRobin: 推实用 08/01 20:35
14F:推 kokolotl: 比较喜欢找本身就有数据的公司~ 08/01 21:55
但其实很少有拉 我觉得XDD
15F:推 CoLoYellow: 借板问,N+X,N是月薪,X是指什麽呀? 08/01 22:54
X就是新工作加薪幅度
16F:推 wxtn: 同行推推 各产业做da的重点都不同 08/01 23:16
17F:推 aszx4510: 感谢分享 起薪N+5 感觉很厉害 08/02 04:20
比起学士毕的研究助理好很多XDD
18F:推 Luluemiko: 推 谢谢分享! 08/02 09:31
19F:推 sherees: 推 感谢分享 08/02 09:39
20F:推 kerosu1991: 推 08/02 12:33
※ 编辑: yanwu0105 (220.133.151.104), 08/02/2018 13:19:42
21F:→ yanwu0105: 感谢大家的推文>< 08/02 13:20
22F:推 kokolotl: 电商 or 制造业XD 08/02 15:58
23F:推 laijack512: 感谢精彩的分享 08/02 21:45
24F:推 pickstar: 感谢分享 08/03 07:01
25F:推 am970813: 推 08/07 07:41
26F:推 vannml321: 推 08/08 20:15
27F:推 jay66lin: 推 感谢分享 08/10 09:15
28F:推 wenbuneatble: 谢谢! 08/30 01:09
29F:推 LittleIe: 推! 10/14 10:39