作者as922425 (Howdareyou)
看板Soft_Job
标题[心得] 2022-2023 data science 面试心得
时间Sun May 21 01:41:59 2023
(以下为代 po)
大家好,简单分享我在 2022 年底到 2023 年初的面试经验。本人约三年工作经验,现职
为 data scientist 。
1. 总共投了约 15 到 20 间,多数为台北的软体业或外商。投递方式为公司官网、104
、 LinkedIn 、少部分是朋友内推及 yourator 。扣掉猎头推荐但没兴趣的,最後总共
接到 8 个面试邀约,并拿到一个 offer 。包括:
- OOO : offer get (暂不分享)
- Dcard Junior Machine Learning Engineer : 二面後感谢函
- Appier Data Scientist, Analytics : 二面後感谢函
- 17live Sr./Jr. Data Scientist : 面试後感谢函
- ASUS AICS 大数据软体研发工程师 : 一面後婉拒二面
- 趋势 AI Research Engineer : 程式测验後没消息 (人事冻结)
- 钛坦科技 senior data scientist : 要写作业所以婉拒面试
- Taboola Algorithm Engineer : 婉拒面试 (投递後过了三个月才寄面试邀约,已
经要 onboard 了)
2. 事前准备:
- Leetcode : 陆续刷了 近 100 题,主要刷 array 及特定技巧 ,例如
backtracking 与 DP,另外也刷了一点 SQL ,看到 hard 就跳过。网路上已经很多刷题
心得这边不多说,只提两点:
- 有 premium 帐号刷起来心情会好很多
- 这次面试考得都不难,顶多到 medium 难度
- 专案与自我介绍简报:疫情期间几乎都是远端面试,自介简报已经是基本配备了。
- ML 知识:花了点时间复习了相关知识,包括传统 ML 演算法 (tree-based 为主)
与 DL 技术 (熟悉领域的 SOTA 模型、基本知识),但面试中几乎都没被问到。
3. 面试概述:
- Dcard Junior Machine Learning Engineer
- 时程:官网投递 → D+20 面试邀约 → D+22 一面 → D+39 二面 → D+41 感
谢函
一二面都是技术面,主要都着重在情境题。情境题基本上就是给一个推荐系统的
情境,并请你设计一个解决方案,考验你如何设计实验、选择指标、挑选演算法等等,面
试官会开电子白板跟你一起讨论。 一面包括自我介绍、讨论过去专案,情境题、与程式
测验,程式测验偏资料结构 (heap 、hash map)。二面则着重在情境题,另外还有问系统
设计,例如如何训练、部属、 serving ,中间会用到的工具等。
个人觉得面试难度非常高,除了要很懂推荐系统的情境与方法外 (不只是尻过模
型那种懂),还要懂资料工程与系统设计,面试期间花了很多时间恶补,最後还是铩羽而
归qq。
面试官人都很友善,感觉技术很强。至於 HR … 与我联络的 HR (intern) 好像
很不想理我,让我觉得很不受尊重:首先在约二面的时间时,她先给我两个时段,我说时
间 ok ,但希望有其他时段给我选,我比较好配合,但她就直接订在原本的时间,并回了
封罐头确认信,也不知道有没有帮我协调。接着在二面前,我准备了一些面试相关的材料
,请 HR 先寄给面试官,HR 也是完全不回信,直到面试当下我问了面试官才知道他们有
拿到我的材料。
虽然不是很夸张的错误,但在面试过程中,我要兼顾现职工作与其他公司的面试
,周末也全都拿来准备 Dcard 的面试,结果 HR 一不鸟我的时间安排,二让我以为准备
的东西交不到面试官手上,现在回想起来,还是蛮不爽的。应该不是我毛太多吧 = =
- Appier Data Scientist, Analytics
- 时程:官网投递 → D+14 一面邀约 → D+17 一面 → D+22 二面邀约 →
D+25 二面 → D+38 感谢函
其实本来要丢的应该是 ML scientist,但我也不排斥 DA ,想说就丢看看。
一面主要为自我介绍与程式测验,程式测验包括用 pandas 做 EDA 、算指标与
SQL 测验。因为不熟 pandas 语法,直接跟面试官说我要开 pandas cheatsheet ,面试
官也不介意。虽然不难,但平常没在用应该会写不出来。
二面则是跟主管面,因为这个缺比较着重於捞报表、建 dashboard,而我过去经
验比较偏模型开发,主管感觉对我兴趣缺缺,随便聊聊不到 40 分钟就结束了,另外主管
看起来很累 (?)。面完就知道没机会了,但感谢函还是等了约两周。
- 17live Sr./Jr. Data Scientist
- 时程:官网投递 → D+5 HR 来电聊天,约面试 → D+10 面试 → D+20 感谢
函
17 的面试会安排在同一天,有四关大约三小时,分别为程式测验、技术面、主
管面、人资面。
程式测验考了一题 SQL ,其实不难,但平常很少写,所以写不太出来。技术面
主要针对过去专案经历来问,问得满仔细的,且会适时切入一些技术细节。技术面後,换
主管接手,主管主要都是问情境题,会根据你的技能,问你如何解决他们商业情境上碰到
的问题。人资关则是聊天、公司介绍、问你一些性格问题等等。
整体来说,面试过程轻松愉快,人资与面试官都很客气,面试难度也不高。此外
,面试排在同一个下午对於在职的人来说方便很多。本来觉得十拿九稳,想不到最後收到
了感谢函 (据说後来这个缺没补人)。
- ASUS AICS 大数据软体研发工程师
- 时程:官网投递 → D+3 线上程式测验 → D+4 面试邀约 → D+10 一面 →
D+10 二面邀约
线上程式测验共两题,难度 medium 未满。一面面试官先介绍单位与工作内容,
接着请你自我介绍,并根据内容提问。面试官技能可能不是在建模上,所以模型技术内容
没有问得很深入,但会一直拷问你实验流程为什麽这样设计,如何解释不同方法等等。後
来面试官有解释,因为工作上会常需要跟医师们沟通,所以必须要...有能力说服医生?
最後半小时是程式测验,难度虽不高,但我一直写不出好的解法。面试官一直鼓
励并引导我想出更好的解法,後面也给了我一些建议。当下一直想说。
整体来说,面试过程愉快,面试官人很和蔼,HR 效率也很高 (一面完几小时就
送二面通知),不过一面聊到最後才知道这个缺比较偏 backend ,要负责串接医院或诊所
的系统,後来又收到其他 offer ,所以就婉拒二面。
4. 总结:
- 感觉这段时间工作真的不好找,许多公司丢了都没回。
- 很多间都有考情境题,建议面试时可以先准备好电子白板或 google 文件,被问到
就分享萤幕,边讨论边做笔记,会比较有条理。可以在 youtube 搜寻 data science
mock interview ,看看大家都是怎麽回答问题的。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 219.70.141.176 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1684604521.A.143.html
※ 编辑: as922425 (219.70.141.176 台湾), 05/21/2023 01:43:47
※ 编辑: as922425 (219.70.141.176 台湾), 05/21/2023 01:46:51
※ 编辑: as922425 (219.70.141.176 台湾), 05/21/2023 01:56:14
※ 编辑: as922425 (219.70.141.176 台湾), 05/21/2023 02:21:37
1F:推 MoonCode: 05/21 02:51
2F:推 ducky0609: 推 05/21 07:58
3F:→ chang1248w: 看来台湾自动转职data engineering不只是说说 05/21 10:43
4F:推 Saaski: push 05/21 12:00
5F:推 kero961240: 台湾很少有直接弄模型的吧,而且那种缺都找博士吧 05/21 13:38
6F:→ DrTech: 感受相反。我想找弄模型的人,至少能依照需求改架构(其实 05/21 13:42
7F:→ DrTech: 不难),结果来的人全部都只会call API。 05/21 13:42
8F:→ DrTech: 现在一堆四大的硕士博士,都只会套预设的模型,然後就毕业 05/21 13:43
9F:→ DrTech: 了。很诡异。 05/21 13:43
10F:推 hsuchengmath: 应该跟hr 说要Appier mle 吧,怎会是da 05/21 14:16
11F:推 AgileSeptor: 推 05/21 14:51
12F:推 ssjtim: 好奇 为啥有premium心情会好很多? 05/21 15:50
13F:推 yiche: 推 谢谢分享 05/21 15:53
14F:→ wuyiulin: 我其实很好奇套预设模型是什麽概念? 05/21 17:21
15F:→ wuyiulin: 毕竟我四中毕也是要改底层特徵演算法+架构才能毕业… 05/21 17:21
16F:→ wuyiulin: 还是这也算套模型?要从头干到尾才算吗? 05/21 17:22
17F:推 drajan: 我也很好奇弄模型是什麽意思?我们组上弄模型的都是在发pa 05/21 17:47
18F:→ drajan: per 改架构 优化计算方法 ,如果只是做特徵应该不算弄模型 05/21 17:47
19F:→ drajan: 吧? 05/21 17:47
20F:推 daoziwai: 谢谢分享 我是顶大商研应届毕业生 最近丢了超过一百封只 05/21 20:55
21F:→ daoziwai: 拿到两个面试机会 很怀疑自己 05/21 20:55
22F:推 leakleak: 楼上说不定只是履历看起来很烂而已 别灰心 05/21 21:21
23F:→ leakleak: 找身边前辈或是面试直接和面试官交流一下看法 改一改继 05/21 21:22
24F:→ leakleak: 续面 05/21 21:22
25F:推 viper9709: 推分享 05/21 22:57
26F:推 yueerwang81: 推分享 05/22 09:58
27F:推 tokyo291: 推,最近也再再找DS的工作,丢了很多间目前只有一个通知 05/22 11:11
28F:→ tokyo291: 去面试QQ不晓得是不是在制造业做的自动化跟最佳化的专案 05/22 11:12
29F:→ tokyo291: 不够有价值 05/22 11:12
30F:推 yuinami: 推 05/22 12:20
31F:推 b160160: 推 05/22 13:36
32F:推 Beaua: 推 05/22 14:38
33F:→ BeardSmallGG: 感觉没用到frequency 如果是锁的题目 lintcode都有 05/22 15:47
34F:→ TSMCfabXX: OOO 你是要俄罗斯公司工作? 05/22 20:01
35F:→ TSMCfabXX: 17 Live 用的是 Google BigQuery, 解封後产业竞争激烈 05/22 20:02
36F:→ TSMCfabXX: Appier 最近开缺以 PM 产品经理 日本窗口较多 05/22 20:03
37F:推 mimi9672: 推推 05/23 09:34
38F:推 pk790127: 有心得给推~ 05/23 10:16
39F:推 WaterLengend: 推 05/23 10:21
40F:推 Tsbh90168: 推资料科学面试心得 05/24 00:35
41F:推 kokolotl: 投很多没回应的案例可能需要修改履历 05/24 18:46
42F:推 table8318: 推 05/24 23:26
43F:推 aacs0130: 推心得,不过你是半DS半ML Eng,这蛮不同的,景气不好 05/27 01:12
44F:→ aacs0130: 职缺少很多,没想到趋势也人事冻结了QQ 05/27 01:13
45F:推 s950375: 推 05/27 11:30