Soft_Job 板


LINE

我换个标题比较方便未来有人需要的话可以搜寻。 我来抛砖引玉一下台湾业界现况。 我个人 112 CSIE 硕毕,但硕论跟 ML 无关,没有 ML 相关的学术论文。 Kaggle 铜牌以上 x 5 (两次是抱团靠队友) 六年工作经验,算是 deep learning 热潮起来以前就入行。 待过两家五百人规模的新创,工作内容包含将商业问题转换成 ML 可解的问题、将解出来的模型跟系统组的同事合作推上线 有时候也要接一下资料(水管)。 先讲工作上会用到的数学: 一些基本的统计观念,对於观察资料会有帮助。 理解使用到的 ML 模型的概念,了解这个有时候会对参数选择有所帮助。 Deep learning 的话至少看得懂 loss function,有时候会把不同 loss 合起来一起训练。少数几次遇到的问题没有合适的现成 loss ,所以自己 乱写 loss function,写完也是丢给 tf 帮我 optimize。 理解使用到的 metric,关乎到你怎麽挑选模型跟 loss function。 我觉得理解 metric 跟 loss 是很重要的,这样模型在 metric 表现不好 的时候才知道要往哪个方向调整。 看 paper 我第一个看它实验怎麽做的、结果怎样,看完觉得有机会在我的 dataset 上也够好才会继续看,第二个看有没有现成的 code 可以用,第三 个才是去理解它的方法 (通常是 loss function)。至於里面的定理,很多 假设都跟现实有差距或是它是在证 error bound 这种我知道也不能干嘛的 东西。至於正确性就相信 reviewer 不会偷懒 XD 所以通常都是跳过不看 XD 工作上最需要的就是做的东西要有商业价值,至於後面是什麽技术、数学 多难本身不是太重要,跟不懂的人讲什麽模型听起来都很厉害。如果 rule based 的方法成效就足够好,我也会先用它顶着。当然一般来说 ML 的成效 都会比 rule based 更好,所以用到 rule based 的机会还是很少。 数学重要在帮助你选择适合的 metric 跟模型,以及调模型的时候更有效率 ,可以不用所有的参数丢下去跑,毕竟这个花时间也花钱,对公司来说这两 个都是大成本。 以这个需求来说,我觉得不需要很艰深的数学,主要是机率统计微分(没有积分) ,如果你说矩阵相乘算线代那有用到,再难的就很少了。 重要的是观念要清楚,用到的都是观念。 最後,工程师 coding 就是基本功,所有的想法都要 coding 才能在真实世 界实现,尤其 ML 常常处理大资料,模型也要上 production。我不知道 ML 要强到什麽程度公司才愿意配一个人专门帮你写扣 XD 我的经验是架构方面通常会有专业的同事帮忙设计,inference 的部分就要 自己写。data pipeline 的话同事会将资料整理好,可能是 parquet on s3 ,把它转成 feature 到 model training 再将 model 送上 production 机 器这一段要自己写。 实验 code 就是全部自己来,code 有没有效率就关乎你实验跑多久、能跑多 大的 scale。 关於面试,六年来我也应该面过二十几个 ML engineer 的职缺,大小公司都 有,台湾日本新加坡都有。我自己在两家公司也都有帮忙面过 ML engineer。 通常 ML 面试就是给你一个问题,问你怎麽用 ML 解。比如说怎麽设计推荐系 统之类的,然後再从你的回答问延伸问题。我觉得只要大观念会、对於提出来 解决问题用的模型有一定程度的理解就可以了。我从来没有被问过任何证明推 导的问题。Research scientist 我就没面过了,不清楚。 除了少数几家小公司没有问 coding,其他几乎都有,而且我体感规模越大的公 司问的越难,所以 leetcode 还是要刷,越大间的公司越要刷。 前阵子刚好敝公司比较多 ML 的 headcount,所以我帮忙面了大概有十个人吧, 最後录取三个。我参与的是第二轮面试,所以我不知道第一轮是怎麽挑人的。我 们主要想找有 NLP 经验的人,我看到的履历没人有顶会,只有一个有 Kaggle 成绩,一个是硕班做 NLP,其他都是因为相关工作经验被找来。进来以後我觉得 工作能力上也没有什麽问题,对公司也能有商业上的贡献。 我自己面试人对於 ML 的基本要求是,知不知道用的模型概念是什麽、哪些参数 是重要的、能不能根据问题挑选合适的 metric 以及根据这个 metric 挑选合适 的模型,怎麽判断模型好坏、成效不好的怎麽 debug 跟调整。 以上跟有没有顶会完全无关,当然发过顶会的人对於上面这些问题一定是都能答 得不错,但没发过顶会也可以。反而因为上面这些问题很重要,我个人是很看重 Kaggle 的,Kaggle 除了 metric 帮你决定好以外,其他能力都要好才能有好成 绩。Kaggle 我只认可有奖金的比赛成绩,铜牌以上我觉得应该就有基本能力可以 找来面试看看,银牌以上应该程度不错,金牌我会觉得很强。 Kaggle 当然 deep learning 相关的比赛有设备有优势,不过也是有人靠免费的 colab 拿到金牌,如果只要求铜牌的话对於拿免费的 colab 顶着用也不是每个比 赛都跑不完,有时候 google 也会赞助 300USD 让你用 GCP,我觉得不求顶尖成 绩的话设备不会是问题。 会找来面试的通常是有相关工作经验,或是硕班做 ML,或是有 Kaggle 成绩。 转领域的话前两项一定是没有的,就去 Kaggle 刷一个铜牌吧!刷不到至少也知 道 ML 是怎麽回事,有没有兴趣做下去,探索兴趣对人生来说也是很重要的事情 。我觉得刷 Kaggle 很好玩呀,只是太花时间了,不然我也想天天刷 XD --
QR Code



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 59.104.122.246 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1636769550.A.E5D.html ※ 编辑: jigfopsda (59.104.122.246 台湾), 11/13/2021 10:14:03
1F:推 DrTech: 非常务实,有逻辑,有自己想法,表达又清楚的一篇文章。也 11/13 10:41
2F:→ DrTech: 说到工作中的关键点,及看paper的好方法。 11/13 10:41
3F:推 aa77a: 总算有人说得好了 11/13 11:04
4F:推 joshnash: 推推 11/13 11:11
5F:推 z888888861: 推推好文 11/13 11:56
6F:推 kiwi946946: 想请问问coding部分。即使已经有专案经验,第一关还是 11/13 12:09
7F:→ kiwi946946: 会先给你考程式题,第二关才会问你之前的专案经验吗? 11/13 12:09
具体面试流程每家公司都不太一样,技术面试之前应该都有机会可以问 HR 该公司 是怎麽安排的。也是有可能同一关一半的时间考程式一半的时间问 ML 相关经验或问题
8F:推 x246libra: 备份,哪天後端熟悉了,再来一窥ml基本能力需求 11/13 12:44
9F:推 andy086: 非常同意,实作有商业价值才是真的 11/13 13:44
※ 编辑: jigfopsda (59.104.122.246 台湾), 11/13/2021 13:49:50
10F:推 lofu: 推 有没有kaggle成绩真的是个分水岭 11/13 14:20
11F:推 libitum: 推推推 刷leetcode变得越来越必须了 11/13 14:38
12F:推 ouskit: push 11/13 15:41
13F:推 asleisureto: 务实推 11/13 16:15
14F:推 csvt32745: 硕班开始弄相关东西 看Paper到最後也变这样XD 11/13 16:29
15F:推 ghost90331: 推推 11/13 21:42
16F:→ ykes60513: 以前研所修过李宏毅的ML…那数学真的是天书看不懂 11/13 22:11
17F:→ JustInn: 有的人很喜欢自创演算法与调参,但实际现有理论与套件加 11/13 23:26
18F:→ JustInn: 变化一下便可达成。反而忽略domain knowledge与特徵处理 11/13 23:26
19F:推 mmonkeyboyy: 楼上你这句话是真理啊 11/13 23:43
20F:推 world4jason: 业内给推 观念真的重要很多 解商业问题大部分都是组 11/14 00:06
21F:→ world4jason: 合拳 很多ML算法很好用的 DL就算弄出来还得考虑成本 11/14 00:06
22F:→ world4jason: 问题 数学程度我也觉得能够理解metric跟loss就够了 11/14 00:06
23F:→ world4jason: 剩余就是偶尔去kaggle或是各大论坛上面补充新知就好 11/14 00:06
24F:推 abby0302: 谢谢分享 11/14 00:35
25F:推 lukelove: 感受同意 11/14 00:55
26F:推 kevin1ptt: 好文推! 11/14 01:38
27F:推 tiramisu0225: 推 11/14 09:29
28F:推 jskblack: 推~~ 11/14 12:08
29F:推 RumiManiac: 推 11/14 12:58
30F:推 ddmanddman: 推 11/14 13:21
31F:推 ftrhalcyon: 推 11/14 20:54
32F:推 applerman: 推! 11/14 21:24
33F:推 turndown4wat: 推 11/15 01:14
34F:推 unmolk: 推 11/15 02:27
35F:推 shownlin: 真实情况给推 11/15 10:36
36F:推 ZuiYang: 同为ML工程师同感推 11/15 13:56
37F:推 solitude6060: 推 一堆人说找不到工作 其实都是没有认清事实 11/15 14:34
38F:推 SolitaryFox: 推 11/15 16:07
39F:推 ohsuoh: 推个 11/15 18:29
40F:→ sumsum: 同感!推! 11/16 00:06
41F:推 viper9709: 推分享 11/16 00:17
42F:推 jack2030: 大推强者热心分享!!!!! 11/16 11:57
43F:推 rogerallen: 推讲的很清楚有逻辑 11/20 10:17
44F:推 miku3920: 统计机率、线性代数、矩阵、微分 11/21 13:25
45F:推 ElegonSin: 推ㄍ 看到训练完的model能分辨语意真的很可爱 11/23 01:01
46F:推 smile08008: 推推 01/08 17:15







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:BuyTogether站内搜寻

TOP