Soft_Job 板


LINE

一个ML应用要落地产生商业价值 在data scientist把model训练出来之後 还有很长一段路才能真正进到生产环境 ML系统的复杂度其实非常高 从资料收集,特徵处理, 模型训练, 模型测试, 一直到後面的模型部署,模型监测 真正要落地,上面的每一步都会有相对应的系统来做处理 系统要能自动化 要reliable 要scalable 还要能控制ML流程本身的复杂度 而不是说只要跑个jupyter notebook把模型训练出来test能过就完事了 关於这个议题还是要大推一下2015年的NIPS paper Hidden Technical Debt in Machine Learning Systems 所以呢 目前可以看到业界职缺的演化是有以下两种型态 一种是scientist track 另一种是engineer track scientist就真的需要比较强的数学理解 要能够有能力训练出"符合需求"的模型 但是通常这种人系统及程式能力不会这麽强 所以需要engineer来补足 其实scientist track还可以分成偏研究和偏应用的 简单来说 偏研究的比较像是增加整体公司的技术力 他们会去发paper 数学要真的好 要有研究能力 偏应用的目标则是会更聚焦在商业问题上 他们需要在有限的资源下(时间, 运算资源, etc.)提出解决商业问题的方法 在业界其实大部份搞ML演算法的都比较是这类 工作基本上就是兜兜library套一些现成的演算法 但是也不是说这种人就毫无知识含量 对相关商业domain的深度了解 使他们可以在有限的时间及资源下提出方法解决商业问题 这个就是他们的价值 engineer就比较像是构建最一开始所说的系统的人 做自动化 做scalable feature pipeline 做模型training/testing平台 模型部署 而且真正开始ML落地的公司 线上在跑的很快就不会只有一两个模型 可能是数十个模型,甚至上百个模型 这就需要专职的engineering team来负责, 包含ML platform dev, 还有MLOps 这样的工作其实程式和系统的能力会比较重要 比较像是介於传统data engineer和data scientist之间 也有需要加点一些devops跟backend的技能 做这类工作就不需要对ML演算法及理论有那麽深的理解 知道点high level其实就足以胜任(因为主要是由scientist负责) 但是做这件事软工的技能就要点得比较高 当然演算法的理解还是会对这个工作有帮助 比如说要做distributed training的系统 那有些ML演算法天生就是是没办法平行化 不知道演算法的细节 就可能没办法理解天生的限制而最後搞出了不合用的系统 我想说的是 如果数学不好 又想做ML也是可以考虑看看这个方向 随着ML开始落地的公司愈来愈多 这样子的职缺也会愈来愈多 如果是刚毕业想走这条路 或许从data engineer开始可能会是可以去尝试的一条路 可以先沾个边 在公司里面再慢慢点上面我说的技能 ※ 引述《ckrmpuhv (阿瓜)》之铭言: : 各位板上大大好 : 小弟是後段国立科大资管硕即将毕业 : 因为一些私人原因是不用当兵 : 所以论文完成後准备开始找工作 : 目前程度: : 大学学过JAVA : 网页跟资料库也只有课堂学习过没实际做小专案 : 因为对Ml有兴趣 : 在硕阶段期间 都是自学ML相关 : 听过李宏毅老师的课 : 实作过他课程的作业 : Keras的一些神经网路搭建也没舍问题 : Kaggle只参加过一两次 排名都很烂 : 大部分的实作和论文都是跟影像辨识相关 : 最近看板上大大各式各样建议 : 非四大四中 也不是kaggle的佼佼者 : 数学方面 线代没学 统计学大学学过但也不熟 : 看完觉得自己很烂出去可能没人要? : 目前都还在做ml各种模型实作 : 但看完板上很迷茫要往哪些方向学习怕找不到工作非常忧郁 : 我不清楚该横向发展拓别的领域 : 像是网页、App 自己做一些小专案增加作品集 : 还是去补数学 更深入研究Ml : 又或者先去刷Leetcode打底 : 还请各位大大指教 谢谢 : ----- : Sent from JPTT on my iPhone --
QR Code



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 172.92.160.251 (美国)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1615543421.A.E10.html ※ 编辑: frouscy (172.92.160.251 美国), 03/12/2021 18:17:49
1F:推 aa77a: 说得不错 前一个在虾七八乱 XD 03/12 18:32
2F:推 KingSteven: 推!不过台湾称得上Scientist的职位太少QQ 毕竟没有FA 03/12 18:51
3F:→ KingSteven: ANG那种规模…… 03/12 18:51
4F:推 KingSteven: 可能大多都是把现有ML方法拿来用,而不是开创新的ML 03/12 18:54
5F:→ KingSteven: 方法 03/12 18:54
偶尔写一篇的那种可能还行 但要投钱持续去做纯研究产出的单位真的很烧钱 看看下面的例子 deep mind是有google做乾爹 去年亏损六百多万美金 google爸爸还帮忙付了10亿美金的债 open AI也是是有微软爸爸投资了10亿美金 图灵奖得主Joshua Bengio的研究公司Element AI也是赔到脱裤 好像准备要贱价卖出 有多少资源做多少事 现实就是这样 我觉得没什麽好埋怨LOL 随着模型愈来愈复杂 连拿已经有的演算法来train model都会变成资本游戏(想想GPT3)
6F:推 IcecreamHsu: 推 写得很好 MLOps 是趋势 03/12 19:00
7F:推 drajan: 欢迎大家加入MLOps 的行列!业界很缺人喔 03/12 19:12
8F:→ drajan: 开创新的ML模型要有商业价值 目前大多数场景用既有的框架 03/12 19:14
9F:→ drajan: 就好 真正难度往往是系统落地真正运作在 production上 03/12 19:14
10F:推 andy5656: 推 蛮清楚的 03/12 19:16
11F:推 andy5656: 台湾我看有些公司还是会去发paper 只是可能不多就是了 03/12 19:18
12F:→ drajan: 如果是真正想研究ML模型 基本一定要有 PhD(或是极出类拔萃 03/12 19:22
13F:→ drajan: 的master) 以及做的研究业界要用的到才有机会真的进业界做 03/12 19:22
14F:→ drajan: ML research. 像我们团队就跟很多学校钻研 private ML的学 03/12 19:22
15F:→ drajan: 者合作 有些团队成员也是直接从学界加入的 像现在这种 res 03/12 19:22
16F:→ drajan: earch scientist职位竞争超级激烈 没有三两三连面试机会都 03/12 19:22
17F:→ drajan: 没有 所以大家说你做 engineer会简单很多不是没道理的 03/12 19:22
其实竞争激烈有一个原因是 业界并不真的非常需要做纯研究的人XD 能解决商业问题让公司赚进利润摆脱成本中心才是硬道理 刚从学校毕业的人里面 眼高手低的人太多 脚踏实地的人太少 再说如果engineer做到很有经验也是很有价值的 现在有个看得到的趋势是research paper上 scientist和engineer其实会一起挂名 所以即便没有PhD 还是有机会可以发paper的 而且其实ML system也开始有自己的conference了 https://mlsys.org 这个就是engineer的主场了
18F:推 tay2510: 大推这篇,讲得非常贴近目前的ML现实。前一篇有点以偏概 03/12 19:35
19F:→ tay2510: 全,反而容易混淆视听。同场推2014 NIPS Google的Machine 03/12 19:35
20F:→ tay2510: Learning: The High Interest Credit Card of Technical 03/12 19:35
21F:→ tay2510: Debt 03/12 19:35
22F:推 ckrmpuhv: 了解感谢大大 我会在好好琢磨 03/12 19:46
23F:推 DarkIllusion: 你说的没错 03/12 20:10
24F:推 robinlee: 这篇才是业界真实生态,感谢分享 03/12 23:40
25F:推 mmonkeyboyy: 这个是比较实在的业界生态 @_@~ 还是要能赚钱先 03/13 01:44
26F:→ mmonkeyboyy: 前一篇就是那种去面试喜欢没事问各种名词的人 03/13 01:46
27F:→ mmonkeyboyy: 其实学界业界很多这种人@_@~ 目前要的其实是这篇讲 03/13 01:46
28F:→ mmonkeyboyy: 的两种人混合 可惜的是这种人在业界也没几个 03/13 01:47
29F:→ mmonkeyboyy: 纯 ml研究烧钱外效果也不是特别好 只能说海水退了 03/13 01:48
30F:→ mmonkeyboyy: 就知道谁没穿裤子 想走ml进队只能说超难了 03/13 01:48
31F:推 mmonkeyboyy: 就我自己的团队跟业界合作伙伴 也是套模型&DE 03/13 01:52
32F:→ mmonkeyboyy: 但能套到让一些公司掏钱做就好了啊 03/13 01:53
33F:推 bowin: 推好文分享 03/13 03:55
34F:推 taipoo: 推好文 03/13 04:03
35F:推 rtoday: 赞 03/13 04:10
36F:推 loter: 推ML大神廖大! 03/13 05:39
37F:推 shiauji: 感谢分享 03/13 08:54
38F:推 rereterry: 推,确实越来越有如此分工的倾向,不过行有余力,往对 03/13 09:15
39F:→ rereterry: 方的技能点个一点有深一点的理解对自己的职涯还蛮有帮 03/13 09:15
40F:→ rereterry: 助的 03/13 09:15
※ 编辑: frouscy (172.92.160.251 美国), 03/13/2021 09:44:02 ※ 编辑: frouscy (172.92.160.251 美国), 03/13/2021 09:44:26
41F:推 mmonkeyboyy: 里面还有一个workshop就是 MLOps 03/13 09:44
※ 编辑: frouscy (172.92.160.251 美国), 03/13/2021 09:54:58
42F:推 mmonkeyboyy: 现在这游戏就是烧钱 有机器有卡的大声 看看某学校 03/13 09:58
43F:→ mmonkeyboyy: 不过真要做成系统除了理论外 还有蛮多"实际"的问题 03/13 09:59
44F:→ mmonkeyboyy: 这些才是真正让ml能不能用的关键 03/13 09:59
45F:推 PHEj: 推这篇~~ 03/13 10:02
46F:推 fig498: 感谢大大分享!! 03/13 11:59
47F:推 AgileSeptor: 推 03/13 12:16
48F:推 KingSteven: 再推一次~感谢原po耐心回覆小弟的推文,讲的很好! 03/13 17:00
49F:推 blackmaninEE: 推 03/14 01:57
50F:推 lerdor: 大学毕业在高雄时才三万初... 03/14 11:45
51F:推 Chita5566: 讲得很好 03/14 15:54
52F:推 adrian2266: 优文推 03/17 10:09
53F:→ answerseeker: ElementAI 已经挂了吧 推这篇 03/18 12:39
54F:推 meRscliche: 推推 03/18 23:59
55F:推 keepgoing99: 推推 03/21 14:32
56F:推 adsl54010: 推 10/07 22:05
57F:推 bymyself: 谢谢分享 01/10 13:30







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Tech_Job站内搜寻

TOP