作者aacs0130 (嘻嘻莉亚)
看板Soft_Job
标题Re: [心得] 资料科学家工作分享与 AI 产业观察
时间Fri Mar 8 03:05:30 2019
※ 引述《aacs0130 (嘻嘻莉亚)》之铭言:
: === 先说结论 ===
:
: 1. 非CS背景想转职 AI => 念四大硕,主修 AI
:
: 2. 不想念硕士,想自学
: => 证明你比四大硕强 => 去社群给 Talk or Kaggle 比到前三
: 社群有 ML/DM Monday, Taipei.py, Py data 等等
: 有个听众觉得『哎唷不错喔』,机会就来了
:
: 3. 已经是资工硕了
: => 去社群给 Talk or 发top conference paper ex: AAAI, NAACL
:
: 推 Transfat: 转职又非即战力,是不是没希望了 03/07 17:03
: 推 ckp4131025: 大家都只要即战力,市场当然很缺senior罗 03/07 17:33
: 老实说我觉得这是台湾 AI 圈的困境
: 一来 AI 圈也才红5年,Sr. 本来就不多
: 二来 很多 Sr. 都跑去美国了
: 三来 Jr. 没人带也没有自学能力就不能变Sr.,只会变成Super Junior
: 四来 老板都希望Sr. 免费加班带Jr. 还要加班做专案
无法训练Sr. 可能是台湾的困境了
一群 Junior 一起学习就像 unsupervised learning
有Sr.带的Jr. 就像 supervised learning
F-score起跑点就差20%
unsupervised learning 很难强过 supervised learning
Sr. 必须要能带人,带team,什麽 data 都能做
Jr. 通常都需要定义明确的问题跟目标
但是 real data 常常都没有问题也没有目标
客户根本不知道他想要什麽
客户:帮我做一个有AI的东西
DS:什麽有AI的东西?
客户:这是你的专业吧
DS: 你有什麽data?
客户:我就是找你来告诉我的
DS: 你要什麽?
客户:帮我做一个有AI的东西
============
Jr. DS:没有问题也没有目标怎麽做?
Sr. DS:Time => Day, Week, Month, Year, Weekday, Weekend, ....
==>> A 跟 C 组,F 跟 K 组
==>> 喔!这是吃的 or 擦的 or 用的
Jr. DS:为什麽你知道怎麽做?
Sr. DS:这就是资料科学家的直觉...呃...经验...
: 推 LinuxKernel: 要开示一下哪些是假AI新创吗 03/07 17:49
你可以看该公司的网页
成立两年却没有亮眼产品或赚钱的可能有问题
也可以看该公司员工的LinkedIn
如果语焉不详,写得很怪的,充满Super Junior的也很雷
还有 Head Hunter 推荐的80%都很雷
AI圈中黑掉的公司最爱找hunter
: 推 vn509942: 这几年很多金主对AI题材有莫名的期待 03/08 01:40
菜市场阿嬷爱 AI,客户爱, 金主爱,老板最爱
有遇过一些客户拿了一堆data来
不要省钱,不要加速,不要找商业逻辑
搞了半天客户就是要"AI"
我就是要用 data 做出有 AI 的东西
然後签字 画押 领钱
然後客户就放新闻稿说他们的产品有AI,是AI概念股
客户满意,老板满意,大家发大财
--
Q:为什麽aacs叫小西呢??
A:1.因为
aacs的英文名字叫
Cicilia Segeliin
2.因为
西是最好写的
C
3.西是由
一条抛物线+
一组双曲线+
一个椭圆组成的
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 123.193.91.113
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1551985534.A.9E5.html
※ 编辑: aacs0130 (123.193.91.113), 03/08/2019 03:07:36
1F:推 mirror0227: 你那是客户还是chatbot 03/08 07:42
是真人客户
2F:→ MOONY135: 感觉有些接案也很像啊 03/08 08:11
3F:→ sxy67230: 基本上都是这样,客户任务都是要靠自己兜出来,主管或是 03/08 08:25
4F:→ sxy67230: 客户还会都这个有莫名的幻想,觉得DL训练出来的东西应 03/08 08:25
5F:→ sxy67230: 该跟天网一样强大。 03/08 08:25
6F:→ sxy67230: 然後主管期待过後就是失望,最後开始说ML,DL不work 03/08 08:29
7F:→ pelicanper: unsupervised 跟 supervised类比? 03/08 09:10
有人带:learn from expert
没人带:learn yourself
8F:→ plover: 现实世界就是 unsupervised 远多於 supervised 03/08 10:22
9F:→ plover: 资料那麽多根本标不完.. 03/08 10:24
10F:→ aacs0130: 对呀,现实世界Unsupervised 超多 03/08 11:15
※ 编辑: aacs0130 (123.193.91.113), 03/08/2019 11:16:44
11F:推 dddddd67: 接案的工作都是会遇到天兵客户 03/08 12:43
12F:推 ZuiYang: 还好我的工作只是用Ai来解决一些issue而已,好的Ai产品 03/08 12:43
13F:→ ZuiYang: 的门槛真的太高了 03/08 12:43
14F:→ kasimEnix: 我还以为这种对话只会出现在设计业...没想到 03/08 12:52
我设计业的朋友也说我们缺PM,但新创都要自己兼PM, Sales
15F:推 a126sam01: 感觉这位大神学长/姊,对客户有着满满der怨念wwwwww 03/08 14:09
16F:推 littlethe: 这个就是台湾没管理观念的问题了,各行各业都有这状况 03/08 14:35
17F:→ littlethe: 小公司就很喜欢用低薪请一堆外行人瞎搞,结果就比大学 03/08 14:37
18F:→ littlethe: 生作业还差 03/08 14:37
19F:→ littlethe: 不专业的人为了抢功就一直斗,只好花大部分时间在处理 03/08 14:39
20F:→ littlethe: 人问题,变成台湾职场很难学到东西 03/08 14:39
对呀,我也觉得很可惜
21F:推 aiueokaki: 接案公司? 03/08 14:41
我不是做接案的...吧...
但是资料科学家必须要跟客户 / user沟通
每个案子的资料 / user都不同
这是一点也不性感的资料科学家日常...
22F:推 a126sam01: 推little大的论点,这的确是在鬼岛各行业都会发生的 03/08 15:47
23F:→ a126sam01: 问题,所以其实Junior进来後,也要多观察Senior与 03/08 15:48
24F:→ a126sam01: Team Leader 的政治斗争能力XDDD 03/08 15:48
所以没有Senior 可以学就会变成 Super Junior XDDD
跟Super Junior 学就会成为自己讨厌的大人....
※ 编辑: aacs0130 (1.163.177.235), 03/08/2019 16:48:45
25F:推 littlethe: 唉!说到这个我也是很痛心,也许我也就是大家所谓的 03/08 16:58
26F:→ littlethe: super junior,但我根本就不想这样,我也想变成senior 03/08 16:59
27F:→ littlethe: 但又进不到好的公司,只能在没制度的公司一直待,然後还 03/08 17:00
28F:→ littlethe: 是学不到东西,眼睁睁的看着我的年纪老去 03/08 17:01
我也觉得自己是 super junior,
我也往上看不到更资深的DS role model
所以都自学...一起加油
※ 编辑: aacs0130 (1.163.177.235), 03/08/2019 17:05:30
29F:推 littlethe: 我现在不敢自学了,决定要去进修,学真正的方法 03/08 17:12
30F:→ littlethe: 有结果的话,我也来版上发一篇心得文 03/08 17:13
31F:→ littlethe: 这是我唯一能同时增强数学,英文,工程的方法了 03/08 17:15
32F:→ littlethe: 自己学,只能学到API这类的皮毛,但理论思维学不到 03/08 17:18
33F:→ MOONY135: ....越讲我也越伤心 03/08 17:37
34F:→ ice80712: 干嘛要执着於ai?即将要泡沫的东西 03/08 18:55
35F:推 Morphee: 不认同你的类比 人不是机器 比得就是谁的学习跟思维方式 03/08 19:01
36F:→ Morphee: 强大 自比为机器 很怪 03/08 19:01
37F:推 ripple0129: 为什麽自学没办法学理论 03/08 19:18
38F:推 windom2001: 想请教大大,不知您对金融业做AI的看法如何呢?谢谢 03/08 19:22
39F:推 twilighthook: 自学如果要学理论 大概就是学一学 打掉重来N次後 03/08 19:56
40F:→ twilighthook: 才会懂 03/08 19:56
41F:→ aacs0130: 自学当然可以学理论。比较难自学就是{{直觉跟经验}} 03/08 20:23
42F:推 littlethe: 因为自学的话,没有人来纠正你,打个比方吧,有修过DB的人 03/08 20:32
43F:→ littlethe: 一定都知道正规化,但是很多业界非本科的人用了10年DB 03/08 20:33
44F:→ littlethe: ,还是不知道正规化,表就靠自己感觉开,觉得反正可以跑 03/08 20:34
45F:→ littlethe: 就好,在这种情况下,我还真不敢说这10年的老鸟有比本科 03/08 20:35
46F:→ littlethe: 大学生懂DB 03/08 20:35
47F:→ littlethe: 现在也是满街的人在"自学"大数据或AI,懂的人有几个? 03/08 20:37
48F:推 sxy67230: 自学理论可以,虽然基础都有学过,但一堆新的model也只 03/08 20:43
49F:→ sxy67230: 能自学。而且这个行业的理论目前一直都在更新,几年前 03/08 20:43
50F:→ sxy67230: 跟几年後的红的模型都不一样。我念书那个年代HMM做时序 03/08 20:43
51F:→ sxy67230: 建模,分类用SVM就超屌了,那个时候NN还被我们教授说是g 03/08 20:43
52F:→ sxy67230: arbage,现在看到教授的专业上挂了类神经网路。 03/08 20:43
53F:推 BBSealion: 楼上+1 我也是学生时代NN被说是死掉的领域XDDD 03/08 21:16
54F:→ vincentman: 所以NN是起死回生,还是死灰复燃?wwww 03/08 22:21
55F:推 sxy67230: 被谷歌吵红的,当然google没有hiton或是goodfellow这些 03/08 22:33
56F:→ sxy67230: 大神也没办法火起来 03/08 22:33
57F:推 a126sam01: 所以如果要在这行走得远,就只能先从热门领域加减赚 03/08 23:05
58F:→ a126sam01: 然後往更冷门的领域钻研,期待哪天自己的领域能够火XD 03/08 23:06
59F:推 y800122155: 以前我老板也都说NN不就是个Nonlinear Model 03/08 23:12
60F:→ DrTech: NN到现在,都不是万用阿,怎麽说得好像NN是唯一解了。 03/09 00:52
61F:→ aacs0130: NN是因为有GPU,硬体升级才死灰复燃,现在红的是DNN 03/09 03:10
62F:→ aacs0130: 很多教授以前嘲笑NN,现在改说自己20年前就做NN了 03/09 03:11
63F:→ aacs0130: 但是红的是DNN = Deep Learning<不是NN 03/09 03:11
64F:→ DrTech: DNN也不是唯一解阿,现实工作,除非你做CV, 或是外行半调 03/09 09:10
65F:→ DrTech: 子,哪来一开始就硬套任何DNN 架构。 03/09 09:10
66F:→ DrTech: 现在一堆课程,尤其是速成班,一上来就天花乱坠的cnn,rnn, 03/09 09:14
67F:→ DrTech: tensorflow… 在实际工作有好处,也有很多负面坏处。太多 03/09 09:14
68F:→ DrTech: 时候硬套模型不能解决现实问题。 03/09 09:14
69F:推 massacre: 我想业界应该不少老板被洗脑以为用DNN就变成超级赛亚人 03/09 10:38
70F:→ massacre: 以前我去金融业面试 面试官说的好像用上DNN就屌打巴菲特 03/09 10:40
71F:→ massacre: 当我说出实话 对方好像就觉得你太嫩了先去练练再来吧 03/09 10:41
72F:→ massacre: 看到原po的文 我才能理解原来对方要的是Super Junior 03/09 10:45
73F:→ aacs0130: 对呀,大部分业界的问题不需要DNN 03/09 12:00
74F:→ viper9709: 推现实 03/11 20:48
75F:嘘 ray308: 模型都是假的 以後会泡沫 03/13 10:55
76F:推 ruokcnn: 一堆jr DS 彼此train起来至少慢有人带的状况3倍 03/16 14:14
77F:推 kappaco: super junior 同感 ... 03/11 23:52