Soft_Job 板


LINE

大家讨论了很多高深的数学,或是顶会。 实际上,我真的很怀疑有多少人真的在业界上搞 AI。 只论台湾吧。首先市场上纯研发,需要数学或考绩强制发论文的职缺,占不到5%。而且这两年职缺越来越少。更何况顶会… 台湾业界一年也没看多少人在发顶会,几乎没有吧。就连国际研讨会,比例来说也没看到多少人在发,常常看论文的我都没搜到台湾业界发的论与。板上动不动就需要数学与改模型架构,真的感受差很大,可能是我看得不够多? 好啦,如果你在国外大公司当我错了。的确很多人搞数学,但是人数比例还是超级少。 再来谈产品。首先论产品的效果,资料面就决定结果论了。实际工作时,有大部份的时间在处理资料。然後还是要花很多时间做特徵工程。当然特徵工程你可以搞很深的数学啦,但是可能需求方,多给你一个有用的资料特徵,都比搞数学重要。 特徵工程需要用到数学或顶会能力吗? 前面说可利用数学方法,或各种模型做特徵工程或过滤杂讯,这要看任务。至少我比较熟的语音讯号,NLP,搜寻,推荐排序,跟本就没有好方法。没有一套数学方法论,特徵可以有什麽突飞猛进的提升,没见过。喔有人说预训练,就能突飞猛进了啊,问题是,你用预训练需要什麽数学? 你要重新设计一套预训练模型,即使自己设计,也很难别人好阿。搞数学设计演算法要用在哪? 实际上真的没机会发挥居多吧。说数学有用的可以回文讨论一下吗。如果是说常用数学,都是写在 pptx 上用来震撼长官用,我还稍微相信。 非深度学习,各种企业的结构化或数字型资料,也不需要设计什麽数学来做特徵工程吧。常见的不平衡标签的状况,用数学重新去设计 loss function, 效果提升真的有限,而且改来改去可能还不如用别人设计好的方法。改来改去不如前面搭一层规则引擎过滤修改 bad case结果。 资料与特徵搞得差不多了,来谈谈模型吧。 正常有经验的人,怎麽会马上跳到复杂的模型,或自己设计。拜托,恨不得模型越简单越好吗。能达到产品规格的模型就好,模型用越简单越好,计算成本才能压低,性能才会好。 这时有人会跳出来说了:我们会为了提升AI能力,用复杂的模型,然後蒸馏,这时需要数学了吧? 没吧,机会有够少的。现成open source的蒸馏模型,scaling,都是经过研发与实验的,你自己设计跟本很难效果赢别人。当那些世界名校学数学的人,是塑胶做的吗?自己随便搞就能赢人? AI又不只 监督学习, RL,图学习,各种复杂AI,总会用到数学了吧?问题是有多少人可以搞数学搞到比现成方法好? 要花多少成本呢? 再来跳针一下,面试推导总该需要数学了吧。喔对,大厂工作基本工。问题是,你面完你就忘得差不多了。下次找工作再复习。而且台湾真的多数公司不考。 不是说数学不重要,或 学AI不需要学数学,而是单纯找个混口饭吃的工作,还真的不用特别去学数学。只是要有 AI工作,没顶会,没kaggle也一堆工作。这才是现况吧。 --
QR Code



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.200.148.218 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1636564801.A.21C.html
1F:→ shomingchang: 我觉得会数学跟甚麽顶会、比赛是两码子事吧 11/11 01:31
2F:→ shomingchang: 如果要去看别人论文实作,不懂数学会连符号都看不懂 11/11 01:32
3F:→ DrTech: 对,我也觉得两码子的事情。文中有错可多指正。 11/11 01:33
4F:→ shomingchang: 跟设计演算法也是两码子事,只是单纯读得懂的而已 11/11 01:34
5F:→ DrTech: 看论文实作或复现的工作在台湾也很少。多数不需要。 11/11 01:35
6F:→ shomingchang: 嵌入式环境需要吧 可没有python的一堆套件可以用 11/11 01:38
7F:推 clothg34569: 数学 顶会 KAGGLE这三样没甚麽关系吧 11/11 02:23
8F:推 labbat: 重造轮子的工作比你想得多了,需要数学的 11/11 02:51
9F:推 min86615: 有啦ECCV 会在Kaggle办比赛,请第一名去会议上分享 11/11 08:10
10F:推 frouscy: 要在业界做applied ML软工比数学重要太多了QQ 11/11 08:34
11F:推 stmilk: 其实依照你的前提“只是要糊口饭吃”,不要说ai了,所有 11/11 09:39
12F:→ stmilk: 行业都不需要数学了,没什麽讨论点吧。再来,你提到模型 11/11 09:39
13F:→ stmilk: 的部分不就说了数学的重要性,还是你其实是想告诫大家不 11/11 09:39
14F:→ stmilk: 要妄想跟世界名校数学人竞争而不是数学的重要性?最後, 11/11 09:39
15F:→ stmilk: 你提到的部份把前提假设的这麽美好当然就不用数学,来聊 11/11 09:39
16F:→ stmilk: 聊推荐系统好了,今天老板给你一行为人的一堆网页点击资 11/11 09:39
17F:→ stmilk: 料,跟一堆他看过的文本图片,而且都还稀疏各种缺漏,接 11/11 09:39
18F:→ stmilk: 着就什麽都没有了,叫你弄推荐系统,你是打算现在流行方 11/11 09:39
19F:→ stmilk: 法套一套然後交差然後说抱歉我尽力了吗?还是或尝试用统 11/11 09:39
20F:→ stmilk: 计方法处理一下资料? 11/11 09:39
21F:推 stmilk: 或是股市资料,今天老板就给你开高低收量,叫你写策略, 11/11 09:44
22F:→ stmilk: 你一样是会用现行流行方法套一套然後说没办法,还是尝试 11/11 09:44
23F:→ stmilk: 去机率建模分析? 11/11 09:44
24F:推 mmonkeyboyy: 楼上 你确定现在推荐系统是这样做的? XD 从数学做 11/11 10:00
25F:→ mmonkeyboyy: 老板会叫你回家吃自己.... 别人都上市了 你在那刻 11/11 10:00
26F:推 mmonkeyboyy: 更别提还有很多美丽的数学解不了的工程问题 11/11 10:03
27F:推 stmilk: 再提一下模型的部分,模型越小越好除了成本考量,最重要 11/11 10:07
28F:→ stmilk: 的是降低capacity导致的overtraining的问题,深入研发的 11/11 10:07
29F:→ stmilk: 部分有一大派就是在想办法降低这个部分,但你只有两条路 11/11 10:07
30F:→ stmilk: ,一是改变模型架构这也是,纯学术在做的事,因为不用考 11/11 10:07
31F:→ stmilk: 虑有的没的只要专注降低capacity跟训练成本就好,像tran 11/11 10:07
32F:→ stmilk: sformer极大程度降低了capacity跟能够平行运算,另一条路 11/11 10:07
33F:→ stmilk: 就是想办法丢进模型的资讯少一点,因为根据Universal ap 11/11 10:07
34F:推 mmonkeyboyy: 真觉得这麽厉害也有用 可以去对岸试试 11/11 10:07
35F:→ stmilk: proximation theorem能在模型上干的事有限,结果不管怎麽 11/11 10:07
36F:→ stmilk: 搞就是那样,所以要嘛像你说的伸手牌去跟需求端要更好的 11/11 10:07
37F:→ stmilk: 特徵,要嘛就是自己搞,对就是用数学,就算是那些常见手 11/11 10:07
38F:→ stmilk: 法你不会就不能用 11/11 10:07
39F:→ mmonkeyboyy: 实务上就一堆数学搞不定的 就是叫工程的搞破坏搞定 11/11 10:09
40F:→ mmonkeyboyy: 你也就讲 那数学哩 你看过一堆暴力pruning? 11/11 10:11
41F:→ mmonkeyboyy: 至今这帮人也还没给出啥解释 但人家超好用啊 11/11 10:11
42F:推 stmilk: 你总有上线後要优化吧,真的就要放上去就不管喔那我也没 11/11 10:12
43F:→ stmilk: 话说啦 11/11 10:12
44F:→ mmonkeyboyy: 你只是上线後优化....很多时候跟数学没关啊.... 11/11 10:12
45F:→ mmonkeyboyy: 优化界跟数学没关的更多了 = =" 很多都是後来再套数 11/11 10:13
46F:→ mmonkeyboyy: 学上去的 後面来的人傻傻以为人家是这样想出来的 11/11 10:13
47F:→ mmonkeyboyy: 现实情况是 如果有数学可以解真好 但多的是没有 11/11 10:14
48F:推 stmilk: 我的优化不是优化速度有的没的,是优化准确率啦 11/11 10:14
49F:→ stmilk: 你不能没有就不做阿=_= 11/11 10:15
50F:→ mmonkeyboyy: 但还是得优化....囧> 11/11 10:15
51F:→ mmonkeyboyy: 优化准确率 然後你去做数学 结果花一堆时间做出来 11/11 10:15
52F:→ mmonkeyboyy: 更烂....你老板不立马开了你 不然你以为大家大部份 11/11 10:16
53F:→ mmonkeyboyy: 都是从别的地方开始是为啥.... 11/11 10:16
54F:→ mmonkeyboyy: 就拿cnn类来说 自从出来後 真有意义的改良也就几个 11/11 10:17
55F:推 stmilk: 你知道平台端的广告投放商竞价系统要做的事吗? 11/11 10:17
56F:→ mmonkeyboyy: 一年大拜拜就出那个位数篇 也就几年而已 11/11 10:18
57F:→ stmilk: 优化那个机率真的不是你暴力法去搞就好 11/11 10:18
58F:→ mmonkeyboyy: 我没跟 平台端做过 到是不知道 11/11 10:19
59F:→ mmonkeyboyy: 我跟你的上面出推荐的人做过 最後他们用我们暴力方 11/11 10:19
60F:→ mmonkeyboyy: 案....用空间换 11/11 10:20
61F:→ mmonkeyboyy: 他们自己算过成本 对方也一堆数学家+AI理论专家 11/11 10:21
62F:→ mmonkeyboyy: 最後各种比完之後拿下来的是工程硬解上RAM 11/11 10:22
63F:→ mmonkeyboyy: 後面商家我没做过 抱歉 也许那端是吧 11/11 10:22
64F:→ mmonkeyboyy: 数学那麽美丽 我每个都用f32不更美 刚好回家吃自己 11/11 10:24
65F:→ mmonkeyboyy: 还不如int8/16 混合先撑撑过了再说 11/11 10:24
66F:→ mmonkeyboyy: 当然我不是说数学不好 只是说要久一点 要多久就是 11/11 10:25
67F:→ mmonkeyboyy: 比投资人的耐心了....学术界就是要比有没有人比你更 11/11 10:26
68F:→ mmonkeyboyy: 快想到.... 11/11 10:26
69F:→ mmonkeyboyy: 说到数学家 一堆都在研究blis/blas/smm-mul 11/11 10:33
70F:→ mmonkeyboyy: 纯数还没有遇到几个 还真不知道他们在干嘛 11/11 10:35
71F:→ mmonkeyboyy: 但我知道没有很常在做网路就是了 11/11 10:35
72F:推 alpe: 四类写後端又念资管硕写AI论,非相关科系根本不懂那数学符号 11/11 11:50
73F:→ alpe: 我写完论文我还是不懂, 问几个中阶的问题我就死了 11/11 11:52
74F:推 aria0520: 我在业界AI到现在的确是没什麽碰到数学 11/11 15:56
75F:→ aria0520: 顶会workshop倒是有个一篇 11/11 15:56
76F:→ odahawk: 我在IC设计公司用过滤波器数学 11/11 16:14
77F:推 solitude6060: 回上面的:你确定现在推荐系统是这样做+1(好啦我没 11/11 17:05
78F:→ solitude6060: 有要参战XD 11/11 17:05
79F:推 leptoneta: 应该说在台湾 不是职称有AI就以为自己在搞AI 11/11 17:38
80F:→ leptoneta: 写作人工智慧 读作工人智慧 11/11 17:39
81F:→ aria0520: 不过现在台湾业界对AI的定义就是这样没错 11/11 20:24
82F:→ aria0520: 台湾的纯软公司体量没有大到像国外可以真的搞研究 11/11 20:25
83F:→ aria0520: 发paper 台湾业界就是要速成有效和部署 11/11 20:25
84F:推 mmonkeyboyy: 囧> 我也没有要参战啊 只是觉得事必有因 这样XD 11/12 02:02
85F:→ mmonkeyboyy: 再看几个回应 嗯 果然不出所料XD 11/12 02:03
86F:→ mmonkeyboyy: 其实全世界真做nn研究的真的很少 每年做出来的都可 11/12 02:04
87F:→ mmonkeyboyy: 以用手指数的@_@~ cv来说过去几年也就某一派大杀四方 11/12 02:04
88F:→ mmonkeyboyy: 说实话我自认智商不足 还是去一边画圈好了XD 11/12 02:05
89F:→ mmonkeyboyy: 我觉得有效部署不是错事 因为更多ai都是纸上谈兵 11/12 02:06
90F:推 mmonkeyboyy: 而且要有资金才有新研究 还是要能有钱才转得动啊 11/12 02:08
91F:→ mmonkeyboyy: 几乎所有公司都是拿别的养ai部门 没有别的抢上市先 11/12 02:11
92F:→ mmonkeyboyy: 赚一波也不是坏事啊 11/12 02:11
93F:推 world4jason: 现在推荐系统复杂多了 都是pipeline组合 基本上是工 11/12 12:35
94F:→ world4jason: 程问题 只是每个环节上有不同model针对该环节指标优 11/12 12:35
95F:→ world4jason: 化 但说实在看起来很work的论文 套用到在家data上根 11/12 12:35
96F:→ world4jason: 本不一定work 对资料的研究 前处理 这些工程事情才真 11/12 12:35
97F:→ world4jason: 的是关键 另外像是推荐系统这种虽然有指标但每个人体 11/12 12:35
98F:→ world4jason: 感大不相同的东西 为了几%的指标提升从ML改DL 然後每 11/12 12:35
99F:→ world4jason: 个月烧的数字多一个0 这方案绝对不会被采用的 11/12 12:35
100F:→ DrTech: 推荐系统,或人的行为纪录,现在根本没有好的数学可以提升 11/12 12:44
101F:→ DrTech: 点击效果,购买效果。也是考大力出奇蹟。实务上真的没机会 11/12 12:44
102F:→ DrTech: 给你用数学去提升。 11/12 12:44
103F:推 aiueokaki: 这篇才接近现实 11/12 12:57
104F:推 aria0520: 基本上你公司谁算力大谁就赢一半了 11/12 23:32
105F:→ aria0520: 不用算数学 积木设计好丢下去NAS搞定 11/12 23:34
106F:推 world4jason: 同意原po说的 看起来是业内人XD 推荐系统跟数学完全 11/14 00:09
107F:→ world4jason: 无关 完全是domain knowledge跟工程 有时候抓到key f 11/14 00:09
108F:→ world4jason: eature就吊打千千万万模型了 11/14 00:09
109F:→ world4jason: 不行的话就是大力出奇蹟XD 11/14 00:09







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Gossiping站内搜寻

TOP