作者NTHUlagka (拉卡)
看板Tech_Job
标题[讨论] OpenAI GPT o1模型
时间Tue Sep 17 10:14:50 2024
https://openai.com/index/learning-to-reason-with-llms/
上礼拜OpenAI发布经过强化学习训练的新型语言模型o1
宣称模型有更强大的思考能力
o1在回答之前会深入思考产生内部的推理练
结果就是o1模型在各个人类顶尖领域获得相当好的成绩
o1数学方便相当於美国奥林匹克AIME前500名的选手
程式方面位居Codeforce前11%
上礼拜的Leetcode双周比赛
https://leetcode.com/contest/biweekly-contest-139/ranki
ng/
以12分钟通关
在物理生物化学领域(GPQA)已经超过人类博士的程度
对科技业比较相关的是 看来以後线上面试考白板题
可能都还要关注面试者眼神有没有乱飘以防用GPT作弊 但如果是OA好像就无法可防了
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.250.51.3 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Tech_Job/M.1726539293.A.A27.html
1F:推 mydear3310 : 太兴奋了看成OL模型09/17 10:22
2F:推 hips : 现在可以解3.11vs3.9哪个大了吗?09/17 10:29
3F:推 koushimei : 但是没办法贴图片或者附档比较麻烦09/17 10:42
4F:→ somerabbit : 搭配cursor使用 ng立刻变senior level09/17 11:23
5F:推 lemonsheep : 不用防吧 以後就不用考白板题啦09/17 11:29
6F:→ lemonsheep : Gpt 已经比99%的面试者强了09/17 11:29
7F:→ lemonsheep : 以後只剩know how比较重要了09/17 11:29
这样看来白板题八股文是不是要走入历史了 以後也不用刷题了
只是是说这些know how未来也会被GPT取代吧 现在都已经能达到这个程度了
SWE以後可能就是负责下指令然後帮gpt review吧
※ 编辑: NTHUlagka (42.70.92.176 台湾), 09/17/2024 11:35:00
8F:推 HiHiCano : 软工刷题仔逝去09/17 11:45
9F:→ HiHiCano : 还好台湾大部分是不用刷题的硬体工作09/17 11:46
10F:推 musashi023 : leetcode这种陋习早该下去了09/17 11:46
11F:推 Wishmaster : gpt的知识量真的屌虐,自己研究个东西可能要两三小09/17 11:51
12F:→ Wishmaster : 问一下答案直接套用,虽然不能每次都work也够了09/17 11:51
13F:推 HiHiCano : 软工的知识在网路上太多了 很容易训练09/17 11:52
※ 编辑: NTHUlagka (42.70.92.176 台湾), 09/17/2024 11:58:58
14F:推 reprobate : 看什麽时候能让我当甲方直接开需求就把软体含UI都09/17 12:04
15F:→ reprobate : 写好09/17 12:04
※ 编辑: NTHUlagka (42.70.92.176 台湾), 09/17/2024 12:08:38
16F:推 NTUCS5566 : 好像网页制作可以正确产生 bilibili有人测试 09/17 12:41
17F:→ NTUCS5566 : 直接提需求 code直接写完 成品网页直接产生 09/17 12:41
18F:→ NTUCS5566 : 但我走FW的 看不懂他们在干嘛 感觉有点厉害就是了 09/17 12:42
19F:推 darkangel119: 先拿台湾学测的数学戳戳看 09/17 12:43
20F:推 MAGICMCGRADY: 刷题其实不算陋习 09/17 12:45
21F:推 MAGICMCGRADY: 台厂聊天面试比较像陋习 09/17 12:49
22F:推 yoyoyolin : 以前就说了,现场考实作题比较有监别度。考那个leet 09/17 13:03
23F:→ yoyoyolin : code 还不如直接挑本科系人选就好。 09/17 13:03
24F:→ yoyoyolin : 考实作题本科系还不一定答的出来。 09/17 13:05
25F:推 MAGICMCGRADY: 还好啦,面试还会考系统设计 那才是定级的关键 09/17 13:07
26F:→ MagicMomo19 : 是说还真的把整份需求丢上去过,写是写的出来但是画 09/17 13:42
27F:→ MagicMomo19 : 面丑爆,有资安检测也不可能过的那种,顶多就是单一 09/17 13:42
28F:→ MagicMomo19 : 功能能跑能动,可是串不起来整个流程这样 09/17 13:42
29F:推 lemonsheep : 系统设计大部分人也都是念书本上的再想办法兜啊 只 09/17 13:43
30F:→ lemonsheep : 要是套现成系统性的知识99%的人都赢不了gpt 的 只 09/17 13:43
31F:→ lemonsheep : 剩最後1%真的能做开创性东西的人才还有一席之地 09/17 13:43
33F:→ sy2es6404 : 测验IQ超过120 09/17 13:50
34F:推 ejnfu : 刷题慢慢式微也不错,本来太偏重刷题也不太正确 09/17 13:53
35F:→ yunf : 没差吧他们应该会调整难度 09/17 13:55
36F:→ yunf : 毕竟真的问题他解不了 09/17 13:57
37F:→ yunf : 上次有个门萨的说pchome会倒闭後来也没有 09/17 14:06
38F:推 yueayase : 其实这些工具出来,即使取代了一些功能,总有别的方 09/17 15:57
39F:→ yueayase : 面可以去努力吧 09/17 15:57
40F:推 strlen : 还考啥?连职缺都可以关一关了喇 09/17 16:42
41F:推 rodion : 不能验证自己说出口的话 就依旧只是高级 google搜寻 09/17 17:04
42F:推 a9101214 : 好猛喔拉卡 09/17 17:54
43F:推 create8 : 也进步太快了… 09/17 18:41
44F:推 andy810306 : 双周赛Q4解法丑到爆,这绝对过不了面试的放心 09/17 19:41
45F:推 hobnob : 我分享一下我写1000多题的心得啦,讲好听是单纯讲 09/17 20:10
46F:→ hobnob : 难听是死板,帮你复习大学学过的资结演算法而已,去 09/17 20:10
47F:→ hobnob : 想我们用的工具哪个不是以资结与演算法为基本的? 09/17 20:10
48F:→ hobnob : 不知所以然的人还是很多啦,不要说刷题面试是陋习, 09/17 20:10
49F:→ hobnob : 题刷不好才有问题 09/17 20:10
50F:推 hobnob : 但是周赛是competitive programming,题目本质跟面 09/17 20:13
51F:→ hobnob : 试有差 09/17 20:13
52F:推 dont : 真要防只能回归疫情前 onsite都进公司考白板题了吧 09/17 20:32
53F:推 steak5566 : 应该会回归真的on site 然後很多场挤在同一天这样 09/17 21:47
54F:推 VScode : 以後应该会优先考system design了 09/17 22:01
55F:推 shortoneal : 是说copilot最近变好笨,有甚麽方法可以重制吗 09/17 22:10
56F:→ shortoneal : 他会auto complete一些别的repo的structure...虾写 09/17 22:10
57F:→ shortoneal : 一波 09/17 22:10
58F:推 bitcch : 以後测验大概会变成看你是否能理解除错AI生成的答案 09/17 22:22
59F:→ bitcch : 以及如何用最佳的prompt来快速建构出程式码 09/17 22:23
60F:推 AudiA4Avant : 说真的,AI写题这麽强的情况下,以後考算法绝对不是现 09/17 22:53
61F:→ AudiA4Avant : 在这样 09/17 22:53
62F:→ AudiA4Avant : 甚至 system design prompt 下对的情况,也能在很短 09/17 22:54
63F:→ AudiA4Avant : 时间内透过互动得到一个还行的架构 09/17 22:54
64F:→ TSMCfabXX : HTML 碰到特殊字元还是不行 09/17 23:57
65F:推 dj025258 : 听休学後待业超过10年的人谈论努力,真是醍醐灌顶, 09/18 07:40
66F:→ dj025258 : 谢谢开示 09/18 07:40
67F:推 nxuanr : ai 会解决一切问题 09/18 09:09
68F:推 X28338136X : 所以现在会写verilog 了吗 09/18 15:54
69F:推 Izangel : Nvda内部就有verilog生成器了好吗 09/18 18:39
70F:推 aasssdddd : 4o 9.11>9.9 o1 9.9>9.11 但明显算比较久 09/19 09:55
71F:推 Izangel : 你先提示他9.11跟9.9是纯数字,就不会算错了啦 09/19 10:31