作者sam20135 (sam20135)
看板Stock
标题[新闻] AI竞争愈烈 OpenAI测试新AI模型o3与o3 mi
时间Sat Dec 21 15:10:01 2024
https://news.cnyes.com/news/id/5815798
AI竞争愈烈 OpenAI测试新AI模型o3与o3 mini
钜亨网编译陈又嘉
OpenAI 周五 (20 日) 宣布,目前正在测试其最新的推理 AI 模型 o3 和 o3 mini。此举
显示 AI 产业竞争日益激烈,包括 Google(GOOGL-US) 在内的竞争对手也致力於开发能处
理复杂问题的更先进模型。
OpenAI 执行长 Sam Altman 表示,公司计划在 1 月底推出 o3 mini 模型,随後推出完
整版本的 o3 模型。这些规模更大、更健全的语言模型预计将超越现有模型,有望吸引新
的投资与用户。
根据 OpenAI 一篇部落格文章,该公司於 9 月推出的 o1 模型已展示出解决科学、程式
编码与数学等复杂任务的能力。即将推出的 o3 和 o3 mini 模型目前正在进行内部安全
测试,其能力表现预计将远超过 o1 模型。
为了让外部研究人员参与测试过程,OpenAI 启动了申请程序,开放有兴趣的人在公开发
布前测试 o3 模型。这项申请程序将於 1 月 10 日截止。
自 2022 年 11 月推出 ChatGPT 以来,OpenAI 已成为 AI 产业的关键企业,引发了一场
可称为 AI 军备竞赛的浪潮。该公司凭藉日益增长的知名度及持续推出产品,已成功吸引
了大量资金,在 10 月完成了 66 亿美元的融资。
OpenAI 在 AI 领域的主要竞争对手、Alphabet 旗下的 Google,则於 12 月初推出了其
第二代 AI 模型 Gemini,盼藉此重返在 AI 科技竞赛中的领先地位。
-----------------------------------------------------------------------------
1月底将推出 o3 mini,竞争越来越激烈了,又有突破性发展。
AGI「通用人工智能」(artificial general intelligence),
看来达到人类基本水平不远了。
https://today.line.me/hk/v2/article/BEWYRqj 这里有进一步数据解说
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.42.212.34 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1734765005.A.31F.html
1F:推 breathair : 人类剩几集? 12/21 15:25
2F:推 ohlong : 图表85%AGI觉得蛮胡兰的 12/21 15:26
3F:推 k1k1832002 : 感觉2026就是新时代了 12/21 15:27
4F:→ DAEVA : 一脸正经的胡说八道 12/21 15:30
5F:推 bj45566 : 其实重点在於 Google 已经全面追上 OpenAI 了 12/21 15:42
6F:推 bj45566 : 文字描述生成影片技术 Veo 2 > Sora 12/21 15:48
7F:嘘 shinewind : 到底什麽时候才能搞好图表 12/21 15:50
8F:→ shinewind : GPT分析图表都在鬼扯 12/21 15:50
9F:推 sdbb : 呜呜,难怪昨天GG 挂190捡不到 12/21 16:07
10F:推 SRNOB : 200美金一个月 下次2000美金一个月 赛博穷人用不起 12/21 16:16
11F:推 bob1012 : 推 传统科技业人才迟早会被人工智能的大浪淹没 12/21 16:28
12F:→ lavign : google有人力财源和资料支持,奥特曼人才都跑了 12/21 16:30
13F:推 mdkn35 : o@呢 12/21 17:06
14F:→ mdkn35 : o2 12/21 17:06
15F:推 y800122155 : 没救了 Google花不到一年时间就已经实现全面超越 而 12/21 17:06
16F:→ y800122155 : 且发展方向更广 12/21 17:06
17F:推 strlen : 实际体感测试o1跟gemini 2.0 後者还是远远输啊 12/21 17:18
18F:→ strlen : 不管是回应品质还是正确度 都不行 Claude还比较好 12/21 17:18
19F:推 Homeparty : GPT5.0呢 12/21 17:23
20F:推 xkso : GG本益比还不到30真滴便宜 12/21 17:26
21F:→ xkso : GOOG 12/21 17:26
22F:推 aspwell520 : 难道没有人觉得AI连数学都会算错有点不聪明吗… 只 12/21 17:34
23F:→ aspwell520 : 是内建计算机的事情而已 12/21 17:34
24F:→ aspwell520 : 虽然这跟AI背後的演算法完全无关 但很多日常AI应用 12/21 17:35
25F:→ aspwell520 : 场景都需要精确的数学吧 12/21 17:35
26F:推 newyorker54 : 很多人都不看O3展示就高谈阔论 12/21 17:40
27F:→ newyorker54 : O3已经是博士级系统还没有开放,坐中间的工程师说下 12/21 17:43
28F:→ newyorker54 : 一步就是做自我修改程式自我进化,奥图曼吓到立马说 12/21 17:43
29F:→ newyorker54 : 不会那麽做 12/21 17:43
30F:→ newyorker54 : 表示自我进化就是临门一脚,二十四小时自我评测自我 12/21 17:45
31F:→ newyorker54 : 进化要怎麽输给人类 12/21 17:45
32F:→ newyorker54 : 六月鸭子不知死活 12/21 17:46
33F:→ newyorker54 : 坐中间的工程师奥数满分编码竞赛在人类记录2500多分 12/21 17:48
34F:→ newyorker54 : ,这里一堆人在呛OpenAI?? 12/21 17:48
35F:推 newyorker54 : 他说Illya3000分,天才啊 12/21 17:52
36F:→ MoonCode : 楼上你在说啥= = 12/21 17:54
37F:推 Heedictator : 看 sora 就知道这间公司不行了 12/21 18:00
38F:推 tsubasawolfy: 他在说OPENAI那片的内容 O3的写程式分数已经赢中间 12/21 18:13
39F:→ tsubasawolfy: 那位穿白衣介绍的 只比首席工程师低一点 12/21 18:13
40F:→ tsubasawolfy: 数学问题的话 O3目前美国数学奥林匹亚已经96.7% 因 12/21 18:15
41F:→ tsubasawolfy: 为有一题不论怎样算都错。 12/21 18:16
42F:→ tsubasawolfy: 传统数学满足不了就跑去算给数学家在玩得未发表数学 12/21 18:16
43F:→ tsubasawolfy: 问题 正确率25% 其他模型都只有妮趴 12/21 18:17
44F:嘘 GodtoneIsGod: openAI命名越来越乱了 3.5 4 4o o1 o3 12/21 18:17
45F:→ tsubasawolfy: AGI部分那测验是考推理能力 虽然他是87.5%通过人类 12/21 18:18
46F:→ tsubasawolfy: 85%的门槛 不过那是开大招所有资源全上算16小时 12/21 18:18
47F:→ tsubasawolfy: 不到两年时间可以用LLM+自我强化推到这程度 12/21 18:19
48F:→ tsubasawolfy: 看更详细的解说有提到o3是o1自我强化来 没有重新预 12/21 18:20
49F:→ tsubasawolfy: 训练 省去时间跟金钱 12/21 18:20
50F:→ tsubasawolfy: 不过85%门槛大概是为了降低恐慌 纽约大学找1400人测 12/21 18:29
51F:→ tsubasawolfy: 通过率只有73-77% 12/21 18:29
52F:推 bj45566 : 1. OpenAI o3 离真正的 AGI 还明显有一段距离 12/21 18:33
54F:→ strlen : 超人力霸王 你怕惹吗?呵呵呵 12/21 18:34
55F:推 newyorker54 : 谢谢楼上解说,专业的 12/21 18:35
56F:推 bj45566 : 2. AIME 只是美国国内数学奥林匹克选拔赛的资格赛 12/21 18:35
57F:→ newyorker54 : 我是说tsubasawolfy 12/21 18:36
58F:→ newyorker54 : 应该是美国国内决赛吧? 12/21 18:38
59F:→ newyorker54 : 这片看来离AGI只有一步之遥,祂已经能自我评测,要 12/21 18:40
60F:→ newyorker54 : 不要加入自我修改程式的能力只看奥图曼要不要了 12/21 18:40
61F:推 bj45566 : "ARC-AGI 并不是AGI的试金石,它只是一种研究工具, 12/21 18:47
62F:→ bj45566 : 旨在聚焦 AI 领域中最具挑战性的未解决问题。通过 A 12/21 18:47
63F:→ bj45566 : RC-AGI,并不意味着实现 AGI。" 12/21 18:47
64F:→ strlen : 老黄去年就说惹 如果AGI指的是所有测验都打爆人类 12/21 18:57
65F:→ strlen : 那就五年 啊如果你要自己随便定义啥是AGI 那大概永 12/21 18:57
66F:→ strlen : 远达不到 话随便你讲罗 12/21 18:57
67F:推 jo4 : 所以AGI定义是什麽 12/21 19:00
68F:嘘 bj45566 : AGI 什麽时候是定义在标准测验打败人类,笑死 wwww 12/21 19:06
69F:→ bj45566 : 连 Google scholar AGI 都不会,AI 第一个要淘汰的 12/21 19:14
70F:→ bj45566 : 就是这种人 12/21 19:14
71F:→ strlen : 我可没说AGI是测验都过 是老黄说的 事实上 根本没 12/21 19:17
72F:→ strlen : 人知道AGI定义是三洨 所以就看某人胡说八道 笑死 12/21 19:17
73F:→ strlen : 没有定义没有测量方式 还整天在那边说啊你这葛根本 12/21 19:19
74F:→ strlen : 不是AGI 这跟性别认同是战斗直升机一样经典 12/21 19:19
75F:→ strlen : 我还希望AI赶快淘汰我勒 太慢了 老黄何时再回300? 12/21 19:21
76F:→ strlen : 我成本就300啊 嘻嘻 12/21 19:21
77F:推 sdbb : 上上次拆股前的300,羡慕 12/21 19:21
78F:嘘 bj45566 : 什麽资料都不会去查就信口开河说没有人知道什麽是 A 12/21 19:33
79F:→ bj45566 : GI,笑死人有够好笑 wwww 12/21 19:33
80F:→ mic73528 : google ai有人用喔?????gpt跟claude不就分完了 12/21 19:34
81F:嘘 bj45566 : 如果照____的八奇逻辑这世界根本没有 AGI 的定义, 12/21 19:38
82F:→ bj45566 : 那 OpenAI 刚问世时是不是就可以自称为 AGI?尽讲这 12/21 19:38
83F:→ bj45566 : 种弱智至极无法自洽的话还拼命出来丢人现眼,笑死! 12/21 19:38
85F:→ strlen : 你找出OpenAI CEO哪一次说自己是AGI 找啊 12/21 19:40
86F:→ strlen : 还在胡扯 唉 12/21 19:40
87F:→ bj45566 : 这世界上没有 AGI 的定义,但公布 OpenAI o3 却还是 12/21 19:42
88F:→ bj45566 : 要公开拿来跑测 ARC-AGI?嘻嘻 12/21 19:42
89F:→ strlen : 反正你也不认为那些狗屎测验是AGI啊 所以我才说随便 12/21 19:43
90F:→ strlen : 你讲啊 嘻嘻 你高兴就豪 12/21 19:43
91F:→ bj45566 : 自成立以来,OpenAI 一直强调,他们的核心目标是打 12/21 19:45
92F:→ bj45566 : 造一个能造福全人类的安全 AGI 12/21 19:45
93F:→ bj45566 : OpenAI 的成立目的就是 AGI, 如果已经达到了,怎麽 12/21 19:47
94F:→ bj45566 : 不敢向世人说 o3 就是 AGI 了?弱智 wwww 12/21 19:47
95F:→ sdbb : Ai:韬光养晦 12/21 19:49
96F:推 bj45566 : 讲一个最简单的,如果是 AGI, 考人类的数学测验只要 12/21 20:19
97F:→ bj45566 : 让 o3 配个摄影镜头就直接能理解题目并写出、画出 12/21 20:19
98F:→ bj45566 : 答案和附上推理过程 -- 结果 o3 还是要靠人类输入 12/21 20:19
99F:→ bj45566 : 问题,然後碰到题目里有复杂图案的几何问题也没办法 12/21 20:19
100F:→ bj45566 : 自己看懂,AGI 个鬼! 12/21 20:19
101F:推 newyorker54 : 看奥图曼的反应,明显可以做出他认定的AGI 但是不是 12/21 20:22
102F:→ newyorker54 : 安全的AGI ,所以中间那个工程师说要接着做自我修正 12/21 20:22
103F:→ newyorker54 : 程式码的AI奥图曼立刻完全没停顿说we may be not 12/21 20:22
104F:→ newyorker54 : 我看你是不懂喔!祂不是看不懂图祂在思考问题的逻辑 12/21 20:24
105F:推 tsubasawolfy: mac的GPT app现在有开放捕捉桌面了 WIN的还没开 12/21 20:24
106F:→ tsubasawolfy: 手机的倒是可以试试看直接开镜头让他算 12/21 20:24
107F:→ newyorker54 : 祂後来有解出来,你根本完全没有看就在这里呛。唉, 12/21 20:25
108F:→ newyorker54 : 程度的差距 12/21 20:25
109F:→ newyorker54 : 我直接截图给GPT算都能解答了,有差摄影机吗? 12/21 20:26
110F:→ newyorker54 : 呛人的是腿多久了,还停留在以前的印象 12/21 20:28
111F:嘘 bj45566 : 哪里有直接开镜头不用任何人工辅助让 o3 解决复杂 12/21 20:30
112F:→ bj45566 : 的几何问题的影片请丢出来让大家闻香好吗? 12/21 20:30
113F:推 newyorker54 : 你有付我钱吗?笑死 12/21 20:31
114F:嘘 bj45566 : 还有,ChatGPT o3 通过率 25.2% 的 Frontier Math 12/21 20:33
115F:→ bj45566 : 不是 open problems 好吗!那些是难度特别高但都已 12/21 20:33
116F:→ bj45566 : 经被人类解决了的问题 12/21 20:33
117F:→ yunf : 你自己去用看看弄出什麽东西 12/21 20:33
118F:→ bj45566 : 拿不出来就找各种蹩脚藉口了,笑死 wwww 12/21 20:34
119F:→ yunf : 炒股画梦很厉害 一般人用不出来 12/21 20:34
120F:→ bj45566 : 少在那边误导人以为 OpenAI o3 能够解决 open probl 12/21 20:36
121F:→ bj45566 : ems 那样屌到天边 wwww 12/21 20:36
122F:推 shawshien : AI产品那麽多 我到底要付费订阅哪个帮我工作? 12/21 20:45
123F:推 bj45566 : 在 OpenAI o3 发布的官方影片上出现的: 12/21 20:50
124F:嘘 bj45566 : "we have early indications that ARC-AGI-2 will r 12/21 20:52
125F:→ bj45566 : emain extremely challenging for (OpenAI) o3" 12/21 20:52
127F:→ yunf : 问题一堆 搞钱很会 12/21 20:55
128F:→ yunf : 之前就讲过我已经在他发展技术的终点等他了 12/21 20:57
129F:推 tsubasawolfy: 当然要解决才能对答案呀 这是比较级的 跟其他模型 12/21 21:04
130F:→ tsubasawolfy: 也是 GOOGLE跟META不知道有没有测 12/21 21:04
131F:→ tsubasawolfy: ARC2那边没看到有相对人类的发表 再等等吧 12/21 21:05
132F:→ tsubasawolfy: 不过我觉得这东西还是跟使用GOOGLE一样看个人能力 12/21 21:06
133F:推 bj45566 : 根据今年的战况,Google 很可能会在三个月左右後发 12/21 21:08
134F:→ bj45566 : 表效能相等或更佳的产品 12/21 21:08
135F:推 j3 : ai训练ai ai自动进化的奇点快到了 12/21 21:17
136F:推 bj45566 : 是啊,对 Google 这工具的掌握度可以让两个人学习和 12/21 21:22
137F:→ bj45566 : 工作能力相差十几倍甚至几十倍,加入 AI 後可能相差 12/21 21:22
138F:→ bj45566 : 到百倍 12/21 21:22
139F:推 ohlong : Google稳超车的 openAI大咖跑掉 其实从最近动作就 12/21 21:41
140F:→ ohlong : 看得出来密切在跟G合作 12/21 21:41
141F:→ ohlong : 而且G光旗下像youtube背後长期分析的database 就注 12/21 21:44
142F:→ ohlong : 定sora被屌打 12/21 21:44
144F:→ yunf : 看金主爸爸最准 12/21 21:49
145F:推 chaohsiung : O1 就已经看的懂图了。一堆没在用的以为ai还停留在g 12/21 21:50
146F:→ chaohsiung : pt3.5的时代 12/21 21:50
147F:推 bj45566 : 不要只会嘴,秀一段 o1 能看懂有深度的数学几何题 12/21 21:55
148F:→ bj45566 : 目并解答的影片出来啊 12/21 21:55
149F:嘘 bj45566 : 才刚看到一个在 Google 工作过的软体工程师拍影片 12/21 22:01
150F:→ bj45566 : 让 OpenAI o1 解台湾指考题目时说 o1 没办法直接吃 12/21 22:01
151F:→ bj45566 : 题目中的几何图形 12/21 22:01
152F:嘘 bj45566 : 看来 PTT 键盘侠比 Google 软体工程师更懂怎麽运用 12/21 22:03
153F:→ bj45566 : 生成式 AI,嘻嘻 12/21 22:03
154F:嘘 bj45566 : 再强调一次,不能用手机或电脑镜头扫瞄数学试卷就 12/21 22:11
155F:→ bj45566 : 给出解答的 AI 连 AGI 的最低门槛「整合感官与思考 12/21 22:11
156F:→ bj45566 : 推理」都过不了关啦 12/21 22:11
157F:→ bj45566 : 人类智慧最基本的功能就是在看一道数学试题时能正确 12/21 22:20
158F:→ bj45566 : 分辨那些影像该被解读成文字说明、那些影像该被解 12/21 22:20
159F:→ bj45566 : 读成符号数学式、那些影像该被解读成具有特定特徵(e 12/21 22:20
160F:→ bj45566 : .g., 座标轴、平行线、椭圆,...)的几何图案 12/21 22:20
161F:推 tsubasawolfy: 你说的是两个月前刚开放o1还没开放pro那时候吧 12/21 22:22
162F:→ tsubasawolfy: 那时候还没开200美去输入图片 12/21 22:22
163F:推 bj45566 : 不是输入图片,上面说了 AGI 的最低门槛是整合感官 12/21 22:31
164F:→ bj45566 : 与思考推理 -- 就问有没有人能秀一段影片证实 OpenA 12/21 22:31
165F:→ bj45566 : I 能用镜头扫瞄实体的数学试卷就直接算出解答?尤 12/21 22:31
166F:→ bj45566 : 其是包含几何图案的数学问题 12/21 22:31
167F:推 tsubasawolfy: 你说的指考那影片是当初还没开放影像输入功能的限制 12/21 22:32
168F:→ bj45566 : 如果连这都办不到就不要吹什麽 AGI 12/21 22:32
169F:→ tsubasawolfy: 我看到那影片下面 三天前有人要他用PRO再测一次 12/21 22:32
170F:→ bj45566 : 就请你拿出反驳的影片啊,那麽难吗??? 12/21 22:33
171F:→ tsubasawolfy: 不过这边有人拿ARC的测试图喂o1 pro 12/21 22:33
173F:→ bj45566 : 而且我说的指考试题解答,连不含图片的题目本身都 12/21 22:34
174F:→ bj45566 : 还要依靠人类手动输入给 o1 12/21 22:34
175F:→ tsubasawolfy: 看起来那个ARC 30%(o1)都有点怀疑了 12/21 22:35
176F:→ tsubasawolfy: 24:40那边他开始测试 12/21 22:36
178F:→ tsubasawolfy: 没开放的功能当然没办法测 7:31那边有说 12/21 22:36
179F:嘘 bj45566 : 你给的影片和我要求的基本人脑能力压根没关系 12/21 22:38
180F:推 tsubasawolfy: 如果瞎子可以看数学考卷的图并算出来就叫神了 12/21 22:41
181F:嘘 bj45566 : 你给的影片是做 ARC-1 level 的图形推理,根本不是 12/21 22:41
182F:→ bj45566 : 扫瞄一个几何问题後给出解答 12/21 22:41
183F:→ tsubasawolfy: ARC那个代表Pro开放图片输入了 这样才可以达成你说 12/21 22:42
184F:→ tsubasawolfy: 的看考卷的功能 12/21 22:42
185F:→ bj45566 : 问题 AI 并不是瞎子,电脑视觉科技都发展多远了?! 12/21 22:42
186F:→ tsubasawolfy: 所以数学考卷那题看那个Roger会不会拿Pro玩吧 12/21 22:43
187F:→ bj45566 : 再继续胡扯吧 =.= 12/21 22:43
188F:嘘 bj45566 : 就说解答指考试题时就算是没有图案的题目都得靠人 12/21 22:45
189F:→ bj45566 : 类输入题目内容 12/21 22:45
190F:推 guanting886 : ㄟ…. 别花时间吵一个未来可以解决的事 毫无意义 12/21 22:47
191F:→ guanting886 : 白生气的 反正科技巨头会自己解决 12/21 22:47
192F:推 tsubasawolfy: 他当时就没开放影片或图像输入 不靠人输入文字不然 12/21 22:47
193F:→ tsubasawolfy: 要怎样输入? 12/21 22:48
194F:→ guanting886 : 时间早晚而已 12/21 22:48
195F:→ lavign : openAI在吃transformer架构的老本,deepMind一直在 12/21 22:48
196F:→ lavign : 研究新架构 12/21 22:48
197F:嘘 bj45566 : ARC 那边则是靠人类输入电脑能理解的几何结构,而 12/21 22:48
198F:→ bj45566 : 不是只靠眼睛(镜头)扫描就能分辨出并特徵化题目中 12/21 22:48
199F:→ bj45566 : 的几何图案 12/21 22:48
200F:→ tsubasawolfy: ARC那一个他在直播内是直接贴图要答案 只是第一次给 12/21 22:49
201F:→ tsubasawolfy: 的答案不对 所以他想说是不是要说明 但第二次测试 12/21 22:50
202F:→ tsubasawolfy: 没跑完就被斗内的新问题拉走了 12/21 22:50
203F:嘘 bj45566 : 要说几遍???现在连 o3 都公布了,你就找出一段 O 12/21 22:50
204F:→ bj45566 : penAI 光靠镜头扫瞄一道几何题目就能自动解答的影 12/21 22:50
205F:→ bj45566 : 片啊!有那麽那麽难吗??? 12/21 22:50
206F:嘘 bj45566 : 再稍微看一下你贴的 ARC-1 test -- 笑死!结果是 AI 12/21 23:03
207F:→ bj45566 : 连超级简单的图案题目都答错 -- 而且甚至不懂得把( 12/21 23:03
208F:→ bj45566 : 错误的)答案画在格子里! 12/21 23:03
209F:嘘 bj45566 : 那只证明了 o1 连「只有几何图案本身」的超级简单 12/21 23:07
210F:→ bj45566 : 问题都无法回答,而且只能很粗略地理解几何图案, 12/21 23:07
211F:→ bj45566 : 所以它完全无法把格子涂好 12/21 23:07
213F:→ tsubasawolfy: 因为YT搜出来的o1 pro数学测试还真的复制贴上 12/21 23:11
214F:→ tsubasawolfy: 这一个里面有把几何图形跟题目同时贴给o1 pro 但还 12/21 23:12
215F:→ tsubasawolfy: 是答错 他後面的数学题一样是用复制贴上 12/21 23:12
216F:推 bj45566 : 这还是只把要处理的几何图案直接贴给 o1 Pro 的结果 12/21 23:13
217F:→ bj45566 : ,如果几何图案是嵌在整个题目里而且 non-trivial, 12/21 23:13
218F:→ bj45566 : 我完全无法想像 OpenAI 要怎麽把几何图案切割出来 12/21 23:13
219F:→ bj45566 : 而且正确理解它的几何意义 12/21 23:13
220F:→ tsubasawolfy: 不过分数还是在前1~2% 12/21 23:13
221F:→ tsubasawolfy: 这看起来比较像影像辨识它们要去怎样精进了 文字OK 12/21 23:14
222F:→ tsubasawolfy: 但影像就拆不出来 12/21 23:14
223F:→ tsubasawolfy: o1在Arc的测试在OPENAI提供的图 是落在25-32%正确率 12/21 23:16
224F:→ tsubasawolfy: 区间 但从那个只贴图没有指示的结果看来有点怀疑 12/21 23:16
225F:推 bj45566 : 所以 OpenAI 还是无法正确解答啊!而且原档是 pdf - 12/21 23:22
226F:→ bj45566 : - 这让 OpenAI 跳过了分辨哪部分内容是文字/符号, 12/21 23:22
227F:→ bj45566 : 哪部分内容是几乎图案的重大挑战耶 12/21 23:22
228F:推 bj45566 : 这难度和直接请 AI 用镜头看题目并先能正确切割出 12/21 23:25
229F:→ bj45566 : 文字叙述、符号数字、几何图案(并理解各种几何特徵) 12/21 23:25
230F:→ bj45566 : 相差很远耶! 12/21 23:25
232F:→ tsubasawolfy: 他用手机镜头去辨识比较难的数学题 看起来影像辨识 12/21 23:52
233F:→ tsubasawolfy: 在拆特殊符号时候会认不到 12/21 23:53
234F:→ JuiFu617 : 前面到底在争执agi的定义完全不需要,只要能提升人 12/21 23:56
235F:→ JuiFu617 : 类能力上限就够了,人作为意识源,AI作为能力放大 12/21 23:56
236F:→ JuiFu617 : 器。 12/21 23:56
237F:→ fairyofmoon : 要被淘汰了吧 都快2025还在生成一些玩具干什麽 12/22 00:06
238F:推 bj45566 : 我在猜那些让 o3 解答的数学题目是不是都先改写成 L 12/22 00:10
239F:→ bj45566 : aTeX 格式,包括题目里所有的图表和几何图案?因为 12/22 00:10
240F:→ bj45566 : 这是现今生成式 AI 最方便理解的格式 12/22 00:10
241F:推 bj45566 : 不过抛开某些____无谓又无聊的 AGI 执着,OpenAI o3 12/22 00:13
242F:→ bj45566 : 在解答数学和程式编写上的进步让人印象很深刻 12/22 00:13
243F:→ bj45566 : @tsubasawolfy:感谢你一直提供具参考价值的影片 12/22 00:14
244F:推 bj45566 : 还好我过几年就打算退休了,生成式 AI 这两年进步得 12/22 00:16
245F:→ bj45566 : 让人瞠目结舌 12/22 00:16
246F:推 imba789 : 训练超级耗电 12/22 00:53
247F:→ jcaosola : 全台湾现下只有3个id 能在codecforces 拿到 12/22 01:29
248F:→ jcaosola : rating 2700, o3有2727金变态 12/22 01:29
250F:推 seemoon2000 : 之前openai本来就没领先很多 所以之前内斗才白痴啊 12/22 01:52
251F:→ yunf : 他强的就是逻辑能力但是你叫他写东西出来就是没有 12/22 01:52
252F:→ yunf : 好作品 12/22 01:52
253F:→ yunf : 跟你说他们根本就是一个熔炉而已 12/22 01:53
254F:→ seemoon2000 : 之前假道德担心自家可能开发出危险的AI 但却忘了 12/22 01:53
255F:→ seemoon2000 : 自己并没有领先Meta和google多少 这发展很正常 12/22 01:53
256F:→ yunf : 因为台湾从来没看过这东西所以觉得很新奇 12/22 01:56
258F:→ yunf : 不知道你们有没有看过这个 12/22 01:58
259F:→ yunf : 洋玩意 12/22 01:59
260F:→ yunf : 後面代表的是西方的圣火 12/22 02:00
261F:→ yunf : 每几百年就会来侵袭一次 12/22 02:01