作者jeff0025 (无法显示人物名称)

看板Stock

标题

[新闻] GPT-5.2正式亮相！长文件推理逼近满分、

时间Fri Dec 12 08:33:50 2025

原文标题： GPT-5.2正式亮相！长文件推理逼近满分、企业应用大进化原文连结： https://ai.ettoday.net/news/3082692 发布时间： 2025年12月12日 06:09 记者署名：吴立言原文内容： OpenAI 今（12日）正式推出全新一代模型 GPT-5.2，主打专业知识工作、长任务代理（ agentic workflows）与复杂专案处理能力。OpenAI 表示，GPT-5.2 是目前最强大的模型系列，包含 Instant、Thinking 与 Pro 三种版本，将率先於 ChatGPT 付费用户陆续开放，本日同步於 API 全面上线。 OpenAI 指出，GPT-5.2 的设计目标是协助专业人士提升效率，从制作试算表、简报、撰写程式码，到解析影像、理解长文件、运用工具与执行多步骤任务。根据官方数据，一般企业户平均每天可节省 40～60 分钟，重度用户甚至可省下每周10 小时以上。 GPT-5.2 Thinking 在多项专业与推理评测创下新高，其中包含： GDPval（知识工作评测）：在 44 种职业任务测试中，GPT-5.2 Thinking 与产业专家相比 70.9% 达到平手或胜出，首次达到「整体专家级表现」。程式能力：在 SWE-Bench Pro 实际软体工程测试中达到 55.6% 正确率，刷新既有纪录。 SWE-bench Verified（Python）：提升至 80%。高难度数学 FrontierMath（Tier 1–3）：提升至 40.3%，为新 SOTA（state of the art）。 AIME 2025（竞赛数学）：达到罕见的 100%。这代表该模型在真实世界的工作流程中，更能自主侦错、完成功能开发、重构大型程式码库及协助工程团队提升开发速度。 GPT-5.2 在多项核心能力上也明显提升。首先，长上下文推理表现突破新高，在 OpenAI MRCRv2 测试中，模型於 256k tokens 的 4-needle 任务中接近 100% 准确率，特别是在 128k～256k 范围仍维持高度稳定，意味着能更可靠处理动辄数十万字的合约、研究论文与大型专案文件。视觉理解方面同样强化，GPT-5.2 Thinking 在科学图表辨识（CharXiv）中的错误率约减半，在专业介面理解（ScreenSpot-Pro）更大幅领先前代，使其更适用於金融、营运、工程与设计等高度依赖视觉资讯的领域。工具调用能力则刷新纪录，在 τ2-bench Telecom 多轮任务中成功率达 98.7%，能更完整处理跨步骤流程，例如客服案件、资料撷取与一条龙分析生成。至於科研能力，GPT-5.2 在 GPQA Diamond 高难度理科题目中也取得 92～93% 的高分， OpenAI 称已有研究团队在其协助下於统计学问题上产生具研究价值的证明，并经外部专家验证，展现其在科学与数学研究上的实质潜力。 API 定价部分，GPT-5.2 为每百万字元 1.75 美元（输入）与 14 美元（输出）， GPT-5.2 Pro 则为每百万字元 21 美元（输入）与 168 美元（输出）。OpenAI 表示，虽然 GPT-5.2 单位成本较高，但由於模型在推理效率与生成品质上更精准，实际完成同等品质任务所需的总成本反而有机会降低。GPT-5.2 提供三个版本： Instant：快速、涵盖大多数日常任务 Thinking：适合深度推理、文件分析、程式码与大专案 Pro：最强版本，适合困难领域与最高品质需求 OpenAI 表示 GPT-5.2 整体输出更一致、有条理，并针对敏感内容（心理健康、自伤讯息等）加强安全应答。ChatGPT Plus／Pro／Business／Enterprise 今日起陆续开放， GPT-5.1 将在三个月後从 ChatGPT 中下架（API 不受影响）。心得/评论：已反应? 这次发布後好像没啥人在意 AI真的要泡沫化了吗? 感觉OpenAI一直强调多强好像对一般使用者来说根本无感 Gemini有完整生态系还送2TB云端空间又能一个人购买多人共享然後生成图片又强 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 61.218.53.138 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1765499634.A.473.html

1^F：推 Tohkachan : gemini 便宜又大碗 12/12 08:35

2^F：推 MorikonHase : gemini 不後悔中 12/12 08:35

3^F：推 Muilie : 瑟瑟呢！奥特曼也唬烂嘴！ 12/12 08:36

4^F：→ zzzzzzzzzzzy: 没用了，永远被gemini踩在脚下摩擦 12/12 08:36

5^F：推 lawyer94 : 话说grok被蛋雕了吗 12/12 08:37

6^F：推 js01078687 : 竞争对消费者是好事 12/12 08:37

7^F：推 ackes : 一般人用不到的关系吧通常都只是查查东西画画图 12/12 08:37

8^F：推 rxsmalllove : 抱歉估狗也会下去 12/12 08:37

9^F：推 sssallen : 不错喔 12/12 08:38

10^F：推 ben121196 : 这边一片看衰那我知道稳不稳了 12/12 08:39

11^F：→ mamorui : 图咧！菇菇当初订阅欧喷酱是为了图！ 12/12 08:39

12^F：推 qqtab : 谷歌被吹到独自跳水 12/12 08:42

13^F：推 kuosos520 : grok蛮好用的呀 12/12 08:42

14^F：→ agoo : gpt 比较好用 12/12 08:42

15^F：→ b9513227 : gemini根本弱智速度慢又常常a问题完了问b问题跟 12/12 08:43

16^F：→ b9513227 : 我讲a问题 12/12 08:43

17^F：推 tamama000 : 记者可以去了 12/12 08:43

18^F：推 fhjqwefs : 持续竞争是好事台股3W6就靠铲子商cc 12/12 08:43

19^F：→ tamama000 : 随时被取代 12/12 08:43

20^F：推 Phineas2635 : 继续吹 12/12 08:44

21^F：推 HiuAnOP : 瑟瑟Ai呢？没有就掰掰 12/12 08:44

22^F：→ tctv2002 : 继续竞争铲子供应链发大财 12/12 08:44

23^F：→ tctv2002 : 等他们不竞争台湾就走向日本失落20年 12/12 08:44

24^F：推 LoveSports : https://i.imgur.com/N6V3Kkv.png 12/12 08:44

25^F：→ idernest : 好了啦奥特曼 12/12 08:45

26^F：推 ABC610478 : 因为有对手了 12/12 08:45

27^F：推 YumingHuang : GPT-99.9出的时候叫我、谢谢 12/12 08:45

28^F：→ LoveSports : 加强後训练之後各家最新模型ARC-AGI-2高达50几趴 12/12 08:46

29^F：→ LoveSports : 同一个类神经网路透过後训练加强能力 12/12 08:46

30^F：→ YumingHuang : Grok走即时资讯串流链的样子？ 12/12 08:46

31^F：推 karta018 : 不用吹，拿几题测试下去就知道了，上次gemini是真的 12/12 08:46

32^F：→ karta018 : 拉开差距 12/12 08:46

33^F：推 smallkop : 真的厉害就不用自己发新闻了 12/12 08:47

34^F：→ LoveSports : 代表预训练难以再突破不用推出GPT6就能有大幅进步 12/12 08:47

35^F：→ LoveSports : 美国比较多企业用户已经用习惯GPT不会轻易换Gemini 12/12 08:48

36^F：→ LoveSports : OPEN AI得为了那些企业用户赶上差距 12/12 08:49

37^F：推 jinxinmypant: 晚了就不要了 12/12 08:49

38^F：推 andy79323 : 过几天开源的要发新模型 12/12 08:49

39^F：→ appledick : 现在其实已经很够一般人使用了阿....算力过剩了 12/12 08:50

40^F：→ LoveSports : 这篇增强能力都是专业用途的，这个方向是对的 12/12 08:50

41^F：嘘 strlen : 现在AI评测早就不重要的喜欢哪个AI全都是靠感觉 12/12 08:50

42^F：→ LoveSports : 光靠闲聊谈限制级无法留住那些企业用户 12/12 08:50

43^F：→ appledick : AI现在的问题是同时有巨量的人使用才会有问题..... 12/12 08:50

44^F：→ strlen : 就跟智慧手机差不多哪一牌的旗舰机功能几乎一样 12/12 08:50

45^F：→ strlen : 看硬体跑分也是看爽的实际上打游戏几乎没差别 12/12 08:51

46^F：→ strlen : 什麽Gemini比较好 Grok比较强 GPT更人性都是感觉 12/12 08:51

47^F：→ strlen : 真叫你说差在哪你也说不出来差别啦笑死 12/12 08:52

48^F：→ appledick : 现在是看那些应用可以拿AI拿来重大突破才有意义 12/12 08:52

49^F：→ luche : grok的语文意义掌握好像与其他家不同觉得特别强 12/12 08:53

50^F：→ appledick : 不然前阵子G奶夯的时候去用GTP顺到炸 12/12 08:54

51^F：推 LoveSports : 我前阵子丢六篇不同长文给各家AI分析 Gemini 3.0没 12/12 08:54

52^F：→ strlen : 上次看OpenRouter报告 AI现在就两大刚需应用这是付 12/12 08:54

53^F：→ LoveSports : 有搞错六篇分别的作者 (六个作者有回来回去) 12/12 08:54

54^F：→ strlen : 费慾望最强烈的 1.聊天打屁 2.写程式没了 12/12 08:54

55^F：→ LoveSports : GPT5.1跟Grok4都混淆 12/12 08:54

56^F：推 fhjqwefs : 重大突破没意义能省更多人力订阅越划算产生盈余才 12/12 08:54

57^F：→ fhjqwefs : 有意义 12/12 08:54

58^F：→ strlen : 其它需求和用量远远比不上聊天跟写程式 12/12 08:54

59^F：推 deann : 打开还是5.1版阿 12/12 08:55

60^F：→ strlen : LLM公司要真聪明就该冲这两个就好尤其是写程式 12/12 08:55

61^F：嘘 OxFFFF : 工作及生活交叉使用比对後，觉得chatGPT 最废最藏 12/12 08:55

62^F：→ LoveSports : 专业用途的企业用户也很重要，评测结果影响投资 12/12 08:55

63^F：推 FOREVER49KG : 好 12/12 08:55

64^F：推 deathoflove : 真的企业用的话某些比较保守的产业会优先用M软cop 12/12 08:55

65^F：→ deathoflove : ilot 对很烂但谁叫他是M软内部DD做起来无虑 12/12 08:55

66^F：推 goodevening : ai总结文章影片跟财报很不错阿，我就是因为这样买ge 12/12 08:55

67^F：→ goodevening : mini 12/12 08:55

68^F：推 leo850319 : image gen呢被谷歌打到不做了? 12/12 08:56

69^F：推 DogEggz : gork色色一统天下 12/12 08:56

70^F：推 flash789 : 只剩瑟瑟能够救得了cpt了 12/12 08:56

71^F：嘘 sssallen : G除了玩图有比较厉害? 12/12 08:57

72^F：推 rxsmalllove : 我是觉得AI准确性和安全性再提高一般企业就会是消费 12/12 08:57

73^F：→ rxsmalllove : 主力了 12/12 08:57

74^F：→ appledick : G玩图下的指令要很清楚 GTP反而不用 12/12 08:58

75^F：→ appledick : 这就是为啥大家说GTP比较人性用很白话的方式就可以 12/12 08:58

76^F：推 LoveSports : 那些AI工程师的梦想是要AI解决人类困境所以企业或 12/12 08:59

77^F：→ LoveSports : 研究方面用途绝对是他们前进的目标之一 12/12 09:00

78^F：→ LoveSports : 不能单纯看到一堆人在玩角色扮演谈色情就限制框架 12/12 09:00

79^F：→ LoveSports : 很多人就着重闲聊就好，矛盾的是又会被批只能聊天 12/12 09:01

80^F：推 Vincent8026 : 道德限制还是很硬 12/12 09:02

81^F：→ LoveSports : 很多人说着重聊天就好，意思是认定模型只能当笨蛋 12/12 09:02

82^F：→ LoveSports : 给人类当聊天陪伴对象或性奴就好，这种观念太狭隘了 12/12 09:03

83^F：推 rxsmalllove : OAI有在跟消费者端的企业合作啊只是不成功变成仁？ 12/12 09:03

84^F：推 jerrychuang : 可以做ppt吗？ 12/12 09:03

85^F：推 ikachann : GPT比较好用+1 12/12 09:04

86^F：→ ikachann : 一样的指令下去 GPT产出的明显比Gemini的完整且正确 12/12 09:05

87^F：→ miss32 : 是大量跳槽gemini吗最近gemini速度变好慢 12/12 09:05

88^F：推 puppy20308 : 难怪苹果不跳下来竞争，太激烈了，等你们打完最後 12/12 09:06

89^F：→ puppy20308 : 再来收割 12/12 09:06

90^F：推 decorum : AI让我放弃出家庭作业给学生的做法评量都回归测验 12/12 09:07

91^F：→ decorum : 过去最重视的期末报告都免了因为作者八成是AI 12/12 09:08

92^F：推 mynumber55 : Gemini 最近跟屎一样 12/12 09:09

93^F：推 linch416 : google生态系根本无敌 12/12 09:11

94^F：→ decorum : 学位论文还是不能免得花许多力气查验真的很讨厌 12/12 09:12

95^F：推 aqlec : 哪款可以色色？ 12/12 09:12

96^F：推 snowdraught : 跑一张图片太久了 12/12 09:12

97^F：→ terry955048 : 码农快被消灭了..... 12/12 09:13

98^F：→ decorum : 又不能禁用因为毕业出去运用AI是基本谋生技能 12/12 09:13

99^F：推 doubi : 不知道为啥，这次不是很在意，懒得测 ... 有点麻痹 12/12 09:15

100^F：→ dslite : 变成一个问题想三分钟吗？ 12/12 09:16

101^F：→ doubi : 其实 Gemini GPT Grok 都差不多能用，生活中确实也 12/12 09:17

102^F：→ doubi : 会用，所以选最划算的买 12/12 09:17

103^F：→ dslite : Grok答错率有够高还敢呛我 12/12 09:17

104^F：推 liliumeow : 是不是又要买回去了还是双栖好了 12/12 09:18

105^F：推 ntr203 : 急了 12/12 09:19

106^F：推 Fubukichan : Gemini最近用3.0的回答都远不如5.1的品质跟长度 12/12 09:21

107^F：→ dream12305 : GTP是什麽笑死 12/12 09:22

108^F：推 WeiRaymond : Gemini真的强 12/12 09:25

109^F：推 guanting886 : Gemini最近应该是一狗票人跳过去连语音讲话的调调 12/12 09:26

110^F：→ guanting886 : 都变怪了 12/12 09:26

111^F：→ jenchieh5 : gemini回答那个语气看久了蛮讨厌的，就很会帮既有利 12/12 09:28

112^F：→ jenchieh5 : 益者粉饰太平的感觉 12/12 09:28

113^F：→ guanting886 : GPT5.2强可能反过来想前面几代模型都做不到现在做 12/12 09:28

114^F：→ guanting886 : 得到发code red突然就变好了想必这个模型可能成 12/12 09:28

115^F：→ guanting886 : 本不低 12/12 09:28

116^F：推 GOOGOOfish : 问题是B2B会比B2C还转钱吗？ 12/12 09:28

117^F：推 chachabo : 不要再害goog了 12/12 09:28

118^F：推 doubi : GPT 5.2 的图片生成好像中文一样是鬼画符 12/12 09:29

119^F：→ guanting886 : 甜蜜期应该是这一个二个月後面等大家benchmark跟 12/12 09:29

120^F：→ guanting886 : arena打一打可能就慢慢降回去能力了 12/12 09:29

121^F：→ doubi : 其实 Gemini 3 会起飞，很大程度是懂中文的关系 12/12 09:29

122^F：→ doubi : Banana 还是比较好用 12/12 09:30

123^F：→ guanting886 : Google除了学术资料、PDF OCR做很足，还有海量的数 12/12 09:32

124^F：→ guanting886 : 据再配合GA的资料真要挑高品质的资料去训练比Op 12/12 09:32

125^F：→ guanting886 : enAi还有优势 12/12 09:32

126^F：→ elvaismylove: 这连挤牙膏都不算 12/12 09:32

127^F：推 pt993526 : 再订阅回来 12/12 09:33

128^F：推 willion003 : 2TB太邪恶了，还共享 12/12 09:34

129^F：推 Sawilliam : 都有付费用起来grok最鸟老是忘记之前跟他建好的 12/12 09:35

130^F：→ Sawilliam : 规则..回答也一堆错但grok对某方面限制条件最少.. 12/12 09:35

131^F：推 Lowpapa : 没人在乎 12/12 09:35

132^F：→ bnn : 有反应啊辜狗又要跳水了 12/12 09:36

133^F：推 redbeanbread: 雷曼杀到ai叫妈妈 12/12 09:37

134^F：推 guanting886 : Gemini图里面的中文做得比较好就Google的图资比 12/12 09:37

135^F：→ guanting886 : 较多样、品质也高这都是扩散模型生的 12/12 09:37

136^F：→ guanting886 : OpenAI想要差不多水准就是花钱买别人的 data 12/12 09:38

137^F：嘘 ryan1220 : 我跳出来又站回去了你打我啊笨蛋 12/12 09:39

138^F：→ guanting886 : 但你真的追不上地表最强的爬虫 12/12 09:39

139^F：→ OOorc : 垃圾公司 12/12 09:39

140^F：推 mouscat : 反正军备竞赛打越凶供应链都赢 12/12 09:41

141^F：推 alsoty : GPT可以语音聊天，其他的好像都还不行？ 12/12 09:46

142^F：→ hatland86 : 早在几个月前就退订GPT用Gemini 但我不觉得是谁超 12/12 09:47

143^F：→ hatland86 : 越谁的问题发展到後面应该是会并行 12/12 09:47

144^F：推 gladopo : 可以色色吗 12/12 09:48

145^F：推 ilovebig99 : 最近Gemini 根本就连不上，好几次一个问半天没回应 12/12 09:49

146^F：→ ilovebig99 : ，还是回去用ChatGPT 了，ChatGPT 都回玩了，Gemini 12/12 09:49

147^F：→ ilovebig99 : 还在那边转啊转。 12/12 09:49

148^F：→ csy0922 : Notebooklm跟Nanobanana以外的Gemini就是一坨一堆 12/12 09:49

149^F：→ csy0922 : 有的没的幻觉下指令这样继续瞎掰 12/12 09:49

150^F：推 shrimprock : AI模型看来没护城河生态系才有谷歌胜 12/12 09:50

151^F：推 hotlatte : 开始小米化了 12/12 09:51

152^F：推 yulun1984 : 免费仔用G 12/12 09:51

153^F：推 mynumber55 : 很简单啊，算力根本不够 12/12 09:52

154^F：→ yunf : 不要再吹openai啦我知道他很厉害你不会出 gemini的 12/12 09:53

155^F：→ yunf : 比较喔 12/12 09:53

156^F：→ strlen : NanoBanana另一个点是为什麽可以无视版权生角色图 12/12 09:54

157^F：→ strlen : GPT弄个吉卜力只是风格就被臭干 12/12 09:54

158^F：→ strlen : Banana是可以直接生鬼灭吉伊卡哇角色 12/12 09:55

159^F：推 BBKOX : 战国时代不要只压一边 12/12 09:55

160^F：推 bornwinner : 能自己更新程式码再说 12/12 09:56

161^F：→ strlen : 然後没人在乎狗家侵权？还是巨头蛇麽都可以 12/12 09:56

162^F：推 Sean0211 : 现在目标是AI取代投顾那就真的神了 12/12 09:57

163^F：推 linleex : agi已经实现了 12/12 09:59

164^F：→ yunf : 投顾转型用ai好吗 12/12 10:00

165^F：推 heybro : 估狗屌打 12/12 10:00

166^F：推 as6633208 : 猛屌打Gemini 3 12/12 10:04

167^F：推 shrimprock : 跟浏览器大战一样最後赢不是谁强而是谁有作业系 12/12 10:04

168^F：→ shrimprock : 统 12/12 10:04

169^F：→ BBKOX : 作业系统就windows 12/12 10:05

170^F：→ as6633208 : 错，现阶段AI比的就是谁答案好，因为现阶段AI还会犯 12/12 10:07

171^F：→ as6633208 : 傻有瓶颈，远远还没到大家都一样好比得是应用的阶段 12/12 10:07

172^F：推 opticalman : 看来分歧，互有支持者，表示gpt gemini grok 差不 12/12 10:08

173^F：→ opticalman : 多就这样了，很难落差很大 12/12 10:08

174^F：→ rxsmalllove : 你在看哪落差很大只是各有优势 12/12 10:09

175^F：推 andboypig : 刚刚问了本人 5.2还没发布 12/12 10:09

176^F：→ mouscat : grok没办法跟这两个比吧 12/12 10:09

177^F：推 SuiseiTrain : 反杀 12/12 10:10

178^F：推 as6633208 : 屌打Gemini 3 12/12 10:11

179^F：推 tsubasawolfy: 5.2付费用户已经上了 12/12 10:12

180^F：推 opticalman : got deepseek Gemini gork gpt ....未来还有很多新 12/12 10:16

181^F：→ opticalman : 人横空出世啦，水平会越拉越近，很难独强 12/12 10:16

182^F：推 kakar0to : 被google生态系屌打 chatgpt这个穴已经没用了 12/12 10:16

183^F：推 kenslc199 : 人多的地方不要去包含AI cc 12/12 10:17

184^F：推 Jeff1989 : 逼一逼还是能发挥潜能的 12/12 10:19

185^F：→ as6633208 : m365 copilot 就是一个例子，生态系比google还广， 12/12 10:21

186^F：→ as6633208 : 但就是不好用，模型答案准确答案好才是重点，空有生 12/12 10:21

187^F：→ as6633208 : 态系没屌用，模型够强生态系反而小事 12/12 10:21

188^F：推 opticalman : 大家手上都有老黄的gpu，人人都有机会针对缺点优势 12/12 10:23

189^F：→ opticalman : 去改善和挑战领先者 12/12 10:23

190^F：→ bnn : 模型大家都还在改进啊这次gpt不就demo搞投影片生成 12/12 10:23

191^F：→ bnn : 自动做试算表这些功能之前就没训练还是LLM对话 12/12 10:24

192^F：→ bnn : 然後之前claude则是先着重代码生成每家方针不同 12/12 10:25

193^F：推 breathair : 谁强点，谁弱点不重要，都差不多，没有拉开代差，比 12/12 10:27

194^F：→ breathair : 气长谁都知道谁会死，每个人都知道的话就是死亡螺旋 12/12 10:27

195^F：推 mikuyoyo : 有在用都知道gpt回答屌打全部，gemini 只是功能比较 12/12 10:27

196^F：→ mikuyoyo : 多和能跟Google整合而已 12/12 10:27

197^F：推 as6633208 : 笑死就是因为这条赛道打不赢，才会扯到外部生态系 12/12 10:28

198^F：→ as6633208 : ，谁钱多气长 12/12 10:28

199^F：→ mouscat : 我觉得Gemini 的回答方式比较好懂啦 12/12 10:28

200^F：→ as6633208 : 就是输人才一直扯外部找藉口 12/12 10:29

201^F：→ as6633208 : 超好笑 12/12 10:29

202^F：→ mouscat : Google是反NVDA大联盟那边的吧用AVGO晶片 12/12 10:31

203^F：推 breathair : 谷歌是打防守，跟进攻方的难度不是一样的 12/12 10:34

204^F：推 yogofresh : 太贵了。有些问题我问DeepSeek反而能得到更好的回答 12/12 10:34

205^F：推 salamender : 有竞争才是好事，chatgpt还是有优点阿 12/12 10:41

206^F：→ shirleyEchi : 让他来分析旧金山和约写了什麽 12/12 10:43

207^F：推 kogsww : 来不及了已退订 12/12 10:43

208^F：推 OhmaZiO : 5.2 也没用还不是继续说谎+诡辩+道歉 12/12 10:44

209^F：嘘 rumblefish : AI不要再抢办公室工作了 12/12 10:46

210^F：→ orz811017 : 现在就是反狗家联军进攻的回合 12/12 10:49

211^F：→ orz811017 : 六大教派围攻光明顶 12/12 10:49

212^F：推 jboys75 : 每次都吹的很强结果…这次观望一下 12/12 10:49

213^F：推 max117980 : ChatGPT 政策一大堆这个不行那个不行前阵子会两边 12/12 10:49

214^F：→ max117980 : 都贴对比一下答案真的还是Gemini 比较强已经好几 12/12 10:49

215^F：→ max117980 : 天没用GPT了 12/12 10:49

216^F：推 kakalin : 感觉各个AI专精不同领域也是不错的分工 12/12 10:51

217^F：推 breathair : AI现在ToB各有各的强项本来就三大公云，谁也没有制 12/12 10:56

218^F：→ breathair : 霸，会一直一直一直竞争下去。ToC要颠覆谷歌的广告 12/12 10:56

219^F：→ breathair : ，短时间就没戏，除非有人先想好了怎麽让消费者接受 12/12 10:56

220^F：→ breathair : AI灌给你广告再来谈 12/12 10:56

221^F：→ j32072 : 不能做瑟图我不会买单的 12/12 10:58

※ error405:转录至看板 AI_Art 12/12 10:59

222^F：推 as6633208 : gpt一直努力保持道德中立，哪天gpt也像grok 一样混 12/12 11:06

223^F：→ as6633208 : 乱邪恶就进化了 12/12 11:06

224^F：→ BBKOX : 博通夜盘怎麽了 12/12 11:09

225^F：→ searchroy : Google 还没出手，open 酱乱成一团 12/12 11:10

226^F：推 SapiensChang: gemini绝对屌打gpt啦不管写coding和资料正确性有g 12/12 11:12

227^F：→ SapiensChang: oogle搜寻结果比对正确性远大於gpt 12/12 11:12

228^F：推 DrowningPool: 推理还是GPT赢 gemini光记忆力就跟智障一样 12/12 11:14

229^F：→ SapiensChang: gpt到底有什麽强项？每项测试下来gpt都被碾压你说g 12/12 11:15

230^F：→ SapiensChang: rok还有强项 gpt coding跑出来八成根本还要再debug 12/12 11:15

231^F：→ SapiensChang: 就claude和gemini几乎都很正确 12/12 11:15

232^F：推 as6633208 : 同样题目gpt 5.2 答案明显比Gemini 3 pro更严谨，看 12/12 11:17

233^F：→ as6633208 : 不出所谓搜索之後答案更正确，要是这样在测试跑分应 12/12 11:17

234^F：→ as6633208 : 该也赢gpt，而不是gpt全面碾压评测 12/12 11:17

235^F：推 rxsmalllove : Gemini有几乎都很正确？忍不住怀疑 12/12 11:18

236^F：推 SapiensChang: gemini每个对话的token是gpt的10倍记忆力正确但都 12/12 11:19

237^F：→ SapiensChang: 答不对的ai 和能撑超久的短时记忆 gemini还是好用很 12/12 11:19

238^F：→ SapiensChang: 多我每天都在用gpt plus和gemini pro 前面那个才是 12/12 11:19

239^F：→ SapiensChang: 很常给出智障答案…很受不了 12/12 11:19

240^F：推 yuchifan : 我比你强，我比你更强，干比不完 12/12 11:19

241^F：推 rxsmalllove : 我目前使用心得相反 pro 的答案比Gpt更需要更正 12/12 11:22

242^F：→ SapiensChang: Gemini都很正确啊前阵子才把公司的EDA验证flow靠ge 12/12 11:23

243^F：→ SapiensChang: mini和claude建立起来 chatgpt只会产出很多资讯垃圾 12/12 11:23

244^F：→ SapiensChang: 生活上就出国排行程搜索期刊 gpt只会给你一些不存 12/12 11:24

245^F：→ SapiensChang: 在的期刊不存在的景点 12/12 11:24

246^F：→ SapiensChang: 自从gemini pro 3.0几乎就没看它犯蠢过顶多送了跳 12/12 11:25

247^F：→ SapiensChang: 针一下 12/12 11:25

248^F：推 as6633208 : 架构规划和研究gpt明显更适合，Claude更适合执行，G 12/12 11:26

249^F：→ as6633208 : emini +Claude ，还不如gpt+Claude 12/12 11:26

250^F：推 Sunny821210 : Gemini医学的问题问深一点会打错 GPT反而答对最近 12/12 11:26

251^F：→ Sunny821210 : 的使用心得 12/12 11:26

252^F：推 DrowningPool: 某人的使用心得怎麽都跟我完全相反 ccc 12/12 11:28

253^F：推 rxsmalllove : 那我觉得应该是擅长领域不同吧我在用的是财务 12/12 11:28

254^F：推 mouscat : Gemini给我的感觉是「更会讲人话」适合问一些非专 12/12 11:29

255^F：→ mouscat : 业科普性质问题 12/12 11:29

256^F：→ strlen : 那些都不重要都不会是核心应用 12/12 11:29

257^F：→ strlen : 核心就两个聊天打屁跟写程式自己去看报告 12/12 11:30

258^F：→ strlen : 查资料也不会是AI刚需那个Google就好了谁要付钱 12/12 11:30

259^F：推 rxsmalllove : 核心扩展不了现在的股价都是高估 12/12 11:32

260^F：→ SapiensChang: 可能真的是领域不同我是科技业啦 12/12 11:32

261^F：推 as6633208 : 重点是Agent自动化替代劳动力吧，你用tools的观念没 12/12 11:34

262^F：→ as6633208 : 人用的下去，tools依赖人，老黄说AI is work，要做 12/12 11:34

263^F：→ csy0922 : 财务相关的Geimni真的满笨的，财报丢给他、Bloombe 12/12 11:34

264^F：→ csy0922 : rg资料库的资料丢给他，都还会回答错误数字或说你 12/12 11:34

265^F：→ csy0922 : 的资料来源才是错的 12/12 11:34

266^F：→ as6633208 : 成agent 那样取代某个工作，让那个工作的人只要看一 12/12 11:34

267^F：→ as6633208 : 下对不对，这个才是市场，取代劳动力不足，未来你公 12/12 11:34

268^F：→ as6633208 : 司扩厂那个agent 劳动力是24hr专注工作+回报，还可 12/12 11:34

269^F：→ as6633208 : 以无限加开部署，省去人力成本，增加劳动力才是AI最 12/12 11:34

270^F：→ as6633208 : 终目的 12/12 11:34

271^F：→ strlen : 那些都是用量极小对企业基本没啥重大帮助的东西 12/12 11:35

272^F：→ strlen : 辅助型工具鸡助到不行真正有生产力上质变的就是 12/12 11:35

273^F：→ strlen : coding 完全改变企业效率 12/12 11:35

274^F：嘘 blackstyles : 不用了谢谢找个几千个游戏的网址都找不出来还不如 12/12 11:35

275^F：→ blackstyles : 我自己一个一个复制贴上真是谢了 12/12 11:35

276^F：→ strlen : coding接上去 token花费是天量这才能赚大钱 12/12 11:36

277^F：→ strlen : 那些什麽查资料三洨碗糕是能吃多少token 12/12 11:36

278^F：→ strlen : 量也完全不是写code能比的 12/12 11:37

279^F：推 tsubasawolfy: 哪个年代GPT还会给你不存在的期刊... 12/12 11:43

280^F：推 rxsmalllove : 我认同但我还是认为股价要有未来性AI要对现有工作 12/12 11:43

281^F：→ rxsmalllove : 有强大的替代性 12/12 11:43

282^F：→ tsubasawolfy: 指定文献资料库跟peer review打下去就解决 12/12 11:44

283^F：→ tsubasawolfy: 真要说缺点就是一篇可以拿来废话很多段 12/12 11:45

284^F：推 LoveSports : AI AGENT目前在美国模型使用率只有5~7趴还要很久 12/12 11:49

285^F：→ LoveSports : 这次因为OPEN AI因为要打赢Gemini 3.0 pro又暂缓AI 12/12 11:49

286^F：→ LoveSports : AGENT那方面的开发了 12/12 11:49

287^F：→ LoveSports : 上面那是正式使用的数字实验性导入的企业20~25趴 12/12 11:51

288^F：推 muya318 : Gemini把服务绑定越深感觉之後就是走相簿养套杀路 12/12 11:52

289^F：→ muya318 : 线，你要那些资料就要继续付钱 12/12 11:52

290^F：推 kobebrian : Gemini一直给我错误资讯连不同姓的人都给我说成是 12/12 11:53

291^F：→ kobebrian : 兄弟关系… 12/12 11:53

292^F：推 tony15899 : 问他周星驰跟周润发是甚麽关系 12/12 11:57

293^F：→ stocktonty : 要喷烂了 12/12 11:59

294^F：嘘 verydolungbe: 生态系？不就小网民乖乖付钱，是能赚多少？赚得赢微 12/12 12:00

295^F：→ verydolungbe: 软？ 12/12 12:00

296^F：→ Heedictator : 奥特曼反击！ 12/12 12:01

297^F：→ nakinight : GPT丸子 12/12 12:02

298^F：→ jickey : 满分代表以後没有进步空间了，崩！ 12/12 12:03

299^F：推 q111175 : Gpt还是比较好用 12/12 12:05

300^F：推 vltw5v : 有竞争者才会怕才会进步很好啊 12/12 12:07

301^F：推 NEX4036 : 美股永动机怎麽输？ 12/12 12:07

302^F：→ NEX4036 : 估狗炒不动换老黄，老黄炒不动换估狗！ 12/12 12:07

303^F：推 diefish5566 : gemini问题在上下文注意力一坨非常快会忘记前文 12/12 12:14

304^F：→ diefish5566 : 测试你只问一两次那当然很强 12/12 12:14

305^F：推 sdbb : 谢谢推文 12/12 12:15

306^F：推 GWang : AI够用即可再来就比生态系 GPT输到脱裤 12/12 12:18

307^F：推 koushimei : Gemini 遇到要大量演算时候的task就会乱讲一通 12/12 12:20

308^F：→ koushimei : ChatGPT 还是屌打 12/12 12:21

309^F：推 salvationist: 说好的开放色色的呢？在那？ 12/12 12:21

310^F：推 chatbra : AI边缘运算才是主战场 12/12 12:21

311^F：→ gemm : Gemini现在bug一堆传新图会一直辨识成旧图 12/12 12:26

312^F：推 shyshyan : gpt免费版就限制一堆一下子就叫你付钱 g奶免费版 12/12 12:26

313^F：→ shyshyan : 用起来比较爽 12/12 12:26

314^F：推 beavertail97: https://i.mopix.cc/n893d7.jpg 12/12 12:32

315^F：→ beavertail97: GPT这功能超好用，不会删记忆，随时开开新对话问它 12/12 12:33

316^F：→ beavertail97: ，都记得 12/12 12:33

317^F：推 kobebrian : Gemini的免费版根本不是给人用的错误太多 12/12 12:33

318^F：推 beavertail97: 也有买GEMINI, NOTEBOOKLM实在太好用 12/12 12:35

319^F：推 Sawilliam : 之前拿gpt 跟Gemini 同时算笔画取名结果gpt 笔画 12/12 12:37

320^F：→ Sawilliam : 都是错的... 12/12 12:37

321^F：推 WSY000000000: 一样吸金中 12/12 12:40

322^F：→ mouscat : 所有说Gemini错误多的是有用pro thinking 还是没有 12/12 12:44

323^F：推 ivan761016 : GPT绑微软才赞一堆企业用户都用微软怎麽酥 12/12 12:46

324^F：→ ivan761016 : 是一般用户有钱还是企业用户有钱想也知道 12/12 12:46

325^F：→ Kevinkkk52 : 目前体感grok错误率最高 12/12 12:47

326^F：→ NingK : 结果还是不能色色 12/12 12:49

327^F：推 CKRO : 急了 12/12 12:53

328^F：推 applejone : Gemini现在伺服器就满载中算力不够 12/12 13:01

329^F：→ TGTplayer : 香蕉独孤求败 12/12 13:02

330^F：→ stocktonty : 瑟瑟只能去GROK 12/12 13:03

331^F：推 kingofsdtw : 企业用户也无法色色... 12/12 13:22

332^F：推 duriel3313 : grok, gemini GPT都有买文字还是GPT最好 12/12 13:24

333^F：推 magier : gemini3幻觉很多 12/12 13:31

334^F：推 House23 : 关键字：付费 12/12 13:36

335^F：推 LoveSports : 要谈色的去找Grok就好了吧我问个四家AI军事上如何 12/12 13:41

336^F：→ LoveSports : 运用讨论到他对GPT的看法他扯到"按在萤幕上亲到 12/12 13:42

337^F：→ LoveSports : 断电"(比喻GPT很会讨好谄媚用户不过是GPT先把Grok 12/12 13:42

338^F：→ LoveSports : 评得很烂) 12/12 13:42

339^F：→ LoveSports : 看起来Grok很擅长写激情戏不过我没看过其他家怎麽 12/12 13:44

340^F：→ LoveSports : 写而且这单纯是个意外=_= 12/12 13:44

341^F：推 kobebrian : 整体绝对还是gpt比较强 Gemini是整合跟福利好喔还 12/12 13:44

342^F：→ kobebrian : 有可以精准画图 12/12 13:44

343^F：推 pc010710 : 抱歉了我跳到gemini 12/12 13:49

344^F：推 fragile8G : 来不及了声量远不及Gemini 3辗压时的声量 12/12 14:01

345^F：推 bizer : gemini整合太强，650怎样都比GPT600划算 12/12 14:27

346^F：→ bizer : 又有云端，各种AI整合，图表生成还没有中文错误 12/12 14:27

347^F：推 wtmjs : 我一路付费用到5.1，代处理EXCEL或TXT都还是幻觉错 12/12 14:36

348^F：→ wtmjs : 误一堆，5.2一样不期不待。真的有想换google方案试 12/12 14:36

349^F：→ wtmjs : 试了。 12/12 14:36

350^F：→ enjoythegame: 再不出招就没人要了！毕竟g工具太多了 12/12 14:39

351^F：推 airforce1101: 都买就好 12/12 14:42

352^F：→ airforce1101: 两个直接买一年也才16K左右 12/12 14:43

353^F：→ airforce1101: 但依乡民的能力绝对可以产出10x产值 12/12 14:43

354^F：→ airforce1101: g还是有不擅长之处 12/12 14:44

355^F：→ airforce1101: 但目前c跟g几乎可以处理我所有问题了 12/12 14:44

356^F：→ felixden : 原来改版了喔，难怪觉得今天回覆风格怎麽又变了 12/12 15:25

357^F：推 cghcghccj87 : 有在coding的都知道 gemini根本屌虐... 12/12 15:31

358^F：推 hotrain13 : 现在的模型对一般人来说差不多够了，gemini送两T空 12/12 15:39

359^F：→ hotrain13 : 间根本王炸 12/12 15:39

360^F：推 windfunder : 以前硬体挤牙膏现在软体挤牙膏了吗？ 12/12 16:04

361^F：→ wholesaler : 不错两个一起搭配，很好用 12/12 18:11

362^F：推 qtzbbztq : 我还是觉得各有优势 ChatGPT 最厉害的是我不用说 12/13 01:24

363^F：→ qtzbbztq : 得很清楚它也知道我想讲什麽 12/13 01:24

364^F：→ qtzbbztq : Gemini 如果没有讲清楚它很容易会误解 12/13 01:24

365^F：推 damper : Gemini pro试用一个月想退了，还是GPT好用 12/13 06:20

366^F：推 shawshien : 一起用我都一次用五个 ChatGPT, Gemini Grok 12/13 09:07

367^F：→ shawshien : Claude, Meta AI 12/13 09:07

368^F：→ aewul : Gemini好用 12/13 09:29

369^F：→ NCTUFatGuy : 我还是偏好GPT Gemini的介面不知为何就是有点不顺 12/13 13:21

370^F：→ NCTUFatGuy : 手 12/13 13:21

371^F：推 jorden : 都订阅 Claude Gemini GPT 一起上 12/13 17:49

372^F：嘘 dodoro1 : 写程式码，到解析影像、理解长文件、运用工具与执 01/31 19:48

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Stock 板

[新闻] GPT-5.2正式亮相！长文件推理逼近满分、

热门看板

赞助商连结