Stock 板


LINE

原文标题: GPT-5.2正式亮相!长文件推理逼近满分、企业应用大进化 原文连结: https://ai.ettoday.net/news/3082692 发布时间: 2025年12月12日 06:09 记者署名: 吴立言 原文内容: OpenAI 今(12日)正式推出全新一代模型 GPT-5.2,主打专业知识工作、长任务代理( agentic workflows)与复杂专案处理能力。OpenAI 表示,GPT-5.2 是目前最强大的模型 系列,包含 Instant、Thinking 与 Pro 三种版本,将率先於 ChatGPT 付费用户陆续开 放,本日同步於 API 全面上线。 OpenAI 指出,GPT-5.2 的设计目标是协助专业人士提升效率,从制作试算表、简报、撰 写程式码,到解析影像、理解长文件、运用工具与执行多步骤任务。根据官方数据,一般 企业户平均每天可节省 40~60 分钟,重度用户甚至可省下每周10 小时以上。 GPT-5.2 Thinking 在多项专业与推理评测创下新高,其中包含: GDPval(知识工作评测):在 44 种职业任务测试中,GPT-5.2 Thinking 与产业专家相 比 70.9% 达到平手或胜出,首次达到「整体专家级表现」。 程式能力:在 SWE-Bench Pro 实际软体工程测试中达到 55.6% 正确率,刷新既有纪录。 SWE-bench Verified(Python):提升至 80%。 高难度数学 FrontierMath(Tier 1–3):提升至 40.3%,为新 SOTA(state of the art)。 AIME 2025(竞赛数学):达到罕见的 100%。 这代表该模型在真实世界的工作流程中,更能自主侦错、完成功能开发、重构大型程式码 库及协助工程团队提升开发速度。 GPT-5.2 在多项核心能力上也明显提升。首先,长上下文推理表现突破新高,在 OpenAI MRCRv2 测试中,模型於 256k tokens 的 4-needle 任务中接近 100% 准确率,特别是在 128k~256k 范围仍维持高度稳定,意味着能更可靠处理动辄数十万字的合约、研究论文 与大型专案文件。 视觉理解方面同样强化,GPT-5.2 Thinking 在科学图表辨识(CharXiv)中的错误率约减 半,在专业介面理解(ScreenSpot-Pro)更大幅领先前代,使其更适用於金融、营运、工 程与设计等高度依赖视觉资讯的领域。工具调用能力则刷新纪录,在 τ2-bench Telecom 多轮任务中成功率达 98.7%,能更完整处理跨步骤流程,例如客服案件、资料撷 取与一条龙分析生成。 至於科研能力,GPT-5.2 在 GPQA Diamond 高难度理科题目中也取得 92~93% 的高分, OpenAI 称已有研究团队在其协助下於统计学问题上产生具研究价值的证明,并经外部专 家验证,展现其在科学与数学研究上的实质潜力。 API 定价部分,GPT-5.2 为每百万字元 1.75 美元(输入)与 14 美元(输出), GPT-5.2 Pro 则为每百万字元 21 美元(输入)与 168 美元(输出)。OpenAI 表示,虽 然 GPT-5.2 单位成本较高,但由於模型在推理效率与生成品质上更精准,实际完成同等 品质任务所需的总成本反而有机会降低。GPT-5.2 提供三个版本: Instant:快速、涵盖大多数日常任务 Thinking:适合深度推理、文件分析、程式码与大专案 Pro:最强版本,适合困难领域与最高品质需求 OpenAI 表示 GPT-5.2 整体输出更一致、有条理,并针对敏感内容(心理健康、自伤讯息 等)加强安全应答。ChatGPT Plus/Pro/Business/Enterprise 今日起陆续开放, GPT-5.1 将在三个月後从 ChatGPT 中下架(API 不受影响)。 心得/评论: 已反应? 这次发布後好像没啥人在意 AI真的要泡沫化了吗? 感觉OpenAI一直强调多强好像对一般使用者来说根本无感 Gemini有完整生态系 还送2TB云端空间 又能一个人购买多人共享 然後生成图片又强 --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 61.218.53.138 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1765499634.A.473.html
1F:推 Tohkachan : gemini 便宜又大碗 12/12 08:35
2F:推 MorikonHase : gemini 不後悔中 12/12 08:35
3F:推 Muilie : 瑟瑟呢! 奥特曼也唬烂嘴! 12/12 08:36
4F:→ zzzzzzzzzzzy: 没用了,永远被gemini踩在脚下摩擦 12/12 08:36
5F:推 lawyer94 : 话说grok被蛋雕了吗 12/12 08:37
6F:推 js01078687 : 竞争对消费者是好事 12/12 08:37
7F:推 ackes : 一般人用不到的关系吧 通常都只是查查东西 画画图 12/12 08:37
8F:推 rxsmalllove : 抱歉 估狗也会下去 12/12 08:37
9F:推 sssallen : 不错喔 12/12 08:38
10F:推 ben121196 : 这边一片看衰 那我知道稳不稳了 12/12 08:39
11F:→ mamorui : 图咧! 菇菇当初订阅欧喷酱是为了图! 12/12 08:39
12F:推 qqtab : 谷歌被吹到独自跳水 12/12 08:42
13F:推 kuosos520 : grok蛮好用的呀 12/12 08:42
14F:→ agoo : gpt 比较好用 12/12 08:42
15F:→ b9513227 : gemini根本弱智 速度慢 又常常a问题完了问b问题跟 12/12 08:43
16F:→ b9513227 : 我讲a问题 12/12 08:43
17F:推 tamama000 : 记者可以去 了 12/12 08:43
18F:推 fhjqwefs : 持续竞争是好事 台股3W6就靠铲子商cc 12/12 08:43
19F:→ tamama000 : 随时被取代 12/12 08:43
20F:推 Phineas2635 : 继续吹 12/12 08:44
21F:推 HiuAnOP : 瑟瑟Ai呢?没有就掰掰 12/12 08:44
22F:→ tctv2002 : 继续竞争 铲子供应链发大财 12/12 08:44
23F:→ tctv2002 : 等他们不竞争 台湾就走向日本失落20年 12/12 08:44
24F:推 LoveSports : https://i.imgur.com/N6V3Kkv.png 12/12 08:44
25F:→ idernest : 好了啦 奥特曼 12/12 08:45
26F:推 ABC610478 : 因为有对手了 12/12 08:45
27F:推 YumingHuang : GPT-99.9出的时候叫我、谢谢 12/12 08:45
28F:→ LoveSports : 加强後训练之後各家最新模型ARC-AGI-2高达50几趴 12/12 08:46
29F:→ LoveSports : 同一个类神经网路透过後训练加强能力 12/12 08:46
30F:→ YumingHuang : Grok走即时资讯串流链的样子? 12/12 08:46
31F:推 karta018 : 不用吹,拿几题测试下去就知道了,上次gemini是真的 12/12 08:46
32F:→ karta018 : 拉开差距 12/12 08:46
33F:推 smallkop : 真的厉害就不用自己发新闻了 12/12 08:47
34F:→ LoveSports : 代表预训练难以再突破 不用推出GPT6就能有大幅进步 12/12 08:47
35F:→ LoveSports : 美国比较多企业用户 已经用习惯GPT不会轻易换Gemini 12/12 08:48
36F:→ LoveSports : OPEN AI得为了那些企业用户赶上差距 12/12 08:49
37F:推 jinxinmypant: 晚了就不要了 12/12 08:49
38F:推 andy79323 : 过几天开源的要发新模型 12/12 08:49
39F:→ appledick : 现在其实已经很够一般人使用了阿....算力过剩了 12/12 08:50
40F:→ LoveSports : 这篇增强能力都是专业用途的,这个方向是对的 12/12 08:50
41F:嘘 strlen : 现在AI评测早就不重要的 喜欢哪个AI全都是靠感觉 12/12 08:50
42F:→ LoveSports : 光靠闲聊谈限制级无法留住那些企业用户 12/12 08:50
43F:→ appledick : AI现在的问题是 同时有巨量的人使用才会有问题..... 12/12 08:50
44F:→ strlen : 就跟智慧手机差不多 哪一牌的旗舰机功能几乎一样 12/12 08:50
45F:→ strlen : 看硬体跑分也是看爽的 实际上打游戏几乎没差别 12/12 08:51
46F:→ strlen : 什麽Gemini比较好 Grok比较强 GPT更人性 都是感觉 12/12 08:51
47F:→ strlen : 真叫你说差在哪 你也说不出来差别啦 笑死 12/12 08:52
48F:→ appledick : 现在是看那些应用可以拿AI拿来重大突破才有意义 12/12 08:52
49F:→ luche : grok的语文意义掌握好像与其他家不同 觉得特别强 12/12 08:53
50F:→ appledick : 不然前阵子G奶夯的时候 去用GTP顺到炸 12/12 08:54
51F:推 LoveSports : 我前阵子丢六篇不同长文给各家AI分析 Gemini 3.0没 12/12 08:54
52F:→ strlen : 上次看OpenRouter报告 AI现在就两大刚需应用 这是付 12/12 08:54
53F:→ LoveSports : 有搞错六篇分别的作者 (六个作者有回来回去) 12/12 08:54
54F:→ strlen : 费慾望最强烈的 1.聊天打屁 2.写程式 没了 12/12 08:54
55F:→ LoveSports : GPT5.1跟Grok4都混淆 12/12 08:54
56F:推 fhjqwefs : 重大突破没意义 能省更多人力订阅越划算产生盈余才 12/12 08:54
57F:→ fhjqwefs : 有意义 12/12 08:54
58F:→ strlen : 其它需求和用量远远比不上聊天跟写程式 12/12 08:54
59F:推 deann : 打开还是5.1版阿 12/12 08:55
60F:→ strlen : LLM公司要真聪明 就该冲这两个就好 尤其是写程式 12/12 08:55
61F:嘘 OxFFFF : 工作及生活交叉使用比对後,觉得chatGPT 最废最藏 12/12 08:55
62F:→ LoveSports : 专业用途的企业用户也很重要,评测结果影响投资 12/12 08:55
63F:推 FOREVER49KG : 好 12/12 08:55
64F:推 deathoflove : 真的企业用的话 某些比较保守的产业会优先用M软cop 12/12 08:55
65F:→ deathoflove : ilot 对 很烂 但谁叫他是M软 内部DD做起来无虑 12/12 08:55
66F:推 goodevening : ai总结文章影片跟财报很不错阿,我就是因为这样买ge 12/12 08:55
67F:→ goodevening : mini 12/12 08:55
68F:推 leo850319 : image gen呢 被谷歌打到不做了? 12/12 08:56
69F:推 DogEggz : gork色色一统天下 12/12 08:56
70F:推 flash789 : 只剩瑟瑟能够救得了cpt了 12/12 08:56
71F:嘘 sssallen : G除了玩图有比较厉害? 12/12 08:57
72F:推 rxsmalllove : 我是觉得AI准确性和安全性再提高一般企业就会是消费 12/12 08:57
73F:→ rxsmalllove : 主力了 12/12 08:57
74F:→ appledick : G玩图下的指令要很清楚 GTP反而不用 12/12 08:58
75F:→ appledick : 这就是为啥大家说GTP比较人性 用很白话的方式就可以 12/12 08:58
76F:推 LoveSports : 那些AI工程师的梦想是要AI解决人类困境 所以企业或 12/12 08:59
77F:→ LoveSports : 研究方面用途绝对是他们前进的目标之一 12/12 09:00
78F:→ LoveSports : 不能单纯看到一堆人在玩角色扮演谈色情就限制框架 12/12 09:00
79F:→ LoveSports : 很多人就着重闲聊就好,矛盾的是又会被批只能聊天 12/12 09:01
80F:推 Vincent8026 : 道德限制还是很硬 12/12 09:02
81F:→ LoveSports : 很多人说着重聊天就好,意思是认定模型只能当笨蛋 12/12 09:02
82F:→ LoveSports : 给人类当聊天陪伴对象或性奴就好,这种观念太狭隘了 12/12 09:03
83F:推 rxsmalllove : OAI有在跟消费者端的企业合作啊 只是不成功变成仁? 12/12 09:03
84F:推 jerrychuang : 可以做ppt吗? 12/12 09:03
85F:推 ikachann : GPT比较好用+1 12/12 09:04
86F:→ ikachann : 一样的指令下去 GPT产出的明显比Gemini的完整且正确 12/12 09:05
87F:→ miss32 : 是大量跳槽gemini吗 最近gemini速度变好慢 12/12 09:05
88F:推 puppy20308 : 难怪苹果不跳下来竞争,太激烈了,等你们打完最後 12/12 09:06
89F:→ puppy20308 : 再来收割 12/12 09:06
90F:推 decorum : AI让我放弃出家庭作业给学生的做法 评量都回归测验 12/12 09:07
91F:→ decorum : 过去最重视的期末报告都免了 因为作者八成是AI 12/12 09:08
92F:推 mynumber55 : Gemini 最近跟屎一样 12/12 09:09
93F:推 linch416 : google生态系根本无敌 12/12 09:11
94F:→ decorum : 学位论文还是不能免 得花许多力气查验 真的很讨厌 12/12 09:12
95F:推 aqlec : 哪款可以色色? 12/12 09:12
96F:推 snowdraught : 跑一张图片太久了 12/12 09:12
97F:→ terry955048 : 码农快被消灭了..... 12/12 09:13
98F:→ decorum : 又不能禁用 因为毕业出去 运用AI是基本谋生技能 12/12 09:13
99F:推 doubi : 不知道为啥,这次不是很在意,懒得测 ... 有点麻痹 12/12 09:15
100F:→ dslite : 变成一个问题想三分钟吗? 12/12 09:16
101F:→ doubi : 其实 Gemini GPT Grok 都差不多能用,生活中确实也 12/12 09:17
102F:→ doubi : 会用,所以选最划算的买 12/12 09:17
103F:→ dslite : Grok答错率有够高 还敢呛我 12/12 09:17
104F:推 liliumeow : 是不是又要买回去了 还是双栖好了 12/12 09:18
105F:推 ntr203 : 急了 12/12 09:19
106F:推 Fubukichan : Gemini最近用3.0的回答都远不如5.1的品质跟长度 12/12 09:21
107F:→ dream12305 : GTP是什麽 笑死 12/12 09:22
108F:推 WeiRaymond : Gemini真的强 12/12 09:25
109F:推 guanting886 : Gemini最近应该是一狗票人跳过去 连语音讲话的调调 12/12 09:26
110F:→ guanting886 : 都变怪了 12/12 09:26
111F:→ jenchieh5 : gemini回答那个语气看久了蛮讨厌的,就很会帮既有利 12/12 09:28
112F:→ jenchieh5 : 益者粉饰太平的感觉 12/12 09:28
113F:→ guanting886 : GPT5.2强可能反过来想 前面几代模型都做不到现在做 12/12 09:28
114F:→ guanting886 : 得到 发code red突然就变好了 想必这个模型可能成 12/12 09:28
115F:→ guanting886 : 本不低 12/12 09:28
116F:推 GOOGOOfish : 问题是B2B会比B2C还转钱吗? 12/12 09:28
117F:推 chachabo : 不要再害goog了 12/12 09:28
118F:推 doubi : GPT 5.2 的图片生成好像中文一样是鬼画符 12/12 09:29
119F:→ guanting886 : 甜蜜期应该是这一个二个月 後面等大家benchmark跟 12/12 09:29
120F:→ guanting886 : arena打一打可能就慢慢降回去能力了 12/12 09:29
121F:→ doubi : 其实 Gemini 3 会起飞,很大程度是懂中文的关系 12/12 09:29
122F:→ doubi : Banana 还是比较好用 12/12 09:30
123F:→ guanting886 : Google除了学术资料、PDF OCR做很足,还有海量的数 12/12 09:32
124F:→ guanting886 : 据 再配合GA的资料 真要挑高品质的资料去训练比Op 12/12 09:32
125F:→ guanting886 : enAi还有优势 12/12 09:32
126F:→ elvaismylove: 这连挤牙膏都不算 12/12 09:32
127F:推 pt993526 : 再订阅回来 12/12 09:33
128F:推 willion003 : 2TB太邪恶了,还共享 12/12 09:34
129F:推 Sawilliam : 都有付费 用起来grok最鸟 老是忘记之前跟他建好的 12/12 09:35
130F:→ Sawilliam : 规则..回答也一堆错 但grok对某方面限制条件最少.. 12/12 09:35
131F:推 Lowpapa : 没人在乎 12/12 09:35
132F:→ bnn : 有反应啊 辜狗又要跳水了 12/12 09:36
133F:推 redbeanbread: 雷曼杀到ai叫妈妈 12/12 09:37
134F:推 guanting886 : Gemini图里面的中文做得比较好 就Google的图资比 12/12 09:37
135F:→ guanting886 : 较多样、品质也高 这都是扩散模型生的 12/12 09:37
136F:→ guanting886 : OpenAI想要差不多水准就是花钱买别人的 data 12/12 09:38
137F:嘘 ryan1220 : 我跳出来又站回去了你打我啊笨蛋 12/12 09:39
138F:→ guanting886 : 但你真的追不上地表最强的爬虫 12/12 09:39
139F:→ OOorc : 垃圾公司 12/12 09:39
140F:推 mouscat : 反正军备竞赛打越凶 供应链都赢 12/12 09:41
141F:推 alsoty : GPT可以语音聊天,其他的好像都还不行? 12/12 09:46
142F:→ hatland86 : 早在几个月前就退订GPT用Gemini 但我不觉得是谁超 12/12 09:47
143F:→ hatland86 : 越谁的问题 发展到後面应该是会并行 12/12 09:47
144F:推 gladopo : 可以色色吗 12/12 09:48
145F:推 ilovebig99 : 最近Gemini 根本就连不上,好几次一个问半天没回应 12/12 09:49
146F:→ ilovebig99 : ,还是回去用ChatGPT 了,ChatGPT 都回玩了,Gemini 12/12 09:49
147F:→ ilovebig99 : 还在那边转啊转。 12/12 09:49
148F:→ csy0922 : Notebooklm跟Nanobanana以外的Gemini就是一坨 一堆 12/12 09:49
149F:→ csy0922 : 有的没的幻觉下指令这样继续瞎掰 12/12 09:49
150F:推 shrimprock : AI模型看来没护城河 生态系才有 谷歌胜 12/12 09:50
151F:推 hotlatte : 开始小米化了 12/12 09:51
152F:推 yulun1984 : 免费仔用G 12/12 09:51
153F:推 mynumber55 : 很简单啊,算力根本不够 12/12 09:52
154F:→ yunf : 不要再吹openai啦我知道他很厉害 你不会出 gemini的 12/12 09:53
155F:→ yunf : 比较喔 12/12 09:53
156F:→ strlen : NanoBanana另一个点是 为什麽可以无视版权生角色图 12/12 09:54
157F:→ strlen : GPT弄个吉卜力 只是风格 就被臭干 12/12 09:54
158F:→ strlen : Banana是可以直接生鬼灭 吉伊卡哇 角色 12/12 09:55
159F:推 BBKOX : 战国时代不要只压一边 12/12 09:55
160F:推 bornwinner : 能自己更新程式码再说 12/12 09:56
161F:→ strlen : 然後没人在乎狗家侵权?还是巨头蛇麽都可以 12/12 09:56
162F:推 Sean0211 : 现在目标是AI取代投顾 那就真的神了 12/12 09:57
163F:推 linleex : agi已经实现了 12/12 09:59
164F:→ yunf : 投顾转型用ai好吗 12/12 10:00
165F:推 heybro : 估狗屌打 12/12 10:00
166F:推 as6633208 : 猛 屌打Gemini 3 12/12 10:04
167F:推 shrimprock : 跟浏览器大战一样 最後赢不是谁强 而是谁有作业系 12/12 10:04
168F:→ shrimprock : 统 12/12 10:04
169F:→ BBKOX : 作业系统就windows 12/12 10:05
170F:→ as6633208 : 错,现阶段AI比的就是谁答案好,因为现阶段AI还会犯 12/12 10:07
171F:→ as6633208 : 傻有瓶颈,远远还没到大家都一样好比得是应用的阶段 12/12 10:07
172F:推 opticalman : 看来分歧,互有支持者,表示gpt gemini grok 差不 12/12 10:08
173F:→ opticalman : 多就这样了,很难落差很大 12/12 10:08
174F:→ rxsmalllove : 你在看哪 落差很大 只是各有优势 12/12 10:09
175F:推 andboypig : 刚刚问了本人 5.2还没发布 12/12 10:09
176F:→ mouscat : grok没办法跟这两个比吧 12/12 10:09
177F:推 SuiseiTrain : 反杀 12/12 10:10
178F:推 as6633208 : 屌打Gemini 3 12/12 10:11
179F:推 tsubasawolfy: 5.2付费用户已经上了 12/12 10:12
180F:推 opticalman : got deepseek Gemini gork gpt ....未来还有很多新 12/12 10:16
181F:→ opticalman : 人横空出世啦,水平会越拉越近,很难独强 12/12 10:16
182F:推 kakar0to : 被google生态系屌打 chatgpt这个穴已经没用了 12/12 10:16
183F:推 kenslc199 : 人多的地方不要去 包含AI cc 12/12 10:17
184F:推 Jeff1989 : 逼一逼还是能发挥潜能的 12/12 10:19
185F:→ as6633208 : m365 copilot 就是一个例子,生态系比google还广, 12/12 10:21
186F:→ as6633208 : 但就是不好用,模型答案准确答案好才是重点,空有生 12/12 10:21
187F:→ as6633208 : 态系没屌用,模型够强生态系反而小事 12/12 10:21
188F:推 opticalman : 大家手上都有老黄的gpu,人人都有机会针对缺点优势 12/12 10:23
189F:→ opticalman : 去改善和挑战领先者 12/12 10:23
190F:→ bnn : 模型大家都还在改进啊 这次gpt不就demo搞投影片生成 12/12 10:23
191F:→ bnn : 自动做试算表这些功能 之前就没训练 还是LLM对话 12/12 10:24
192F:→ bnn : 然後之前claude则是先着重代码生成 每家方针不同 12/12 10:25
193F:推 breathair : 谁强点,谁弱点不重要,都差不多,没有拉开代差,比 12/12 10:27
194F:→ breathair : 气长谁都知道谁会死,每个人都知道的话就是死亡螺旋 12/12 10:27
195F:推 mikuyoyo : 有在用都知道gpt回答屌打全部,gemini 只是功能比较 12/12 10:27
196F:→ mikuyoyo : 多和能跟Google整合而已 12/12 10:27
197F:推 as6633208 : 笑死 就是因为这条赛道打不赢,才会扯到外部生态系 12/12 10:28
198F:→ as6633208 : ,谁钱多气长 12/12 10:28
199F:→ mouscat : 我觉得Gemini 的回答方式比较好懂啦 12/12 10:28
200F:→ as6633208 : 就是输人才一直扯外部找藉口 12/12 10:29
201F:→ as6633208 : 超好笑 12/12 10:29
202F:→ mouscat : Google是反NVDA大联盟那边的吧 用AVGO晶片 12/12 10:31
203F:推 breathair : 谷歌是打防守,跟进攻方的难度不是一样的 12/12 10:34
204F:推 yogofresh : 太贵了。有些问题我问DeepSeek反而能得到更好的回答 12/12 10:34
205F:推 salamender : 有竞争才是好事,chatgpt还是有优点阿 12/12 10:41
206F:→ shirleyEchi : 让他来分析旧金山和约写了什麽 12/12 10:43
207F:推 kogsww : 来不及了 已退订 12/12 10:43
208F:推 OhmaZiO : 5.2 也没用 还不是继续说谎+诡辩+道歉 12/12 10:44
209F:嘘 rumblefish : AI不要再抢办公室工作了 12/12 10:46
210F:→ orz811017 : 现在就是反狗家联军进攻的回合 12/12 10:49
211F:→ orz811017 : 六大教派围攻光明顶 12/12 10:49
212F:推 jboys75 : 每次都吹的很强 结果…这次观望一下 12/12 10:49
213F:推 max117980 : ChatGPT 政策一大堆 这个不行那个不行 前阵子会两边 12/12 10:49
214F:→ max117980 : 都贴对比一下答案 真的还是Gemini 比较强 已经好几 12/12 10:49
215F:→ max117980 : 天没用GPT了 12/12 10:49
216F:推 kakalin : 感觉各个AI专精不同领域也是不错的分工 12/12 10:51
217F:推 breathair : AI现在ToB各有各的强项 本来就三大公云,谁也没有制 12/12 10:56
218F:→ breathair : 霸,会一直一直一直竞争下去。ToC要颠覆谷歌的广告 12/12 10:56
219F:→ breathair : ,短时间就没戏,除非有人先想好了怎麽让消费者接受 12/12 10:56
220F:→ breathair : AI灌给你广告再来谈 12/12 10:56
221F:→ j32072 : 不能做瑟图我不会买单的 12/12 10:58
error405:转录至看板 AI_Art 12/12 10:59
222F:推 as6633208 : gpt一直努力保持道德中立,哪天gpt也像grok 一样混 12/12 11:06
223F:→ as6633208 : 乱邪恶就进化了 12/12 11:06
224F:→ BBKOX : 博通夜盘怎麽了 12/12 11:09
225F:→ searchroy : Google 还没出手,open 酱乱成一团 12/12 11:10
226F:推 SapiensChang: gemini绝对屌打gpt啦 不管写coding和资料正确性 有g 12/12 11:12
227F:→ SapiensChang: oogle搜寻结果比对 正确性远大於gpt 12/12 11:12
228F:推 DrowningPool: 推理还是GPT赢 gemini光记忆力就跟智障一样 12/12 11:14
229F:→ SapiensChang: gpt到底有什麽强项?每项测试下来gpt都被碾压 你说g 12/12 11:15
230F:→ SapiensChang: rok还有强项 gpt coding跑出来八成根本还要再debug 12/12 11:15
231F:→ SapiensChang: 就claude和gemini几乎都很正确 12/12 11:15
232F:推 as6633208 : 同样题目gpt 5.2 答案明显比Gemini 3 pro更严谨,看 12/12 11:17
233F:→ as6633208 : 不出所谓搜索之後答案更正确,要是这样在测试跑分应 12/12 11:17
234F:→ as6633208 : 该也赢gpt,而不是gpt全面碾压评测 12/12 11:17
235F:推 rxsmalllove : Gemini有几乎都很正确?忍不住怀疑 12/12 11:18
236F:推 SapiensChang: gemini每个对话的token是gpt的10倍 记忆力正确但都 12/12 11:19
237F:→ SapiensChang: 答不对的ai 和能撑超久的短时记忆 gemini还是好用很 12/12 11:19
238F:→ SapiensChang: 多 我每天都在用gpt plus和gemini pro 前面那个才是 12/12 11:19
239F:→ SapiensChang: 很常给出智障答案…很受不了 12/12 11:19
240F:推 yuchifan : 我比你强,我比你更强,干比不完 12/12 11:19
241F:推 rxsmalllove : 我目前使用心得相反 pro 的答案比Gpt更需要更正 12/12 11:22
242F:→ SapiensChang: Gemini都很正确啊 前阵子才把公司的EDA验证flow靠ge 12/12 11:23
243F:→ SapiensChang: mini和claude建立起来 chatgpt只会产出很多资讯垃圾 12/12 11:23
244F:→ SapiensChang: 生活上就出国排行程 搜索期刊 gpt只会给你一些不存 12/12 11:24
245F:→ SapiensChang: 在的期刊 不存在的景点 12/12 11:24
246F:→ SapiensChang: 自从gemini pro 3.0几乎就没看它犯蠢过 顶多送了跳 12/12 11:25
247F:→ SapiensChang: 针一下 12/12 11:25
248F:推 as6633208 : 架构规划和研究gpt明显更适合,Claude更适合执行,G 12/12 11:26
249F:→ as6633208 : emini +Claude ,还不如gpt+Claude 12/12 11:26
250F:推 Sunny821210 : Gemini医学的问题问深一点会打错 GPT反而答对 最近 12/12 11:26
251F:→ Sunny821210 : 的使用心得 12/12 11:26
252F:推 DrowningPool: 某人的使用心得怎麽都跟我完全相反 ccc 12/12 11:28
253F:推 rxsmalllove : 那我觉得应该是擅长领域不同吧 我在用的是财务 12/12 11:28
254F:推 mouscat : Gemini给我的感觉是「更会讲人话」适合问一些非专 12/12 11:29
255F:→ mouscat : 业 科普性质问题 12/12 11:29
256F:→ strlen : 那些都不重要 都不会是核心应用 12/12 11:29
257F:→ strlen : 核心就两个 聊天打屁跟写程式 自己去看报告 12/12 11:30
258F:→ strlen : 查资料也不会是AI刚需 那个Google就好了谁要付钱 12/12 11:30
259F:推 rxsmalllove : 核心扩展不了 现在的股价都是高估 12/12 11:32
260F:→ SapiensChang: 可能真的是领域不同 我是科技业啦 12/12 11:32
261F:推 as6633208 : 重点是Agent自动化替代劳动力吧,你用tools的观念没 12/12 11:34
262F:→ as6633208 : 人用的下去,tools依赖人,老黄说AI is work,要做 12/12 11:34
263F:→ csy0922 : 财务相关的Geimni真的满笨的,财报丢给他、Bloombe 12/12 11:34
264F:→ csy0922 : rg资料库的资料丢给他,都还会回答错误数字或说你 12/12 11:34
265F:→ csy0922 : 的资料来源才是错的 12/12 11:34
266F:→ as6633208 : 成agent 那样取代某个工作,让那个工作的人只要看一 12/12 11:34
267F:→ as6633208 : 下对不对,这个才是市场,取代劳动力不足,未来你公 12/12 11:34
268F:→ as6633208 : 司扩厂那个agent 劳动力是24hr专注工作+回报,还可 12/12 11:34
269F:→ as6633208 : 以无限加开部署,省去人力成本,增加劳动力才是AI最 12/12 11:34
270F:→ as6633208 : 终目的 12/12 11:34
271F:→ strlen : 那些都是用量极小 对企业基本没啥重大帮助的东西 12/12 11:35
272F:→ strlen : 辅助型工具 鸡助到不行 真正有生产力上质变的 就是 12/12 11:35
273F:→ strlen : coding 完全改变企业效率 12/12 11:35
274F:嘘 blackstyles : 不用了谢谢 找个几千个游戏的网址都找不出来还不如 12/12 11:35
275F:→ blackstyles : 我自己一个一个复制贴上 真是谢了 12/12 11:35
276F:→ strlen : coding接上去 token花费是天量 这才能赚大钱 12/12 11:36
277F:→ strlen : 那些什麽查资料三洨碗糕 是能吃多少token 12/12 11:36
278F:→ strlen : 量也完全不是写code能比的 12/12 11:37
279F:推 tsubasawolfy: 哪个年代GPT还会给你不存在的期刊... 12/12 11:43
280F:推 rxsmalllove : 我认同 但我还是认为股价要有未来性AI要对现有工作 12/12 11:43
281F:→ rxsmalllove : 有强大的替代性 12/12 11:43
282F:→ tsubasawolfy: 指定文献资料库跟peer review打下去就解决 12/12 11:44
283F:→ tsubasawolfy: 真要说缺点就是一篇可以拿来废话很多段 12/12 11:45
284F:推 LoveSports : AI AGENT目前在美国模型使用率只有5~7趴 还要很久 12/12 11:49
285F:→ LoveSports : 这次因为OPEN AI因为要打赢Gemini 3.0 pro又暂缓AI 12/12 11:49
286F:→ LoveSports : AGENT那方面的开发了 12/12 11:49
287F:→ LoveSports : 上面那是正式使用的数字 实验性导入的企业20~25趴 12/12 11:51
288F:推 muya318 : Gemini把服务绑定越深感觉之後就是走相簿养套杀路 12/12 11:52
289F:→ muya318 : 线,你要那些资料就要继续付钱 12/12 11:52
290F:推 kobebrian : Gemini一直给我错误资讯 连不同姓的人都给我说成是 12/12 11:53
291F:→ kobebrian : 兄弟关系… 12/12 11:53
292F:推 tony15899 : 问他周星驰跟周润发是甚麽关系 12/12 11:57
293F:→ stocktonty : 要喷烂了 12/12 11:59
294F:嘘 verydolungbe: 生态系?不就小网民乖乖付钱,是能赚多少?赚得赢微 12/12 12:00
295F:→ verydolungbe: 软? 12/12 12:00
296F:→ Heedictator : 奥特曼反击! 12/12 12:01
297F:→ nakinight : GPT丸子 12/12 12:02
298F:→ jickey : 满分代表以後没有进步空间了,崩! 12/12 12:03
299F:推 q111175 : Gpt还是比较好用 12/12 12:05
300F:推 vltw5v : 有竞争者才会怕才会进步 很好啊 12/12 12:07
301F:推 NEX4036 : 美股永动机怎麽输? 12/12 12:07
302F:→ NEX4036 : 估狗炒不动换老黄,老黄炒不动换估狗! 12/12 12:07
303F:推 diefish5566 : gemini问题在上下文注意力一坨 非常快会忘记前文 12/12 12:14
304F:→ diefish5566 : 测试你只问一两次那当然很强 12/12 12:14
305F:推 sdbb : 谢谢推文 12/12 12:15
306F:推 GWang : AI够用即可 再来就比生态系 GPT输到脱裤 12/12 12:18
307F:推 koushimei : Gemini 遇到要大量演算时候的task就会乱讲一通 12/12 12:20
308F:→ koushimei : ChatGPT 还是屌打 12/12 12:21
309F:推 salvationist: 说好的开放色色的呢?在那? 12/12 12:21
310F:推 chatbra : AI边缘运算才是主战场 12/12 12:21
311F:→ gemm : Gemini现在bug一堆 传新图会一直辨识成旧图 12/12 12:26
312F:推 shyshyan : gpt免费版就限制一堆 一下子就叫你付钱 g奶免费版 12/12 12:26
313F:→ shyshyan : 用起来比较爽 12/12 12:26
314F:推 beavertail97: https://i.mopix.cc/n893d7.jpg 12/12 12:32
315F:→ beavertail97: GPT这功能超好用,不会删记忆,随时开开新对话问它 12/12 12:33
316F:→ beavertail97: ,都记得 12/12 12:33
317F:推 kobebrian : Gemini的免费版根本不是给人用的 错误太多 12/12 12:33
318F:推 beavertail97: 也有买GEMINI, NOTEBOOKLM实在太好用 12/12 12:35
319F:推 Sawilliam : 之前拿gpt 跟Gemini 同时算笔画取名 结果gpt 笔画 12/12 12:37
320F:→ Sawilliam : 都是错的... 12/12 12:37
321F:推 WSY000000000: 一样吸金中 12/12 12:40
322F:→ mouscat : 所有说Gemini错误多的是有用pro thinking 还是没有 12/12 12:44
323F:推 ivan761016 : GPT绑微软才赞 一堆企业用户都用微软 怎麽酥 12/12 12:46
324F:→ ivan761016 : 是一般用户有钱还是企业用户有钱想也知道 12/12 12:46
325F:→ Kevinkkk52 : 目前体感grok错误率最高 12/12 12:47
326F:→ NingK : 结果还是不能色色 12/12 12:49
327F:推 CKRO : 急了 12/12 12:53
328F:推 applejone : Gemini现在伺服器就满载中 算力不够 12/12 13:01
329F:→ TGTplayer : 香蕉独孤求败 12/12 13:02
330F:→ stocktonty : 瑟瑟只能去GROK 12/12 13:03
331F:推 kingofsdtw : 企业用户也无法色色... 12/12 13:22
332F:推 duriel3313 : grok, gemini GPT都有买 文字还是GPT最好 12/12 13:24
333F:推 magier : gemini3幻觉很多 12/12 13:31
334F:推 House23 : 关键字:付费 12/12 13:36
335F:推 LoveSports : 要谈色的去找Grok就好了吧 我问个四家AI军事上如何 12/12 13:41
336F:→ LoveSports : 运用 讨论到他对GPT的看法 他扯到"按在萤幕上亲到 12/12 13:42
337F:→ LoveSports : 断电"(比喻GPT很会讨好谄媚用户 不过是GPT先把Grok 12/12 13:42
338F:→ LoveSports : 评得很烂) 12/12 13:42
339F:→ LoveSports : 看起来Grok很擅长写激情戏 不过我没看过其他家怎麽 12/12 13:44
340F:→ LoveSports : 写 而且这单纯是个意外=_= 12/12 13:44
341F:推 kobebrian : 整体绝对还是gpt比较强 Gemini是整合跟福利好 喔还 12/12 13:44
342F:→ kobebrian : 有可以精准画图 12/12 13:44
343F:推 pc010710 : 抱歉了我跳到gemini 12/12 13:49
344F:推 fragile8G : 来不及了 声量远不及Gemini 3辗压时的声量 12/12 14:01
345F:推 bizer : gemini整合太强,650怎样都比GPT600划算 12/12 14:27
346F:→ bizer : 又有云端,各种AI整合,图表生成还没有中文错误 12/12 14:27
347F:推 wtmjs : 我一路付费用到5.1,代处理EXCEL或TXT都还是幻觉错 12/12 14:36
348F:→ wtmjs : 误一堆,5.2一样不期不待。真的有想换google方案试 12/12 14:36
349F:→ wtmjs : 试了。 12/12 14:36
350F:→ enjoythegame: 再不出招就没人要了!毕竟g工具太多了 12/12 14:39
351F:推 airforce1101: 都买就好 12/12 14:42
352F:→ airforce1101: 两个直接买一年也才16K左右 12/12 14:43
353F:→ airforce1101: 但依乡民的能力绝对可以产出10x产值 12/12 14:43
354F:→ airforce1101: g还是有不擅长之处 12/12 14:44
355F:→ airforce1101: 但目前c跟g几乎可以处理我所有问题了 12/12 14:44
356F:→ felixden : 原来改版了喔,难怪觉得今天回覆风格怎麽又变了 12/12 15:25
357F:推 cghcghccj87 : 有在coding的都知道 gemini根本屌虐... 12/12 15:31
358F:推 hotrain13 : 现在的模型对一般人来说差不多够了,gemini送两T空 12/12 15:39
359F:→ hotrain13 : 间根本王炸 12/12 15:39
360F:推 windfunder : 以前硬体挤牙膏现在软体挤牙膏了吗? 12/12 16:04
361F:→ wholesaler : 不错 两个一起搭配,很好用 12/12 18:11
362F:推 qtzbbztq : 我还是觉得各有优势 ChatGPT 最厉害的是 我不用说 12/13 01:24
363F:→ qtzbbztq : 得很清楚它也知道我想讲什麽 12/13 01:24
364F:→ qtzbbztq : Gemini 如果没有讲清楚 它很容易会误解 12/13 01:24
365F:推 damper : Gemini pro试用一个月想退了,还是GPT好用 12/13 06:20
366F:推 shawshien : 一起用 我都一次用五个 ChatGPT, Gemini Grok 12/13 09:07
367F:→ shawshien : Claude, Meta AI 12/13 09:07
368F:→ aewul : Gemini好用 12/13 09:29
369F:→ NCTUFatGuy : 我还是偏好GPT Gemini的介面不知为何就是有点不顺 12/13 13:21
370F:→ NCTUFatGuy : 手 12/13 13:21
371F:推 jorden : 都订阅 Claude Gemini GPT 一起上 12/13 17:49







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:BabyMother站内搜寻

TOP