作者arsl400 (dark hatter)
看板Stock
标题[新闻] OpenAI 释出 GPT-5:程式能力大升级,现
时间Fri Aug 8 09:10:27 2025
原文标题:
OpenAI 释出 GPT-5:程式能力大升级,现在就能在 ChatGPT 用
原文连结:
https://www.inside.com.tw/article/39212-openai-chatgpt-5-release
发布时间:
2025/08/08
记者署名:
Chris
原文内容:
OpenAI 这次非常强调 GPT-5 的写程式能力,而且多模态能力也大幅提升,已经马上同步
开放给所有 ChatGPT 使用者了!
OpenAI 今天正式释出 GPT-5 了!而且是马上并同步开放给所有 ChatGPT 使用者,
GPT-5 的上下文视窗长度大幅提升至 256,000 个 token,API 版本最高可处理 272,000
个输入 token 和 128,000 个输出 token,总长度达 40 万个 token,足以一次性分析一
部长篇小说或庞大的程式码库,同时维持对话的连贯与脉络。
OpenAI 这次非常强调 GPT-5 的写程式能力,在程式码写作能力测验 SWE-bench
Verified 中,GPT-5 得分高达 74.9%,表现略胜於 Anthropic 最新的 Claude Opus 4.1
(得分 74.5%)、Google Gemini 2.5 Pro(得分 59.6%)。
GPT-5 语音互动的自然度也大幅提升,并支援即时视讯互动,可媲美 Google Gemini
Live;模型的代理任务处理能力更为成熟,能够处理现实世界应用并清楚解释推理过程,
并将於下周支援 Gmail 与 Google 日历整合,强化其作为智慧助理的角色。
多模态部分,GPT-5 能在同一场对话中同时处理与生成多种型态的内容——文字、图片、
语音,影片(目前可以阅读、理解,但目前不支援生成)。在复杂任务上的外语理解能力
也有提升,例如能用法文生成完整网站并正确发音。过去需要分别依赖 Vision、Sora、
GPT 与「o」模型来进行推理的工作,现在 GPT-5 一手包办。
在可靠性方面,OpenAI 指出 GPT-5 的事实错误率较 o3 模型降低约 80%,大幅减少所谓
「幻觉」问题,对企业与专业使用者的可信度大幅提升(但还是不敢保证没幻觉)。同时
,记忆功能也获得强化,能跨越多次对话,记住使用者的偏好与指示。
ChatGPT 的订阅方案维持不变,Plus 版每月 20 美元,Pro 版每月 200 美元。免费使用
者可使用标准版 GPT-5,额度用完後会转为 GPT-5 mini;Plus 使用者可存取完整标准版
,而 Pro 使用者则可无限制使用最高等级版本并享有高级代理与强化语音视讯功能。
API 收费方面,OpenAI 在 API 中释出三种规模的 GPT-5—— gpt-5、gpt-5-mini和
gpt-5-nano,标准版输入每百万 token 1.25 美元、输出 10 美元,Mini 版分别为
0.25 与 2 美元,Nano 版则为 0.05 与 0.40 美元,价格具竞争力且低於部分自家旧型
号。
虽然 GPT-5 尚未达到 AGI(通用人工智慧)的门槛,仍专注於特定任务而非全面模仿人
类智慧,但它的多模态整合、推理深度、长记忆与低错误率,使其在专业与消费市场的应
用价值大幅提升。OpenAI 执行长 Sam Altman 亦表示,影片生成将在未来版本加入,但
现阶段 GPT-5 已能即时理解并回应影像与视讯内容。
心得/评论:
凌晨看各位网红评测,给的回馈都相当不错,不过感觉不是第五代,比较像是4.5代
各位怎麽看呢?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 49.158.132.159 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1754615429.A.0A5.html
1F:→ pyrolith : 反观 08/08 09:11
2F:→ Muilie : 没有香香的电子老婆吗 08/08 09:12
3F:→ piece1 : 一般人觉得没啥差了..马斯克的AI女友进化比较期待 08/08 09:14
4F:→ eva19452002 : 4.5代不是之前出的吗? 08/08 09:16
5F:推 cms6384 : 进步幅度肯定只会越来越小 08/08 09:16
6F:推 a82412 : 更新完没看到啊 08/08 09:16
7F:→ uv5566 : 写程式越来越强 工程师先把自己取代惹 08/08 09:17
8F:推 kotorichan : 是蒸馏claude的吗??? 08/08 09:17
9F:→ biojo : 一龙马那边有弥海沙 你还不快跟上 08/08 09:18
10F:推 DDDDRR : 我也没看到欸= = 08/08 09:18
11F:→ huangin : 没看到GPT5啊,依然只有4.5 08/08 09:18
12F:推 zxcvb71 : 原本是长江後浪推前浪,这次变成前浪把後浪的路堵 08/08 09:19
13F:→ zxcvb71 : 起来了 08/08 09:19
14F:推 wind93 : 捉网页上数字还是错的离谱 08/08 09:19
15F:→ zxcvb71 : 以後用ai写程式就好,程式设计师不需要新人了 08/08 09:20
16F:推 tsubasawolfy: 手机APP的好像还没更新 Windows APP跟网页版都更新 08/08 09:20
17F:推 g0t24568 : 我可以用5了 但我是plus版 08/08 09:20
18F:推 fatdoghusky : 手机不能用= ="" 三小 08/08 09:21
19F:→ Dhack5321 : 网页版有了 08/08 09:23
20F:→ chirex : 4就很垃圾了,还来5?愈用愈废 08/08 09:23
21F:推 pansquarl : 要跟 Grok 比,人家有 AI 女友又能简单生片,真的 08/08 09:25
22F:→ pansquarl : 输了 08/08 09:25
23F:→ cccict : 计数还是错的,威秀座位图丢上去要他数几个红几个 08/08 09:27
24F:→ cccict : 蓝都数不对 08/08 09:27
25F:推 c7683fh6 : 天网出来了没 08/08 09:30
26F:推 pttbeigowow : 工程师码农失业第一步 08/08 09:37
27F:推 yousking : 能干的再叫我 08/08 09:39
28F:推 ivan761016 : 普通使用者:没虚拟女友就是个废物 08/08 09:42
30F:→ stepnight : 蛤还有机率有幻觉?乡民用的都没幻觉了内 08/08 09:43
31F:推 cagepig : 当然还是grok比较实用.可以看泰勒斯清凉图 08/08 09:43
32F:→ stepnight : 免费版刚看可以用5了 08/08 09:44
34F:→ s213092921 : GPT5认为69.1大约52.8对吧? 08/08 09:46
35F:→ nakato : 还不错 08/08 09:48
36F:推 pponywong : claude-4写程式真的强 08/08 09:51
37F:推 stepnight : claude 如果免费 用来写程式,那个体验一言难尽 08/08 09:53
38F:→ batterykugua: 问个短问题 思考用中等 就想了9千token 怕! 08/08 09:56
39F:推 mdkn35 : 精简扼要 claude实在太罗嗦 08/08 09:59
40F:→ mdkn35 : 除非用cline不然 不想看claude废话还幻觉 08/08 09:59
41F:推 Haruna1998 : 回家先试试看 Claude 用过完全海放 08/08 10:06
42F:推 FreedomTrail: 才准备订claude pro的说 08/08 10:10
43F:推 pponywong : copilot 用 agent mode claude-4 根本神 08/08 10:10
44F:→ pponywong : 从系统到kernel driver, machine learning 都可以答 08/08 10:11
45F:→ pponywong : 还有不用上网查git指令了 直接跟claude说你想要干嘛 08/08 10:12
46F:→ pponywong : claude自动帮你做完 08/08 10:12
47F:推 ChoiceLife : 急了 08/08 10:14
48F:嘘 Deltak : 不能色色,屁都没用 08/08 10:16
49F:推 s213092921 : Deepseek熬夜看完直播转职DeepSleep笑到睡着 08/08 10:29
50F:推 tsubasawolfy: 结果reddit逛一圈都在喊把4o还来 因为5缺乏感情 08/08 10:33
51F:→ tsubasawolfy: 倒底多少人靠他提供情绪价值... 08/08 10:33
52F:推 strlen : AI废话多你可以下prompt叫他少废话给code就好啊.... 08/08 10:40
53F:→ sing60905 : 现在还真的很多人没事就跑去跟GPT聊天 08/08 10:41
54F:→ sing60905 : 他是真的蛮会安慰人的 尤其说的话女生很爱听-.- 08/08 10:41
55F:→ strlen : 有感情你嫌太讨好 没感情你哭着说为什麽AI没人味 08/08 10:41
56F:→ strlen : 所以最大的问题根本就是人类 还是乖乖去当电池好了 08/08 10:42
57F:推 eliteark : 我用还是GPT-4o 5还没开放给免费仔? 08/08 10:42
58F:推 stlinman : 感觉减少一点AI感,但没显着进步? 强化细微体验感? 08/08 10:43
59F:推 lovemasteru : 本来已经转订claude 现在又要回来了吗 08/08 10:45
60F:→ lp2650056 : 你信?这东西最烂的就是帮写程式 08/08 10:50
61F:推 YJM1106 : 背景底色都换了 很fancy 08/08 10:54
62F:推 hotrain13 : claude是目前废话最少的 08/08 11:01
63F:推 staytuned74 : 用了有点失望,进步幅度越来越小 08/08 11:02
64F:→ staytuned74 : 写程式Claude opus 还是王者 08/08 11:03
65F:→ staytuned74 : 然後写程式要用Claude code 那才是真的好用,比起 08/08 11:04
66F:→ staytuned74 : 什麽其他vibe coding 工具 08/08 11:04
67F:推 staytuned74 : 反之 不是问写程式 Claude 就被海放XD 08/08 11:08
68F:推 smilesi : Deepseek被吹死了 中国股票韭菜割不完 08/08 11:15
69F:推 ga023630 : Deepseek 都被智谱跟千问海防打爆了 08/08 11:17
70F:推 offstage : 我不要AI写程式,我要AI初音海梦轻井泽惠雷姆 08/08 11:20
71F:推 morning3569 : 写程式的话claude code真的海放 08/08 11:23
72F:推 ttsieg : 忧郁症还真的好聊 08/08 11:24
73F:推 g5637128 : API价格降很多 08/08 11:26
74F:推 mike8469 : claude 在 coding 方面真的海放 08/08 11:29
75F:推 osiris9088 : 那些乱七八糟的版本代号终於整合了 08/08 11:34
76F:推 holysong : DS:我是智障,什麽问题都无法回答,你要不要问问别 08/08 12:10
77F:→ holysong : 的 08/08 12:10
78F:推 diyteam : 机密!上传就被copy了!AI.....有利有弊。 08/08 12:40
79F:推 mdkn35 : 还要自己设prompt喔?果然跟claude一样罗嗦耶 08/08 13:10
80F:推 staytuned74 : 未来趋势是,AI升级iphone化 08/08 13:19
81F:推 herculus6502: 这波大概到此为止了 08/08 21:14
82F:→ chenpfu0394 : 降低80%错误率 真德假德 08/09 13:35
83F:→ huabandd : 瞎吹,有人测过了,没强到哪去 08/11 19:35