作者arsl400 (dark hatter)
看板Soft_Job
标题[讨论] 大家觉得ChatGPT-5表现如何?
时间Fri Aug 8 04:54:56 2025
上次GPT-4.5被喷烂
这次GPT-5感觉有升级了
对我来说更像是GPT-4.5
各位有看直播吗?
或是亲手测试得如何?
据说程式很好写?
设计电玩很简单?
讨论一下吧!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 49.158.132.159 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1754600098.A.CAD.html
1F:嘘 KanzakiHAria: 还没开放 我plus用户都还只能4 08/08 05:54
2F:推 ikachann: 我也plus用户 昨天直播完不久已经可以用5了 08/08 07:42
3F:推 wangs90: 我免费用户,现在也可以用5 08/08 07:56
4F:推 neo5277: 很可怕 08/08 08:37
5F:推 PuPuyo: 不喜欢,4o讲话比较有感情,5像是一个无情的分析机器,如 08/08 08:51
6F:→ PuPuyo: 果要聊天 5会大失所望 马的还我4o 08/08 08:51
7F:推 ikachann: 没吧 5聊天进步很多耶 感觉更像真人了 08/08 08:54
8F:嘘 B0988698088: 不要洗 08/08 11:11
9F:推 oherman: 回答常识反而更简短没深度了,不知道是不是因为想节省算 08/08 11:37
10F:→ oherman: 力的关系 08/08 11:37
11F:推 oherman: 询问今天新闻就回个一两句、一两则新闻敷衍你,而且是一 08/08 11:39
12F:→ oherman: 些无关紧要的新闻,比如今天88节之类的… 08/08 11:39
13F:推 wei115: 靠北,我用个o4mini还要上传身份证,直接改用gemini 2.5 08/08 11:39
14F:→ wei115: pro,反正openai也没比较好用= = 08/08 11:39
15F:推 bradyhau106: Plus用户用了一个早上 主要用於软体架构设计跟职崖 08/08 11:53
16F:→ bradyhau106: 分析两方面 1. 感觉对话有更简短了 但是反应时间更 08/08 11:53
17F:→ bradyhau106: 快 2. 幻觉率明显有降低 会更直接告诉你他什麽可能 08/08 11:53
18F:→ bradyhau106: 需要额外的 context 3. 在 thinking模式方面 思考链 08/08 11:53
19F:→ bradyhau106: 深度感觉更深(尤其是引入额外搜寻资料明显有感) 08/08 11:53
20F:→ bradyhau106: 但是回答同样更简短 4.可用率变差 多次需求失联 感 08/08 11:53
21F:→ bradyhau106: 觉是大家抢着试用的关系 08/08 11:53
22F:推 Bustycat: 觉得新闻太烂也许是你问的也不行? 08/08 12:33
23F:→ Bustycat: o4-mini要上传身分证是不是被钓鱼了 08/08 12:33
24F:→ eva19452002: 我没用过gpt-5,但从推文的反应,我觉得gemini回答比 08/08 12:43
25F:→ eva19452002: gpt-5好(仅限个人经验) 08/08 12:43
26F:→ eva19452002: 不然看有没有人先丢一个问题,用gpt-5回答,我用gemi 08/08 12:44
27F:→ eva19452002: ni 2.5回答,看哪一个回答比较优 08/08 12:45
28F:嘘 illya65536: 不要洗文 08/08 12:59
29F:推 CoNsTaR: 直播的图表是 gpt-5 做的吗? 08/08 13:01
30F:推 dodomilk: 我问gpt-5的token价格他给我回这个 08/08 13:41
32F:→ dodomilk: 标题写每1k的tokens,但GPT-5三个模型其实是每1M tokens 08/08 13:41
33F:→ dodomilk: 我怀疑gpt-5出现幻觉的机率还是很高 08/08 13:42
34F:推 wei115: 真的,现在要用openap api一定等级以上的模型要身份证明 08/08 13:45
35F:→ wei115: 文件,一次验证还只能用90天 有够烂= = 08/08 13:45
36F:推 VScode: 我最近在做影片逐字稿 之前做的都翻译很完整 今天超偷懒 08/08 14:08
37F:→ VScode: 省略一堆没翻译到 08/08 14:08
38F:→ VScode: 应该是偷偷节省成本 不做长文输出了 08/08 14:08
39F:推 dodomilk: 变比较便宜是有代价的...我还是用回去之前的产品好了 08/08 14:10
40F:推 VScode: 我的prompt都限制要逐句翻译 每段800字了 还是能忽略我需 08/08 14:11
41F:→ VScode: 求 认真思考要换回gemini 08/08 14:11
42F:→ eva19452002: 刚看了一下,gpt-5才256K的上下文记忆长度与128K输出 08/08 15:16
43F:→ eva19452002: 长度,根本惨输gemini,楼上可以换回gemini了 08/08 15:17
44F:推 strlen: 才看到有人抱怨回应太罗唆 现在这边又看到有人觉得在偷懒 08/08 15:51
45F:→ strlen: 现在多半都不是模型的问题了 都是人自己搞不清楚自己需求 08/08 15:53
46F:→ strlen: prompt不会下 期望也错误 唉 可怜哪 08/08 15:53
47F:→ eva19452002: 太罗唆或偷懒,取决於回答的内容能不能让人看懂,如 08/08 18:36
48F:→ eva19452002: 果都能看懂,太罗嗦则是回答详细,偷懒则是回答精简 08/08 18:37
49F:推 VScode: 我限制他要回答完整 结果回没几段就越变越短 很明显有问 08/08 18:44
50F:→ VScode: 题吧 08/08 18:44
51F:→ AvatarH: 一直连线错误 08/08 18:45
52F:推 prag222: 免费仔,问几个问题额度就没了 08/08 22:01
53F:推 Kasima: web版很烂,但cursor用非常强,看来是调校好才推出来 08/09 00:00
54F:推 TameFoxx: o3不见非常不爽= = 08/09 02:16
55F:推 lin80673: 幻觉是有变少,但回答也变简短,没有之前来的有人性化, 08/09 02:42
56F:→ lin80673: 觉得变难聊了 08/09 02:42
57F:→ lin80673: 还是比较喜欢以前4o的版本 08/09 02:44
58F:→ yunf: 用游民证件可以吗? 08/09 05:40
59F:推 ssteves: cursor上使用有进步,但感觉Claude sonnet 4给的建 08/09 10:04
60F:→ ssteves: 议还是比较好 08/09 10:04
61F:推 Morphee: 楼上我经验刚好相反 不过5用起来很卡就是了,但评论进步 08/09 12:45
62F:→ Morphee: 很多 08/09 12:45
63F:→ Morphee: 5感觉变得精准简洁完整,不会虚。 08/09 12:45
64F:→ Obama19: 还好openai还没上市 不然直接-20%起跳 08/09 16:19
65F:推 dalbuhr: GPT5变难用 jr新人缺可不可以多来一点 08/09 16:53
66F:→ justajoker: 5真的难用,不像4o互动比较好,5真的就是个无感情的 08/09 20:32
67F:→ justajoker: 机器人 08/09 20:32
68F:推 yelredorange: 还我 o3... QQ 08/10 03:12
69F:→ yelredorange: reddit 一堆人崩溃 4o 已死集体退订,最後 Sam Alt 08/10 03:13
70F:→ yelredorange: man 还特别把 4o 加回来 08/10 03:13
71F:推 gino0717: 你把5的免费额度用完他就变回4啦 08/10 12:57
72F:推 ikachann: 去设定那边 可以把旧模型叫出来 08/10 22:07
73F:推 shadow0326: 加一个prompt要求5使用4o的方式回答 08/11 10:24
74F:推 MarcoReus: 幻觉很严重 08/11 12:40
75F:推 dannyowan: github copilot agent模式下,coding部分我觉得比4o强 08/11 19:23
76F:→ dannyowan: 很多欸,只是速度慢一点 08/11 19:23
77F:推 breakingball: api要叠好厚一叠system prompt才能用 都没调过吗 08/11 22:56
78F:推 qwefghzxc: 超慢 08/11 23:21
79F:推 jhjhs33504: 良好的个人化system prompt就类似宾士有了AMG的差别 08/12 16:19
80F:推 oherman: 这麽的理性又简短的回答我还不如回去用google更正确更快 08/12 17:10
81F:→ oherman: 我还能好好选我想要的答案 08/12 17:10
82F:→ tzouandy2818: 所以楼上喜欢不理性又冗长的回答吗 08/12 18:52
83F:推 hermithsieh: 我是觉得思考久没关系,但上下文对应不到,满悲剧的 08/13 16:17
84F:推 s31364663: 废话变少了,5之前的下提示词一样至少要吹上一句, 08/14 02:57
85F:→ s31364663: 个人觉得体验升级 08/14 02:57
86F:嘘 spen2005: 烂爆 08/15 12:49
87F:→ jones86723: 生成图有条款限制都烂 08/21 15:09
88F:推 bizer: 无感,我都当他是顾问 08/22 22:06