作者strlen (strlen)
看板Stock
标题Re: [新闻] ChatGPT-5波折超乎想象!奥特曼急回应:
时间Sun Aug 10 15:11:20 2025
放大假闲来无事
正好一堆AI公司推新品
无职码农就再来测试测试
半年前DS之乱时
测过让各家AI写一个注册页
现在我把同样提示词再让各家AI做一次
看看有多少进步
Gemini 2.5 pro:
https://thelonesomeera.com/signuptest/gemini.html
ChatGPT 5 thinking:
https://thelonesomeera.com/signuptest/chatgpt.html
Claude sonnet 4:
https://thelonesomeera.com/signuptest/claude.html
Grok 4 Heavy:
https://thelonesomeera.com/signuptest/grok.html
Deepseek R1:
https://thelonesomeera.com/signuptest/deepseek.html
Qwen:
https://thelonesomeera.com/signuptest/qwen.html
以上提示词都完全一样
各家表现大差不差
但多多少少都有些小bug
这部份就算大家都进步到差不多的程度
既然过了半年
那就要有相对应更进阶的测试 对吧?
所以这次追加了以下提示词
「请使用 HTML 前端技术
制作一个模拟太阳系的网页
相关程式请集中在一个 html 档案」
Gemini 2.5 pro:
https://thelonesomeera.com/solarsystem/gemini.html
ChatGPT 5 thinking:
https://thelonesomeera.com/solarsystem/chatgpt.html
Claude sonnet 4:
https://thelonesomeera.com/solarsystem/claude.html
Grok 4 Heavy:
https://thelonesomeera.com/solarsystem/grok.html
Deepseek R1:
https://thelonesomeera.com/solarsystem/deepseek.html
Qwen:
https://thelonesomeera.com/solarsystem/qwen.html
喔喔喔
这个需求就蛮有监别度了
大家可以自己比较一下呵呵
方便浏览的集成页:
https://thelonesomeera.com/ai-hub.html
最後是股点
这样测下来
有点让我想出掉狗家股票勒
狗狗
加油
好呗?
嗯.....
备注:
以上网页完全没有写到任何一行程式码
全都是复制贴上
应该说我连看都没看...
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.160.12.18 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1754809899.A.9AD.html
※ 编辑: strlen (1.160.12.18 台湾), 08/10/2025 15:15:12
1F:推 lianli1024 : 狗家在干嘛笑死 08/10 15:15
2F:→ LDPC : QQ 好强 大大 08/10 15:17
码农吃饱太闲而已 不强 QQ
※ 编辑: strlen (1.160.12.18 台湾), 08/10/2025 15:19:27
3F:推 ga0952briel : 狗家还以为是太阳要把大家吃掉XD 08/10 15:20
4F:推 sdbb : 好强,谢谢,好险上周没有加码googl 08/10 15:21
5F:→ sdbb : 或说各家各有擅长 08/10 15:22
6F:→ LDPC : 前阵子西洋棋大赛 狗狗被grok干掉了QQ 08/10 15:22
8F:推 capssan : 我觉得办比赛一定是未来AI的看点之一 08/10 15:35
9F:→ capssan : 问题就是要办什麽比赛了 08/10 15:35
10F:推 sdbb : Ani跳啦啦队大赛 08/10 15:38
11F:嘘 KANGTA23 : 臭谷狗就是嘘而已没啥好说了,比栅栏仔还不如 08/10 15:39
哥 狗我也有持骨齁...
12F:推 TaiwanUp : GPT的还是最完整 轨道可以缩放 只是太阳大小不会变 08/10 16:02
13F:→ TaiwanUp : 轨道缩太小会像是类地行星都被太阳包覆 08/10 16:03
14F:→ TaiwanUp : GPTc96u.3 08/10 16:03
15F:→ TaiwanUp : GPT还有时间 冥王星勾选 08/10 16:05
16F:→ TaiwanUp : 能用GPT>Claude 堪用DS>Grok 不能用Qwen>Gemini 08/10 16:08
※ 编辑: strlen (1.160.12.18 台湾), 08/10/2025 16:09:53
17F:→ TaiwanUp : 我看到的Qwen永远九星连珠 08/10 16:10
18F:→ lavign : 棋类完全资讯游戏都有先手优势,不让子或双循环根 08/10 16:22
19F:→ lavign : 本不准 08/10 16:22
20F:→ eemail : 就出一题而已 08/10 16:28
21F:→ tw19930419 : 到时候Google又有更强模型出来,然後配他的全家桶 08/10 16:31
22F:→ tw19930419 : 你只能哭在路边 08/10 16:31
23F:→ watashino : 用同一个prompt不一定是个好主意 能看看具体的promp 08/10 16:39
24F:→ watashino : t吗 08/10 16:39
25F:→ TaiwanUp : 只有GPT轨道稍微正确 其他的九轨道都等距 不合理 08/10 16:45
26F:推 mamorui : 我现在用Cloude 08/10 16:58
27F:→ qxpbyd : Gemini2.5pro你是用AI Studio的还是Gemini版的? 08/10 17:03
28F:嘘 champion0922: 一直撞一直爽 08/10 17:03
29F:→ qxpbyd : 我用你的prompt 太阳系不会错成那样 08/10 17:03
30F:推 stepnight : 窝只能说写Code,Gemini 就是一坨 08/10 17:07
31F:推 jerrychuang : 可是notebooklm很好用耶 08/10 17:22
32F:推 TameFoxx : Gemini强项就不在coding 08/10 18:18
33F:嘘 maplefff : 这种题目没有办法体现Gemini 2.5 Pro 1M上下文优势 08/10 18:24
34F:→ maplefff : 等到你的专案足够复杂, 足够大, 其他模型如同不停 08/10 18:25
35F:→ maplefff : 失忆的新人, 必须反覆阅读技术文档, 你就知道差距了 08/10 18:25
36F:→ lavign : 有限空间解的问题测试才能知道基本推理能力的强弱 08/10 18:30
37F:→ maplefff : 这种问题等於考99x99乘法表来考验哈佛,剑桥,史丹佛 08/10 18:34
38F:→ maplefff : 数学博士生的数学能力. 除了显示谁99x99乘法表背得 08/10 18:34
39F:→ maplefff : 熟以外, 跟数学能力根本无关 08/10 18:35
40F:推 Adrian : Gemini 画图很不错 其他烂烂的 08/10 19:11
41F:→ Atwo : 很有趣耶 让我想试做看看托勒密的地心说模型 08/10 20:05
42F:推 KTFGU : 写程式不要用google 08/10 21:34
43F:→ medama : 没有冥王星吗 08/11 00:46
44F:推 donkilu : Gemini真的很搞 08/11 02:37
45F:推 Toge : Gemini喔,去 reddit 找一堆崩溃图,还会给你删 co 08/11 07:27
46F:→ Toge : de 呵呵 08/11 07:27
47F:推 Toge : 之前用它还直接给我 git reset --hard,干 08/11 07:31
48F:推 cvn21 : Gemini 适合做大量重复无聊的工作,比如说提取超长 08/11 09:10
49F:→ cvn21 : 文中出现多次,不同但有一定特徵的资料 08/11 09:10
50F:→ cvn21 : 这种用GPT 都会偷懒,找个三四个就开始瞎掰 08/11 09:10
51F:→ cvn21 : 用在研究上把乱七八糟raw data转换成表格还行,这种 08/11 09:12
52F:→ cvn21 : 超无聊的工作用GPT从来没弄好过 08/11 09:12
53F:推 staytuned74 : 你把题目换成解微积分给他pdf 考古题,最强可能就 08/11 11:16
54F:→ staytuned74 : 变成pro2.5了 08/11 11:16
55F:→ staytuned74 : 其他家可能解两题就开始像上面讲的偷懒不解了 08/11 11:18
56F:→ staytuned74 : 然後gpt5 现在糟糕到吃不进去非文字解析pdf 其他家 08/11 11:19
57F:→ staytuned74 : 都可,就知道出多大包了 08/11 11:19