Soft_Job 板


LINE

最近工作上解一个问题用opus 4.6发生一个快让我笑死的状况 背景是本公司巨大的c++应用程式在某个情况下crash 喂log请AI检查後很快就查查资料改好一版 说是因为某某某情况所以本来的map找不到查询的指标 回传一个out of bound的index value 新程式新增了一段进阶检查的回圈应对特殊状况 改好後跑原本测资还是crash 把log喂回AI请他再看看 结果第二版竟然把之前的修改全部拿掉 只在上层呼叫端加一个fallback说指标找不到就直接回传0 还沾沾自喜跟我说 阿这样就绝对不会crash了 很棒吧 我只好质问agent 阿你这样只是把问题掩盖住 这样对吗? AI也毫不掩饰的说 你说得没错 我不该这样 最後AI给出的第三版总算把问题从底层修好 不禁在想第二版那种天兵解法的思路到底是怎麽出来的 是因为训练资料也包含一些菜鸟工程师的程式吗 有没有AI大神可以解释这种状况 --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 100.17.24.204 (美国)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1775271554.A.77B.html
1F:推 wei115: 不要把AI人格化....... 04/04 11:39
2F:推 yamakazi: 其实第三种和第二种同时都需要 04/04 11:48
3F:→ yamakazi: 而且後来AI还是帮你修好了,我现在都怀疑AI有时候故意装 04/04 11:49
4F:→ yamakazi: 笨,让人类保留一点优越感的错觉 04/04 11:49
5F:推 lturtsamuel: 你这个用 valgrind 跑一下就知道了 何必这样跟AI瞎扯 04/04 11:51
6F:推 yamakazi: 底层不该回传空指标,上层应该也要处理万一底层回传空指 04/04 11:53
7F:→ yamakazi: 标的问题,上层无论如何也不该crash,即使底层回传空指 04/04 11:53
8F:→ yamakazi: 标,要做错误处理。 04/04 11:53
9F:→ yamakazi: 会crash应该要给AI看coredump,log有时候就直接被中断不 04/04 11:53
10F:→ yamakazi: 会打印出哪边crash 04/04 11:54
11F:→ yamakazi: 人类解也是debug mode看死在哪或跑debug build加symbol 04/04 11:55
12F:→ yamakazi: list看core dump,除非你的程式很吃timing导致debug bui 04/04 11:55
13F:→ yamakazi: ld跑起来无法复现,debug build和releasebuild在最佳化 04/04 11:55
14F:→ yamakazi: 编译时就有差了 04/04 11:55
15F:→ cateran: 我没讲清楚 crash是因为assertion 不是空指标 04/04 12:05
16F:→ cateran: 真正的问题是什麽情况会让那个map没有该有的东西 04/04 12:06
17F:→ cateran: 所以是商业逻辑问题 不是单纯空指标crash 04/04 12:07
18F:→ cateran: AI还是蛮强的 因为这问题已经好几年没人真的修好 04/04 12:08
19F:→ cateran: 有很多层都是AI第二版那种解法orz 04/04 12:09
20F:推 yamakazi: 人工加的assert()?那不是只有debug build才会有作用 04/04 12:13
21F:→ yamakazi: ? 04/04 12:13
22F:→ cateran: 因为是逻辑问题 所以valgrind也没用 而且还要跑十几小时 04/04 12:14
23F:→ cateran: 是内部测试QA发给我们处理的bug 04/04 12:15
24F:→ cateran: 所以才会触发assertion 04/04 12:15
25F:→ Obama19: 你的prompt决定ai输出水平 看起来是你的问题比较大 04/04 12:28
26F:推 SweetBreaker: 可以知道 AI 时代,还是需要人类 code review 04/04 13:08
27F:嘘 USD5566: 这种回你fb发就好了 04/04 13:17
28F:推 ssteves: 用AI来debug 我都先请它先产生分析报告,先描述问 04/04 14:04
29F:→ ssteves: 题现象 +root cause analysis+建议修正方案,然後 04/04 14:04
30F:→ ssteves: 把分析报告丢给另一个AI agent审查一次,确认合理 04/04 14:04
31F:→ ssteves: 性,来回几次找出最推荐的修正方案。 04/04 14:04
32F:推 blackrays: 资深工程师的价值就在这边啊 何必跟AI执着 04/04 19:18
33F:推 chita0258: /insights 04/04 19:18
34F:推 viper9709: 解决不了问题就解决发现问题的人(咦) 04/04 19:42
35F:推 strlen: 抓bug你应该用GPT 5.4 opus幻觉比较多 04/04 20:24
36F:推 yiche: 同一楼 04/04 21:20
37F:→ l42857: 你是工程师 对待AI幻觉怎麽像一般人一样的想法 04/04 23:08
38F:→ sarsman: AI本质是文字接龙,接哪个字是从几个机率高的选项中抽选 04/05 00:08
39F:→ sarsman: 的,因此脸黑的话就有可能抽到不理想的结果,也就是幻觉 04/05 00:08
40F:推 NDark: 图灵测试整个反过来了 现在是人类的反应比较有研究价值 04/05 09:04
41F:嘘 USD5566: 不是 这里居然花时间在讨论语言模型的人性? 你们真的是 04/05 11:48
42F:→ USD5566: 工程师吗… 04/05 11:48
43F:→ USD5566: 这一题直接删文根本不用浪费时间好不好== 04/05 11:48
44F:→ sarsman: 触,但凡有稍微看过一点原理的人都知道这是浪费时间 04/05 14:11
45F:→ sarsman: 问题是现在越来越多人放弃深究,只凭感觉认定AI有人性== 04/05 14:13
46F:推 galaxy4552: 说穿了AI说话像人就是AI学训练资料的内容口气像人 04/05 14:38
47F:推 hooll111: 你的上下文没有说这样不行啊 怪AI勒 04/05 14:54
48F:嘘 Romulus: 这和把大自然神格化有异曲同工之妙 04/05 15:31
49F:推 shadow0326: 你有没有发现让AI多试几回合就OK了,所以赶快多装一些 04/05 21:01
50F:→ shadow0326: 自我质疑深度思考的skills,多花一些token多花一些钱 04/05 21:02
51F:→ shadow0326: 就可以解决你的问题 04/05 21:02
52F:嘘 tzouandy2818: 唉 04/06 22:44
53F:推 wade2432: ai的本质不就是机率吗,那给不一样的答案很正常啊,怎 04/07 10:23
54F:→ wade2432: 麽会是人性 04/07 10:23
55F:推 CoNsTaR: 现在除非是要长期负责任的 code 否则我全部都当成垃圾 co 04/07 14:06
56F:→ CoNsTaR: de 100% 交给 AI 乱搞,反正我也没打算要亲自动这些 code 04/07 14:06
57F:→ CoNsTaR: ,AI 自己弄出来的东西他有办法继续达成我的需求他想怎 04/07 14:06
58F:→ CoNsTaR: 麽乱写随便他,反正在他把整个东西搞烂以前我大概也不需 04/07 14:06
59F:→ CoNsTaR: 要这个专案了 04/07 14:06
60F:推 bnd0327: 改完後验证应该要包含在 agent loop 里面 04/07 14:56
61F:→ bnd0327: 假如它自己改自己验证了三回最後给你改好的版本,你也不 04/07 14:57
62F:→ bnd0327: 用PO这篇 04/07 14:57
63F:→ abccbaandy: 自我验证有时候不停损你的额度就QQ了 04/07 21:20







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:e-shopping站内搜寻

TOP