Gossiping 板


LINE

刚推出出来的时候我拿了几题逻辑题出来考他 正确率很高我很惊喜觉得太神啦 刚刚看到下面推文 说他答不出来9.9跟9.11谁比较大 我想说不可能这麽简单的答不出来吧 就测试了一下 结果…下面是我的对话 真的答不出来 我还试着引导他用程式来解决 但完全没有帮助 这代幻觉好像更严重了 连你质疑他都不会想改答案 我相信未来能解决的 我比较担心一些人开始依赖他把他当google 他们会逐渐丧失辨别真伪 的能力 AI输出什麽就是什麽 AI犯错不可怕 可怕的是犯错了没人知道他犯错了 https://youtu.be/4EayaPNo6pk?si=XPOsISjXtbvi7cQA
--



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 122.99.24.246 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Gossiping/M.1726510781.A.B75.html
1F:→ qw99992: 辨别不了真伪的慢慢就会被职场淘汰64.114.211.68 09/17 02:20
2F:推 void: 你讲的最後一段早就发生了 一些白痴好像完全67.188.8.241 09/17 02:20
当模型能力越强 信赖就会越深…有一天会有一群人相信9.9<9.11
3F:→ void: 不懂AI会无中生有编假的答案给你 连验证都不67.188.8.241 09/17 02:21
4F:→ void: 知道要做 还有ChatGPT以後就不需要估狗 笑死67.188.8.241 09/17 02:21
※ 编辑: imhan705 (122.99.24.246 台湾), 09/17/2024 02:21:55
5F:→ void: 不用什麽模型能力强 第一代GPT就有这问题了67.188.8.241 09/17 02:22
6F:推 void: 如果你熟悉的东西你还知道它在唬烂 如果是67.188.8.241 09/17 02:24
7F:→ void: 你完全外行的领域 你连它在唬烂都看不出来67.188.8.241 09/17 02:24
8F:推 TaiwanUp: 看起来是当成日期了 中文问答较差119.14.30.29 09/17 02:24
那他的算式意思是9月9日-9月11日=-0月21日罗
9F:→ void: 偏偏现在一堆XX GPT讲什麽就信什麽 只能说8767.188.8.241 09/17 02:25
10F:→ void: Bing会附上reference这点是好很多 但性能差67.188.8.241 09/17 02:25
11F:→ TaiwanUp: 九月11确实比九月九大119.14.30.29 09/17 02:26
12F:推 void: 谁来试一下13.11和13.9看看? 这不可能是日期67.188.8.241 09/17 02:27
他答对了 但就如我所说 真真假假 才是最可怕的 https://i.imgur.com/Gg3qyuk.png
13F:→ void: 会不会上面这个就答对了不会出错?67.188.8.241 09/17 02:27
14F:推 swgun: 问问AI 如何用数学证明9.1大於9.949.216.16.224 09/17 02:28
15F:→ swgun: 说不定你发现AI 才是世界真理49.216.16.224 09/17 02:28
※ 编辑: imhan705 (122.99.24.246 台湾), 09/17/2024 02:28:35
16F:推 jamo: 我感觉ai的正确率也不比记者低,在特定议题 36.231.80.70 09/17 02:28
17F:→ jamo: 睁眼说瞎话程度两者相当。记者的话都有人在36.231.80.70 09/17 02:28
18F:→ jamo: 信了,信AI看起来也就没那麽不可接受了吧?36.231.80.70 09/17 02:29
19F:推 dans: 都说9.9-9.11=-0.21了,所以实际上是把9.11 150.117.58.153 09/17 02:29
20F:→ dans: 当作10.11,感觉只是小错 150.117.58.153 09/17 02:29
可是我要他验算的时候抓不出来啊 他一直自圆其说 ※ 编辑: imhan705 (122.99.24.246 台湾), 09/17/2024 02:30:31 ※ 编辑: imhan705 (122.99.24.246 台湾), 09/17/2024 02:31:55
21F:推 williambox: 除了文书处理外 还是小心求证得好... 1.200.247.112 09/17 02:32
22F:推 dans: ChatGPT本来就瞎掰王了,是你打开的房市错 150.117.58.153 09/17 02:33
我觉得离谱的地方是我请他用程式来计算了 他直接无视程式的输出 继续讲他的
23F:→ dans: 了150.117.58.153 09/17 02:33
24F:→ williambox: 最近职场上真的很常听到"可是GPT说...1.200.247.112 09/17 02:33
25F:→ williambox: " 嗯... 好唷 1.200.247.112 09/17 02:33
26F:推 dans: https://i.imgur.com/ciUv1ah.jpeg 150.117.58.153 09/17 02:35
27F:→ dans: 我成功教育瞎掰王把13.11也算错了150.117.58.153 09/17 02:35
XD ※ 编辑: imhan705 (122.99.24.246 台湾), 09/17/2024 02:37:17
28F:推 photoswimmer: 感觉人类哪天被AI灭了也会是因为一 1.200.188.65 09/17 02:38
29F:→ photoswimmer: 些愚蠢的逻辑错误 1.200.188.65 09/17 02:38
想像哪天全人类要移民火星了 结果AI分不清楚9.9 9.11谁大 太空船路线直接冲向太阳 然 後船上的人也都不觉得有问题XD
30F:推 DarkerDuck: https://i.imgur.com/kFscaRK.png 1.172.122.135 09/17 02:38
31F:→ DarkerDuck: FUCK 1.172.122.135 09/17 02:38
※ 编辑: imhan705 (122.99.24.246 台湾), 09/17/2024 02:41:26
32F:推 GOD5566: https://i.imgur.com/JEHs9I4.jpeg 39.9.133.39 09/17 02:42
33F:推 cccwahaha: 工程用的模型不一样就是了XDXD 36.226.99.77 09/17 02:44
34F:→ cccwahaha: 其实也很多在质疑目前AI的逻辑训练方式 36.226.99.77 09/17 02:45
35F:→ cccwahaha: 反正未来谁能更准确更厉害.谁就是对的 36.226.99.77 09/17 02:47
36F:推 dans: 现实没有所谓「最准确、最合理」若一直用这 150.117.58.153 09/17 02:50
37F:→ dans: 标准去训练AI模型,就只会持续做出瞎掰王 150.117.58.153 09/17 02:50
38F:推 joywilliamjo: 那问他0.1+0.2是否等於0.3这个经典 1.200.138.164 09/17 02:54
39F:→ joywilliamjo: 问题呢 1.200.138.164 09/17 02:54
40F:推 TameFoxx: 用9.90-9.11问她 他就会了 58.114.188.80 09/17 02:54
41F:推 YAYA6655: 他是语文模型 本身是不懂的思考的 可悲 59.126.16.9 09/17 02:55
42F:→ WenliYang: 无聊的AI 走倒退路罢了 1.164.117.195 09/17 02:55
43F:→ YAYA6655: 若这种都不会,AI真的会泡沫化 zzz 59.126.16.9 09/17 02:56
44F:嘘 twoboy: 9.9<9.11? 你傻了吗? 49.231.223.84 09/17 03:00
45F:→ enthpzd: 你问它:我可不可以说1+1=3。 101.136.70.229 09/17 03:14
46F:推 cassetoi: 不用问数学,问chatgpt raspberry 有几 69.172.157.88 09/17 03:14
47F:→ cassetoi: 个r,它不会说3个,因为它不是真的给你 69.172.157.88 09/17 03:14
48F:→ cassetoi: 乖乖去算 69.172.157.88 09/17 03:15
49F:推 starfishfish: 推 42.79.200.248 09/17 03:15
50F:嘘 mimi1020b: 你讲的这些不就是人类行为吗 1.171.219.238 09/17 03:31
51F:→ mimi1020b: 假做真时真亦假 不代表AI就是人了? 1.171.219.238 09/17 03:32
52F:推 milkBK: https://i.imgur.com/A67Tbs5.png 114.32.129.203 09/17 03:45
53F:→ milkBK: 第一次回答错误 叫他写证明 114.32.129.203 09/17 03:45
54F:推 milkBK: https://i.imgur.com/vybXaj3.png 114.32.129.203 09/17 03:50
55F:→ milkBK: 用程式也没问题啊 你用盗版吗 114.32.129.203 09/17 03:51
56F:推 dovepacket: 他就只是个大数据而已 没多神 111.253.164.3 09/17 04:12
57F:→ JoeyChen: 为啥copilot也会答错 61.65.254.33 09/17 04:12
58F:→ JoeyChen: 两个AI都答错 大数据里应该不是这样吧 61.65.254.33 09/17 04:17
59F:→ AtsukoErika: https://i.imgur.com/w1Pu6ZH.jpeg124.218.202.169 09/17 04:18
60F:→ AtsukoErika: 累死 终於矫正成功124.218.202.169 09/17 04:18
61F:推 graysinger: 我的还真的不会算耶,还给错误的证明 36.224.138.148 09/17 04:27
62F:→ graysinger: ,整个废到笑 36.224.138.148 09/17 04:27
63F:→ graysinger: http://i.imgur.com/uYTxOhW.jpg 36.224.138.148 09/17 04:28
64F:推 graysinger: http://i.imgur.com/Nd3ZGwy.jpg 36.224.138.148 09/17 04:32
65F:推 dovepacket: 恭喜掰正 111.253.164.3 09/17 04:32
66F:→ JoeyChen: gray大 它方法1是对的耶 61.65.254.33 09/17 04:34
67F:推 Chilloutt: 看不出ai对错的比ai还敢更糟 223.137.2.102 09/17 04:36
68F:推 graysinger: ai这种错中有对,对中有错最让人害怕 36.224.138.148 09/17 04:42
69F:推 lau6m2002: 真的有在用的都知道AI超会唬烂。 但现 49.195.62.60 09/17 05:25
70F:→ lau6m2002: 在真的有白痴把AI产出当成正确的证据 49.195.62.60 09/17 05:25
71F:推 MrCool5566: 只要加写出你的思考过程就会对了223.137.182.253 09/17 05:47
72F:推 eric112: 刚下试了一下发现它干话讲的很有道理, 36.233.250.123 09/17 05:53
73F:→ eric112: 我差点以为我错了 36.233.250.123 09/17 05:53
74F:推 nalthax: 在法界早就发生了 111.255.233.32 09/17 06:06
75F:→ jasperhai: 早就一堆人把AI当神 毫无判断能力了 111.185.73.132 09/17 06:31
76F:推 menchian: ai目前错误还是很多,碰到不知道的事情125.231.227.195 09/17 06:38
77F:→ menchian: 还会随便唬烂,但可悲的是一堆低能儿跟125.231.227.195 09/17 06:39
78F:→ menchian: 你讨论事情时只会拿ai的回答当佐证125.231.227.195 09/17 06:39
79F:推 menchian: http://i.imgur.com/yGZWb0X.jpg125.231.227.195 09/17 06:41
80F:→ menchian: 比如像这样乱算一通125.231.227.195 09/17 06:41
81F:推 mugen8521: 挺有趣的http://i.imgur.com/q43ByON.j 101.8.32.122 09/17 06:42
82F:→ mugen8521: pg 101.8.32.122 09/17 06:42
83F:→ mugen8521: http://i.imgur.com/xbV1l0M.jpg 101.8.32.122 09/17 06:43
84F:→ eva19452002: 但是这题用google gemini就有答对 118.232.66.139 09/17 06:48
85F:推 jacky5827: 无法辨别真伪的,用google只会更惨 124.218.216.64 09/17 07:18
86F:推 Taiwanfish: https://i.imgur.com/ywkUfIR.jpeg 1.161.60.63 09/17 07:30
87F:推 uwptd: 完美模拟台湾司法133.159.153.188 09/17 07:34
88F:推 laugh8562: ChatGPT是数学白痴 应该说他的模型就 219.70.223.154 09/17 08:04
89F:→ laugh8562: 不是用来算这个的 219.70.223.154 09/17 08:04
90F:推 Ernest: 算数学要数学特化的ai,有人做 116.89.136.145 09/17 08:07
91F:→ riker729: 这不叫AI 没有分辨能力 喂他屎他就出屎111.251.237.193 09/17 08:18
92F:推 Isopod: https://i.imgur.com/2rqY1JJ.jpeg 111.250.18.97 09/17 08:29
93F:→ Isopod: prompt要下好 111.250.18.97 09/17 08:29
94F:推 WFU: 你的问法不对 问9.90跟9.11哪个比较大就行了 118.169.93.56 09/17 08:50
95F:推 graysinger: 没救耶http://i.imgur.com/lckvyKy.jp 36.224.138.148 09/17 08:52
96F:→ graysinger: g 36.224.138.148 09/17 08:52
97F:→ graysinger: http://i.imgur.com/TgF0Cw6.jpg 36.224.138.148 09/17 08:53
98F:推 joke3547: o1好像会说服人,蛮恐怖的 42.73.72.49 09/17 09:00
99F:推 pftmax: 不是Ai犯错,而是答案本来就没对错 39.12.73.128 09/17 09:03
100F:→ pftmax: 逆向思考,也许错的答案也是对的 39.12.73.128 09/17 09:03
101F:推 qzwse: 真的没救 123.240.86.187 09/17 09:07
102F:→ qzwse: https://i.imgur.com/7llItn2.jpeg 123.240.86.187 09/17 09:07
103F:→ qzwse: 结论 123.240.86.187 09/17 09:10
104F:→ qzwse: 数学部分 相信AI程式码执行出来的东西 不 123.240.86.187 09/17 09:10
105F:→ qzwse: 要直接相信AI 123.240.86.187 09/17 09:10
106F:推 holypiggy: 确定只有数学部份吗 219.91.90.70 09/17 09:11
107F:推 qzwse: gpt4 反而没有这个问题 123.240.86.187 09/17 09:13
108F:→ qzwse: https://i.imgur.com/HHVxWav.jpeg 123.240.86.187 09/17 09:13
109F:推 Townshend: 试了一下还真的分不出9.9 跟9.11谁大, 39.15.40.232 09/17 09:23
110F:→ Townshend: copilot的理由是9.9可当成9.90, 比较 39.15.40.232 09/17 09:23
111F:→ Townshend: 尾数1>0,所以9.11比较大。真是笨的不 39.15.40.232 09/17 09:23
112F:→ Townshend: 可思议 39.15.40.232 09/17 09:23
113F:推 XiaoChing221: 就问的方式他听不懂,别怪工具不好 223.136.240.33 09/17 09:36
114F:推 Townshend: 连问9.9跟9.11哪个数字大也听不懂,还 39.15.40.232 09/17 09:56
115F:→ Townshend: 不能怪ai不好? 39.15.40.232 09/17 09:57
116F:推 Townshend: https://imgur.com/q3ms5sW 39.15.40.232 09/17 09:59
117F:推 Townshend: 这样问又知道答案 不晓得问题出在哪 39.15.40.232 09/17 10:00
118F:推 LDY97: 结果他还把9.90-9.11=0.79改成错的 笑烂123.205.180.112 09/17 10:11
119F:推 acluke: 开始让我怀疑9.9是不是9.90了122.116.249.182 09/17 10:18
120F:→ pengda200010: 9.9 and 9.11 are both float which 119.14.155.15 09/17 10:34
121F:推 wiork: 对啊,缺点只能不要太深入的问题,还要检 61.230.70.188 09/17 10:46
122F:→ wiork: 视答案 61.230.70.188 09/17 10:46
123F:→ deray: 微软的copilot真他妈辣鸡118.165.166.173 09/17 10:50
124F:推 DarkerDuck: o1幻觉更严重不意外啊 1.172.122.135 09/17 10:53
125F:→ patvessel: https://reurl.cc/dyq0ez 125.229.28.82 09/17 10:53
126F:→ DarkerDuck: LLM本来就有幻觉,你还CoT串起来叠加 1.172.122.135 09/17 10:54
127F:→ DarkerDuck: https://i.imgur.com/EZiE3SL.png 1.172.122.135 09/17 10:54
128F:→ DarkerDuck: 这就是为什麽有些问题o1表现更鬼扯 1.172.122.135 09/17 10:56
129F:→ DarkerDuck: 至於9.9和9.11的问题在於LLM的全名是 1.172.122.135 09/17 11:01
130F:→ DarkerDuck: arge language model 1.172.122.135 09/17 11:01
131F:→ DarkerDuck: Large language model 1.172.122.135 09/17 11:01
132F:→ DarkerDuck: 它处理的最小单位是语言中的单字token 1.172.122.135 09/17 11:02
133F:→ DarkerDuck: 不是设计用来处理数字的 1.172.122.135 09/17 11:02
134F:→ karta1271642: 他就不会推理啊223.137.157.178 09/17 12:17
135F:嘘 hotrain13: 他就不是拿来问数学的.... 122.99.15.229 09/17 12:27
136F:嘘 vincent8914: 根本是你问错方式 谁知道你问的是日223.136.198.190 09/17 13:17
137F:→ vincent8914: 期 版本号 还是数值?期待AI通灵?223.136.198.190 09/17 13:18
138F:→ AoWsL: 9.9跟9.11这数学问题讨论很多次吧...我还测 111.71.20.4 09/17 13:20
139F:→ AoWsL: 试了一下大部分的AI,GPT4o刚开始还会跟你 111.71.20.4 09/17 13:20
140F:→ AoWsL: 硬拗不认错 111.71.20.4 09/17 13:20
141F:→ AoWsL: 喔好像只有gemini答对是不是? 111.71.20.4 09/17 13:23
142F:推 hhealthy0429: 没有背景知识能力使用generative a 68.45.21.105 09/17 13:46
143F:→ hhealthy0429: i 帮助有限 68.45.21.105 09/17 13:46
144F:推 losage: 有没有可能ai的推论才是真的 111.82.220.27 09/17 15:10
145F:推 abbag: 开始虎烂不认错後,信任度下降就惨了XD 123.194.188.56 09/17 15:26
146F:推 a0521487241: https://i.imgur.com/BcxpNTC.jpeg 203.204.103.71 09/17 20:36
147F:→ a0521487241: 我是叫他再想想就正确了 203.204.103.71 09/17 20:37
148F:嘘 XiaoChing221: 表达能力有问题嫌工具烂 223.136.240.33 09/17 21:40
149F:→ wulitou: https://i.imgur.com/q9FxQU1.jpeg 36.230.26.148 09/19 11:27







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:BabyMother站内搜寻

TOP