作者imhan705 (最後也就睡了)

看板Gossiping

标题

Re: [爆卦] OpenAI 新模型o1轻松考上台大资工/台大

时间Tue Sep 17 02:19:39 2024

刚推出出来的时候我拿了几题逻辑题出来考他正确率很高我很惊喜觉得太神啦刚刚看到下面推文说他答不出来9.9跟9.11谁比较大我想说不可能这麽简单的答不出来吧就测试了一下结果…下面是我的对话真的答不出来我还试着引导他用程式来解决但完全没有帮助这代幻觉好像更严重了连你质疑他都不会想改答案我相信未来能解决的我比较担心一些人开始依赖他把他当google 他们会逐渐丧失辨别真伪的能力 AI输出什麽就是什麽 AI犯错不可怕可怕的是犯错了没人知道他犯错了 https://youtu.be/4EayaPNo6pk?si=XPOsISjXtbvi7cQA

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 122.99.24.246 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Gossiping/M.1726510781.A.B75.html

1^F：→ qw99992: 辨别不了真伪的慢慢就会被职场淘汰64.114.211.68 09/17 02:20

2^F：推 void: 你讲的最後一段早就发生了一些白痴好像完全67.188.8.241 09/17 02:20

当模型能力越强信赖就会越深…有一天会有一群人相信9.9<9.11

3^F：→ void: 不懂AI会无中生有编假的答案给你连验证都不67.188.8.241 09/17 02:21

4^F：→ void: 知道要做还有ChatGPT以後就不需要估狗笑死67.188.8.241 09/17 02:21

※ 编辑: imhan705 (122.99.24.246 台湾), 09/17/2024 02:21:55

5^F：→ void: 不用什麽模型能力强第一代GPT就有这问题了67.188.8.241 09/17 02:22

6^F：推 void: 如果你熟悉的东西你还知道它在唬烂如果是67.188.8.241 09/17 02:24

7^F：→ void: 你完全外行的领域你连它在唬烂都看不出来67.188.8.241 09/17 02:24

8^F：推 TaiwanUp: 看起来是当成日期了中文问答较差119.14.30.29 09/17 02:24

那他的算式意思是9月9日-9月11日=-0月21日罗

9^F：→ void: 偏偏现在一堆XX GPT讲什麽就信什麽只能说8767.188.8.241 09/17 02:25

10^F：→ void: Bing会附上reference这点是好很多但性能差67.188.8.241 09/17 02:25

11^F：→ TaiwanUp: 九月11确实比九月九大119.14.30.29 09/17 02:26

12^F：推 void: 谁来试一下13.11和13.9看看? 这不可能是日期67.188.8.241 09/17 02:27

他答对了但就如我所说真真假假才是最可怕的 https://i.imgur.com/Gg3qyuk.png

13^F：→ void: 会不会上面这个就答对了不会出错?67.188.8.241 09/17 02:27

14^F：推 swgun: 问问AI 如何用数学证明9.1大於9.949.216.16.224 09/17 02:28

15^F：→ swgun: 说不定你发现AI 才是世界真理49.216.16.224 09/17 02:28

※ 编辑: imhan705 (122.99.24.246 台湾), 09/17/2024 02:28:35

16^F：推 jamo: 我感觉ai的正确率也不比记者低，在特定议题 36.231.80.70 09/17 02:28

17^F：→ jamo: 睁眼说瞎话程度两者相当。记者的话都有人在36.231.80.70 09/17 02:28

18^F：→ jamo: 信了，信AI看起来也就没那麽不可接受了吧?36.231.80.70 09/17 02:29

19^F：推 dans: 都说9.9-9.11=-0.21了，所以实际上是把9.11 150.117.58.153 09/17 02:29

20^F：→ dans: 当作10.11，感觉只是小错 150.117.58.153 09/17 02:29

可是我要他验算的时候抓不出来啊他一直自圆其说 ※ 编辑: imhan705 (122.99.24.246 台湾), 09/17/2024 02:30:31 ※ 编辑: imhan705 (122.99.24.246 台湾), 09/17/2024 02:31:55

21^F：推 williambox: 除了文书处理外还是小心求证得好... 1.200.247.112 09/17 02:32

22^F：推 dans: ChatGPT本来就瞎掰王了，是你打开的房市错 150.117.58.153 09/17 02:33

我觉得离谱的地方是我请他用程式来计算了他直接无视程式的输出继续讲他的

23^F：→ dans: 了150.117.58.153 09/17 02:33

24^F：→ williambox: 最近职场上真的很常听到"可是GPT说...1.200.247.112 09/17 02:33

25^F：→ williambox: " 嗯... 好唷 1.200.247.112 09/17 02:33

26^F：推 dans: https://i.imgur.com/ciUv1ah.jpeg 150.117.58.153 09/17 02:35

27^F：→ dans: 我成功教育瞎掰王把13.11也算错了150.117.58.153 09/17 02:35

XD ※ 编辑: imhan705 (122.99.24.246 台湾), 09/17/2024 02:37:17

28^F：推 photoswimmer: 感觉人类哪天被AI灭了也会是因为一 1.200.188.65 09/17 02:38

29^F：→ photoswimmer: 些愚蠢的逻辑错误 1.200.188.65 09/17 02:38

想像哪天全人类要移民火星了结果AI分不清楚9.9 9.11谁大太空船路线直接冲向太阳然後船上的人也都不觉得有问题XD

30^F：推 DarkerDuck: https://i.imgur.com/kFscaRK.png 1.172.122.135 09/17 02:38

31^F：→ DarkerDuck: FUCK 1.172.122.135 09/17 02:38

※ 编辑: imhan705 (122.99.24.246 台湾), 09/17/2024 02:41:26

32^F：推 GOD5566: https://i.imgur.com/JEHs9I4.jpeg 39.9.133.39 09/17 02:42

33^F：推 cccwahaha: 工程用的模型不一样就是了XDXD 36.226.99.77 09/17 02:44

34^F：→ cccwahaha: 其实也很多在质疑目前AI的逻辑训练方式 36.226.99.77 09/17 02:45

35^F：→ cccwahaha: 反正未来谁能更准确更厉害.谁就是对的 36.226.99.77 09/17 02:47

36^F：推 dans: 现实没有所谓「最准确、最合理」若一直用这 150.117.58.153 09/17 02:50

37^F：→ dans: 标准去训练AI模型，就只会持续做出瞎掰王 150.117.58.153 09/17 02:50

38^F：推 joywilliamjo: 那问他0.1+0.2是否等於0.3这个经典 1.200.138.164 09/17 02:54

39^F：→ joywilliamjo: 问题呢 1.200.138.164 09/17 02:54

40^F：推 TameFoxx: 用9.90-9.11问她他就会了 58.114.188.80 09/17 02:54

41^F：推 YAYA6655: 他是语文模型本身是不懂的思考的可悲 59.126.16.9 09/17 02:55

42^F：→ WenliYang: 无聊的AI 走倒退路罢了 1.164.117.195 09/17 02:55

43^F：→ YAYA6655: 若这种都不会，AI真的会泡沫化 zzz 59.126.16.9 09/17 02:56

44^F：嘘 twoboy: 9.9<9.11? 你傻了吗？ 49.231.223.84 09/17 03:00

45^F：→ enthpzd: 你问它：我可不可以说1+1=3。 101.136.70.229 09/17 03:14

46^F：推 cassetoi: 不用问数学，问chatgpt raspberry 有几 69.172.157.88 09/17 03:14

47^F：→ cassetoi: 个r，它不会说3个，因为它不是真的给你 69.172.157.88 09/17 03:14

48^F：→ cassetoi: 乖乖去算 69.172.157.88 09/17 03:15

49^F：推 starfishfish: 推 42.79.200.248 09/17 03:15

50^F：嘘 mimi1020b: 你讲的这些不就是人类行为吗 1.171.219.238 09/17 03:31

51^F：→ mimi1020b: 假做真时真亦假不代表AI就是人了? 1.171.219.238 09/17 03:32

52^F：推 milkBK: https://i.imgur.com/A67Tbs5.png 114.32.129.203 09/17 03:45

53^F：→ milkBK: 第一次回答错误叫他写证明 114.32.129.203 09/17 03:45

54^F：推 milkBK: https://i.imgur.com/vybXaj3.png 114.32.129.203 09/17 03:50

55^F：→ milkBK: 用程式也没问题啊你用盗版吗 114.32.129.203 09/17 03:51

56^F：推 dovepacket: 他就只是个大数据而已没多神 111.253.164.3 09/17 04:12

57^F：→ JoeyChen: 为啥copilot也会答错 61.65.254.33 09/17 04:12

58^F：→ JoeyChen: 两个AI都答错大数据里应该不是这样吧 61.65.254.33 09/17 04:17

59^F：→ AtsukoErika: https://i.imgur.com/w1Pu6ZH.jpeg124.218.202.169 09/17 04:18

60^F：→ AtsukoErika: 累死终於矫正成功124.218.202.169 09/17 04:18

61^F：推 graysinger: 我的还真的不会算耶，还给错误的证明 36.224.138.148 09/17 04:27

62^F：→ graysinger: ，整个废到笑 36.224.138.148 09/17 04:27

63^F：→ graysinger: http://i.imgur.com/uYTxOhW.jpg 36.224.138.148 09/17 04:28

64^F：推 graysinger: http://i.imgur.com/Nd3ZGwy.jpg 36.224.138.148 09/17 04:32

65^F：推 dovepacket: 恭喜掰正 111.253.164.3 09/17 04:32

66^F：→ JoeyChen: gray大它方法1是对的耶 61.65.254.33 09/17 04:34

67^F：推 Chilloutt: 看不出ai对错的比ai还敢更糟 223.137.2.102 09/17 04:36

68^F：推 graysinger: ai这种错中有对，对中有错最让人害怕 36.224.138.148 09/17 04:42

69^F：推 lau6m2002: 真的有在用的都知道AI超会唬烂。但现 49.195.62.60 09/17 05:25

70^F：→ lau6m2002: 在真的有白痴把AI产出当成正确的证据 49.195.62.60 09/17 05:25

71^F：推 MrCool5566: 只要加写出你的思考过程就会对了223.137.182.253 09/17 05:47

72^F：推 eric112: 刚下试了一下发现它干话讲的很有道理， 36.233.250.123 09/17 05:53

73^F：→ eric112: 我差点以为我错了 36.233.250.123 09/17 05:53

74^F：推 nalthax: 在法界早就发生了 111.255.233.32 09/17 06:06

75^F：→ jasperhai: 早就一堆人把AI当神毫无判断能力了 111.185.73.132 09/17 06:31

76^F：推 menchian: ai目前错误还是很多，碰到不知道的事情125.231.227.195 09/17 06:38

77^F：→ menchian: 还会随便唬烂，但可悲的是一堆低能儿跟125.231.227.195 09/17 06:39

78^F：→ menchian: 你讨论事情时只会拿ai的回答当佐证125.231.227.195 09/17 06:39

79^F：推 menchian: http://i.imgur.com/yGZWb0X.jpg125.231.227.195 09/17 06:41

80^F：→ menchian: 比如像这样乱算一通125.231.227.195 09/17 06:41

81^F：推 mugen8521: 挺有趣的http://i.imgur.com/q43ByON.j 101.8.32.122 09/17 06:42

82^F：→ mugen8521: pg 101.8.32.122 09/17 06:42

83^F：→ mugen8521: http://i.imgur.com/xbV1l0M.jpg 101.8.32.122 09/17 06:43

84^F：→ eva19452002: 但是这题用google gemini就有答对 118.232.66.139 09/17 06:48

85^F：推 jacky5827: 无法辨别真伪的，用google只会更惨 124.218.216.64 09/17 07:18

86^F：推 Taiwanfish: https://i.imgur.com/ywkUfIR.jpeg 1.161.60.63 09/17 07:30

87^F：推 uwptd: 完美模拟台湾司法133.159.153.188 09/17 07:34

88^F：推 laugh8562: ChatGPT是数学白痴应该说他的模型就 219.70.223.154 09/17 08:04

89^F：→ laugh8562: 不是用来算这个的 219.70.223.154 09/17 08:04

90^F：推 Ernest: 算数学要数学特化的ai，有人做 116.89.136.145 09/17 08:07

91^F：→ riker729: 这不叫AI 没有分辨能力喂他屎他就出屎111.251.237.193 09/17 08:18

92^F：推 Isopod: https://i.imgur.com/2rqY1JJ.jpeg 111.250.18.97 09/17 08:29

93^F：→ Isopod: prompt要下好 111.250.18.97 09/17 08:29

94^F：推 WFU: 你的问法不对问9.90跟9.11哪个比较大就行了 118.169.93.56 09/17 08:50

95^F：推 graysinger: 没救耶http://i.imgur.com/lckvyKy.jp 36.224.138.148 09/17 08:52

96^F：→ graysinger: g 36.224.138.148 09/17 08:52

97^F：→ graysinger: http://i.imgur.com/TgF0Cw6.jpg 36.224.138.148 09/17 08:53

98^F：推 joke3547: o1好像会说服人，蛮恐怖的 42.73.72.49 09/17 09:00

99^F：推 pftmax: 不是Ai犯错，而是答案本来就没对错 39.12.73.128 09/17 09:03

100^F：→ pftmax: 逆向思考，也许错的答案也是对的 39.12.73.128 09/17 09:03

101^F：推 qzwse: 真的没救 123.240.86.187 09/17 09:07

102^F：→ qzwse: https://i.imgur.com/7llItn2.jpeg 123.240.86.187 09/17 09:07

103^F：→ qzwse: 结论 123.240.86.187 09/17 09:10

104^F：→ qzwse: 数学部分相信AI程式码执行出来的东西不 123.240.86.187 09/17 09:10

105^F：→ qzwse: 要直接相信AI 123.240.86.187 09/17 09:10

106^F：推 holypiggy: 确定只有数学部份吗 219.91.90.70 09/17 09:11

107^F：推 qzwse: gpt4 反而没有这个问题 123.240.86.187 09/17 09:13

108^F：→ qzwse: https://i.imgur.com/HHVxWav.jpeg 123.240.86.187 09/17 09:13

109^F：推 Townshend: 试了一下还真的分不出9.9 跟9.11谁大， 39.15.40.232 09/17 09:23

110^F：→ Townshend: copilot的理由是9.9可当成9.90，比较 39.15.40.232 09/17 09:23

111^F：→ Townshend: 尾数1>0，所以9.11比较大。真是笨的不 39.15.40.232 09/17 09:23

112^F：→ Townshend: 可思议 39.15.40.232 09/17 09:23

113^F：推 XiaoChing221: 就问的方式他听不懂，别怪工具不好 223.136.240.33 09/17 09:36

114^F：推 Townshend: 连问9.9跟9.11哪个数字大也听不懂，还 39.15.40.232 09/17 09:56

115^F：→ Townshend: 不能怪ai不好? 39.15.40.232 09/17 09:57

116^F：推 Townshend: https://imgur.com/q3ms5sW 39.15.40.232 09/17 09:59

117^F：推 Townshend: 这样问又知道答案不晓得问题出在哪 39.15.40.232 09/17 10:00

118^F：推 LDY97: 结果他还把9.90-9.11=0.79改成错的笑烂123.205.180.112 09/17 10:11

119^F：推 acluke: 开始让我怀疑9.9是不是9.90了122.116.249.182 09/17 10:18

120^F：→ pengda200010: 9.9 and 9.11 are both float which 119.14.155.15 09/17 10:34

121^F：推 wiork: 对啊，缺点只能不要太深入的问题，还要检 61.230.70.188 09/17 10:46

122^F：→ wiork: 视答案 61.230.70.188 09/17 10:46

123^F：→ deray: 微软的copilot真他妈辣鸡118.165.166.173 09/17 10:50

124^F：推 DarkerDuck: o1幻觉更严重不意外啊 1.172.122.135 09/17 10:53

125^F：→ patvessel: https://reurl.cc/dyq0ez 125.229.28.82 09/17 10:53

126^F：→ DarkerDuck: LLM本来就有幻觉，你还CoT串起来叠加 1.172.122.135 09/17 10:54

127^F：→ DarkerDuck: https://i.imgur.com/EZiE3SL.png 1.172.122.135 09/17 10:54

128^F：→ DarkerDuck: 这就是为什麽有些问题o1表现更鬼扯 1.172.122.135 09/17 10:56

129^F：→ DarkerDuck: 至於9.9和9.11的问题在於LLM的全名是 1.172.122.135 09/17 11:01

130^F：→ DarkerDuck: arge language model 1.172.122.135 09/17 11:01

131^F：→ DarkerDuck: Large language model 1.172.122.135 09/17 11:01

132^F：→ DarkerDuck: 它处理的最小单位是语言中的单字token 1.172.122.135 09/17 11:02

133^F：→ DarkerDuck: 不是设计用来处理数字的 1.172.122.135 09/17 11:02

134^F：→ karta1271642: 他就不会推理啊223.137.157.178 09/17 12:17

135^F：嘘 hotrain13: 他就不是拿来问数学的.... 122.99.15.229 09/17 12:27

136^F：嘘 vincent8914: 根本是你问错方式谁知道你问的是日223.136.198.190 09/17 13:17

137^F：→ vincent8914: 期版本号还是数值?期待AI通灵?223.136.198.190 09/17 13:18

138^F：→ AoWsL: 9.9跟9.11这数学问题讨论很多次吧...我还测 111.71.20.4 09/17 13:20

139^F：→ AoWsL: 试了一下大部分的AI，GPT4o刚开始还会跟你 111.71.20.4 09/17 13:20

140^F：→ AoWsL: 硬拗不认错 111.71.20.4 09/17 13:20

141^F：→ AoWsL: 喔好像只有gemini答对是不是？ 111.71.20.4 09/17 13:23

142^F：推 hhealthy0429: 没有背景知识能力使用generative a 68.45.21.105 09/17 13:46

143^F：→ hhealthy0429: i 帮助有限 68.45.21.105 09/17 13:46

144^F：推 losage: 有没有可能ai的推论才是真的 111.82.220.27 09/17 15:10

145^F：推 abbag: 开始虎烂不认错後，信任度下降就惨了XD 123.194.188.56 09/17 15:26

146^F：推 a0521487241: https://i.imgur.com/BcxpNTC.jpeg 203.204.103.71 09/17 20:36

147^F：→ a0521487241: 我是叫他再想想就正确了 203.204.103.71 09/17 20:37

148^F：嘘 XiaoChing221: 表达能力有问题嫌工具烂 223.136.240.33 09/17 21:40

149^F：→ wulitou: https://i.imgur.com/q9FxQU1.jpeg 36.230.26.148 09/19 11:27

本网站已依台湾网站内容分级规定处理。此区域为限制级，未满十八岁者不得浏览。

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Gossiping 板

Re: [爆卦] OpenAI 新模型o1轻松考上台大资工/台大

热门看板

赞助商连结