Re: [心得] 苹果揭露人工智能并不思考

时间Mon Jun 16 13:16:44 2025

首先啦，在公众对於AI发展的看法，有个很有趣的现象。就是只要AI会做了某件任务，就会直接说，这不需要"思考"。譬如AI在二十几年前打败西洋棋棋王，後来华生也打败益智节目的人类冠军。人们直觉反应就是这不是思考啦，西洋棋就是暴力算棋谱，益智节目背题库就好啦。到了十年前还有人认为AI永远不可能击败人类棋王，因为围棋不是硬靠算力可以暴力解的。还需要人的模式辨认与推理能力，而AI不会。结果嘛，现在变成几乎每个棋手都要靠AI训练，还要尊称AI为老师。到现在LLM文字接龙因为量变产生质变，开始涌现出各种当初想不到的能力。譬如翻译、写故事、甚至是更高阶看起来需要推理的写程式、在各种限制下规划行程。那现在的AI真可以直接说他不会思考thinking吗？心理学家把人类的thinking归类为两大系统(快思慢想) 系统一(快思): 不需要意识控制，常靠经验与启发法（heuristics），例如九九乘法表的乘法计算、开车时的习惯反应。通常都是直觉、快速、自动化的"快思"任务。系统二(慢想): 需要意识控制，用来做逻辑推理、计算、分析与抉择，例如解数学方程式或做财务规划。通常是需要逻辑、缓慢、且偏代理型的"慢想"任务。目前LLM这系列的AI涌现出来的能力大都是系统一的快思任务，所以AI当然会thinking。配合了一些CoT等後训练技术甚至可以涌现出一些些系统二慢想的任务。但我猜还是有极限啦，像是要有意识的知道自己搞错了就需要系统二的能力。因此LLM常常被人认为是一本正经的胡说八道。又或者一些代理agent任务，就极需要系统二的规划能力，现在的LLM就算使用推理模式，也会因为token预算不足而无法长时间执行。像是苹果这篇论文反而展示了LLM会思考的一面，他有许多问题都过於困难。思考token预算不足，当然就直接放弃，但这不代表AI不会thinking。只是AI目前的确很难处理非常大的问题，需要新的思考预算控制模式。这也就是现在AI领域积极想要突破的agent领域。 Apple Intelligence之前Siri就已经很多agent类型任务的展示，也难怪一直生不出来。连最近推出的通用型agent Manus都做不好了，慢人百步以上的Apple怎麽弄得好？像是Meta的YanneCun就一直认为现在的LLM是弄不出AGI的，而是需要导入新的世界模型。假如真的要能让AI长期执行agent类型等系统二慢想任务，以及机器人能够长期自主运作。那这些AI的内心必须锚定一个世界模型，知道自己在这个世界中的状态与定位。才能够调和自己的任务需求与外部的总总限制，而不是卡在死胡同里。而且能够整合自己的工具与感官不断地调整权重去做学习。这些都是目前AI都还很欠缺的。若无法突破就很难达成人类等级的AGI。而这方面能突破，那真的就可以期待AI能直接"取代"人力，达到新的工业革命。 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 122.121.186.56 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1750051006.A.5BB.html ※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 13:18:07 ※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 13:19:50

1^F：推 sdbb : 台肯 06/16 13:18

2^F：推 webster1112 : 图灵是神的地方在图灵测试，不跟你废话五四三的！ 06/16 13:21

3^F：→ haha98 : 实际上lecun一直在吹的世界模型很多人也在搞目前 06/16 13:22

4^F：→ haha98 : 李飞飞的公司和Google 的demo我觉得不错倒是lecun 06/16 13:22

5^F：→ haha98 : 自己的V-JEPA2 没啥惊艳 06/16 13:22

6^F：→ webster1112 : 我们要先定义思考？？耍嘴皮 06/16 13:23

7^F：推 Samurai : 当然要先定义思考，这很重要的 06/16 13:26

8^F：推 abccbaandy : 但现在AI确实很容易鬼打墙+唬烂讲了也不听 06/16 13:31

9^F：→ DarkerDuck : 因为纠错与重新规划算是系统二的能力 06/16 13:33

10^F：→ DarkerDuck : 我用AI写程式也是一样，debug非常困难 06/16 13:33

※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 13:42:00

11^F：推 seemoon2000 : 其实普通人的思考也比不上LLM系统的直出回答... 06/16 13:45

12^F：→ seemoon2000 : 想不到这个非常小的题目竟然可以讨论这麽多篇... 06/16 13:45

13^F：→ DarkerDuck : 是啊，所以我觉得让外星人来评估思考能力 06/16 13:46

14^F：→ DarkerDuck : 大部分的人类群体会被归类成不会思考的.... 06/16 13:47

15^F：→ DarkerDuck : 像是币圈就被玩成蠢币进化论，真是笑死外星人 06/16 13:47

※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 13:47:58

16^F：推 capssan : 你说的其实就是我一直以来对这件事情的认知 06/16 13:48

17^F：→ capssan : 的确就是快思慢想的概念 06/16 13:49

18^F：推 bamama56 : 快思慢想我熟一个靠老公乱翻的 06/16 13:49

19^F：→ haha98 : 你用啥写啊我用sonnet 配cursor debug 蛮强的 06/16 13:55

20^F：→ haha98 : 我现在已经不能没有他们 06/16 13:56

21^F：→ KuRaZuHa : 靠老公接案靠学生乱翻就唬兰啊 06/16 13:58

22^F：→ DarkerDuck : 现在除非公司规定，不然应该没有程式设计师不用AI了 06/16 14:00

23^F：→ FatFatQQ : 先定义人类思考是什麽 06/16 14:01

24^F：→ DarkerDuck : 一些执行期才会发生的非重现bug还是要自己trace就是 06/16 14:03

25^F：→ DarkerDuck : 还有那种元件耦合性错误，AI也很难跨那麽远去抓 06/16 14:04

26^F：推 ProTrader : 新或再优化的AI模型肯定很多研究者投入 06/16 14:05

※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 14:37:30 ※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 14:44:42

27^F：推 mdkn35 : 当初Manus不是炒超大的帐号能卖好价钱结果ㄏㄏ喔? 06/16 15:06

28^F：推 NoMomoNoLife: 是的如haha98所言，其他路线也有人在研究了。 06/16 15:06

29^F：推 traz04067 : 我们需要重新定义苹果AI的思考 06/16 17:45

30^F：推 qqpbpp : ai现在做不到的是後设认知，直接跳脱内容，回到互动 06/17 00:58

31^F：→ qqpbpp : 本身来思考 06/17 00:58

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Stock 板

Re: [心得] 苹果揭露人工智能并不思考

热门看板

赞助商连结