作者DarkerDuck (达克鸭)
看板Stock
标题Re: [心得] 苹果揭露人工智能并不思考
时间Mon Jun 16 13:16:44 2025
首先啦,在公众对於AI发展的看法,有个很有趣的现象。
就是只要AI会做了某件任务,就会直接说,这不需要"思考"。
譬如AI在二十几年前打败西洋棋棋王,後来华生也打败益智节目的人类冠军。
人们直觉反应就是这不是思考啦,西洋棋就是暴力算棋谱,益智节目背题库就好啦。
到了十年前还有人认为AI永远不可能击败人类棋王,因为围棋不是硬靠算力可以暴力解的。
还需要人的模式辨认与推理能力,而AI不会。
结果嘛,现在变成几乎每个棋手都要靠AI训练,还要尊称AI为老师。
到现在LLM文字接龙因为量变产生质变,开始涌现出各种当初想不到的能力。
譬如翻译、写故事、甚至是更高阶看起来需要推理的写程式、在各种限制下规划行程。
那现在的AI真可以直接说他不会思考thinking吗?
心理学家把人类的thinking归类为两大系统(快思慢想)
系统一(快思): 不需要意识控制,常靠经验与启发法(heuristics),
例如九九乘法表的乘法计算、开车时的习惯反应。
通常都是直觉、快速、自动化的"快思"任务。
系统二(慢想): 需要意识控制,用来做逻辑推理、计算、分析与抉择,
例如解数学方程式或做财务规划。
通常是需要逻辑、缓慢、且偏代理型的"慢想"任务。
目前LLM这系列的AI涌现出来的能力大都是系统一的快思任务,所以AI当然会thinking。
配合了一些CoT等後训练技术甚至可以涌现出一些些系统二慢想的任务。
但我猜还是有极限啦,像是要有意识的知道自己搞错了就需要系统二的能力。
因此LLM常常被人认为是一本正经的胡说八道。
又或者一些代理agent任务,就极需要系统二的规划能力,
现在的LLM就算使用推理模式,也会因为token预算不足而无法长时间执行。
像是苹果这篇论文反而展示了LLM会思考的一面,他有许多问题都过於困难。
思考token预算不足,当然就直接放弃,但这不代表AI不会thinking。
只是AI目前的确很难处理非常大的问题,需要新的思考预算控制模式。
这也就是现在AI领域积极想要突破的agent领域。
Apple Intelligence之前Siri就已经很多agent类型任务的展示,也难怪一直生不出来。
连最近推出的通用型agent Manus都做不好了,慢人百步以上的Apple怎麽弄得好?
像是Meta的YanneCun就一直认为现在的LLM是弄不出AGI的,而是需要导入新的世界模型。
假如真的要能让AI长期执行agent类型等系统二慢想任务,以及机器人能够长期自主运作。
那这些AI的内心必须锚定一个世界模型,知道自己在这个世界中的状态与定位。
才能够调和自己的任务需求与外部的总总限制,而不是卡在死胡同里。
而且能够整合自己的工具与感官不断地调整权重去做学习。
这些都是目前AI都还很欠缺的。若无法突破就很难达成人类等级的AGI。
而这方面能突破,那真的就可以期待AI能直接"取代"人力,达到新的工业革命。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 122.121.186.56 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1750051006.A.5BB.html
※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 13:18:07
※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 13:19:50
1F:推 sdbb : 台肯 06/16 13:18
2F:推 webster1112 : 图灵是神的地方在图灵测试,不跟你废话五四三的! 06/16 13:21
3F:→ haha98 : 实际上lecun一直在吹的世界模型很多人也在搞 目前 06/16 13:22
4F:→ haha98 : 李飞飞的公司和Google 的demo我觉得不错 倒是lecun 06/16 13:22
5F:→ haha98 : 自己的V-JEPA2 没啥惊艳 06/16 13:22
6F:→ webster1112 : 我们要先定义思考?? 耍嘴皮 06/16 13:23
7F:推 Samurai : 当然要先定义思考,这很重要的 06/16 13:26
8F:推 abccbaandy : 但现在AI确实很容易鬼打墙+唬烂 讲了也不听 06/16 13:31
9F:→ DarkerDuck : 因为纠错与重新规划算是系统二的能力 06/16 13:33
10F:→ DarkerDuck : 我用AI写程式也是一样,debug非常困难 06/16 13:33
※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 13:42:00
11F:推 seemoon2000 : 其实普通人的思考 也比不上LLM系统的直出回答... 06/16 13:45
12F:→ seemoon2000 : 想不到这个非常小的题目 竟然可以讨论这麽多篇... 06/16 13:45
13F:→ DarkerDuck : 是啊,所以我觉得让外星人来评估思考能力 06/16 13:46
14F:→ DarkerDuck : 大部分的人类群体会被归类成不会思考的.... 06/16 13:47
15F:→ DarkerDuck : 像是币圈就被玩成蠢币进化论,真是笑死外星人 06/16 13:47
※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 13:47:58
16F:推 capssan : 你说的其实就是我一直以来对这件事情的认知 06/16 13:48
17F:→ capssan : 的确就是快思慢想的概念 06/16 13:49
18F:推 bamama56 : 快思慢想我熟 一个靠老公乱翻的 06/16 13:49
19F:→ haha98 : 你用啥写啊 我用sonnet 配cursor debug 蛮强的 06/16 13:55
20F:→ haha98 : 我现在已经不能没有他们 06/16 13:56
21F:→ KuRaZuHa : 靠老公接案 靠学生乱翻 就唬兰啊 06/16 13:58
22F:→ DarkerDuck : 现在除非公司规定,不然应该没有程式设计师不用AI了 06/16 14:00
23F:→ FatFatQQ : 先定义人类思考是什麽 06/16 14:01
24F:→ DarkerDuck : 一些执行期才会发生的非重现bug还是要自己trace就是 06/16 14:03
25F:→ DarkerDuck : 还有那种元件耦合性错误,AI也很难跨那麽远去抓 06/16 14:04
26F:推 ProTrader : 新或再优化的AI模型 肯定很多研究者投入 06/16 14:05
※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 14:37:30
※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 14:44:42
27F:推 mdkn35 : 当初Manus不是炒超大的 帐号能卖好价钱 结果ㄏㄏ喔? 06/16 15:06
28F:推 NoMomoNoLife: 是的如haha98所言,其他路线也有人在研究了。 06/16 15:06
29F:推 traz04067 : 我们需要重新定义苹果AI的思考 06/16 17:45
30F:推 qqpbpp : ai现在做不到的是後设认知,直接跳脱内容,回到互动 06/17 00:58
31F:→ qqpbpp : 本身来思考 06/17 00:58