Stock 板


LINE

首先啦,在公众对於AI发展的看法,有个很有趣的现象。 就是只要AI会做了某件任务,就会直接说,这不需要"思考"。 譬如AI在二十几年前打败西洋棋棋王,後来华生也打败益智节目的人类冠军。 人们直觉反应就是这不是思考啦,西洋棋就是暴力算棋谱,益智节目背题库就好啦。 到了十年前还有人认为AI永远不可能击败人类棋王,因为围棋不是硬靠算力可以暴力解的。 还需要人的模式辨认与推理能力,而AI不会。 结果嘛,现在变成几乎每个棋手都要靠AI训练,还要尊称AI为老师。 到现在LLM文字接龙因为量变产生质变,开始涌现出各种当初想不到的能力。 譬如翻译、写故事、甚至是更高阶看起来需要推理的写程式、在各种限制下规划行程。 那现在的AI真可以直接说他不会思考thinking吗? 心理学家把人类的thinking归类为两大系统(快思慢想) 系统一(快思): 不需要意识控制,常靠经验与启发法(heuristics), 例如九九乘法表的乘法计算、开车时的习惯反应。 通常都是直觉、快速、自动化的"快思"任务。 系统二(慢想): 需要意识控制,用来做逻辑推理、计算、分析与抉择, 例如解数学方程式或做财务规划。 通常是需要逻辑、缓慢、且偏代理型的"慢想"任务。 目前LLM这系列的AI涌现出来的能力大都是系统一的快思任务,所以AI当然会thinking。 配合了一些CoT等後训练技术甚至可以涌现出一些些系统二慢想的任务。 但我猜还是有极限啦,像是要有意识的知道自己搞错了就需要系统二的能力。 因此LLM常常被人认为是一本正经的胡说八道。 又或者一些代理agent任务,就极需要系统二的规划能力, 现在的LLM就算使用推理模式,也会因为token预算不足而无法长时间执行。 像是苹果这篇论文反而展示了LLM会思考的一面,他有许多问题都过於困难。 思考token预算不足,当然就直接放弃,但这不代表AI不会thinking。 只是AI目前的确很难处理非常大的问题,需要新的思考预算控制模式。 这也就是现在AI领域积极想要突破的agent领域。 Apple Intelligence之前Siri就已经很多agent类型任务的展示,也难怪一直生不出来。 连最近推出的通用型agent Manus都做不好了,慢人百步以上的Apple怎麽弄得好? 像是Meta的YanneCun就一直认为现在的LLM是弄不出AGI的,而是需要导入新的世界模型。 假如真的要能让AI长期执行agent类型等系统二慢想任务,以及机器人能够长期自主运作。 那这些AI的内心必须锚定一个世界模型,知道自己在这个世界中的状态与定位。 才能够调和自己的任务需求与外部的总总限制,而不是卡在死胡同里。 而且能够整合自己的工具与感官不断地调整权重去做学习。 这些都是目前AI都还很欠缺的。若无法突破就很难达成人类等级的AGI。 而这方面能突破,那真的就可以期待AI能直接"取代"人力,达到新的工业革命。 --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 122.121.186.56 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1750051006.A.5BB.html ※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 13:18:07 ※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 13:19:50
1F:推 sdbb : 台肯 06/16 13:18
2F:推 webster1112 : 图灵是神的地方在图灵测试,不跟你废话五四三的! 06/16 13:21
3F:→ haha98 : 实际上lecun一直在吹的世界模型很多人也在搞 目前 06/16 13:22
4F:→ haha98 : 李飞飞的公司和Google 的demo我觉得不错 倒是lecun 06/16 13:22
5F:→ haha98 : 自己的V-JEPA2 没啥惊艳 06/16 13:22
6F:→ webster1112 : 我们要先定义思考?? 耍嘴皮 06/16 13:23
7F:推 Samurai : 当然要先定义思考,这很重要的 06/16 13:26
8F:推 abccbaandy : 但现在AI确实很容易鬼打墙+唬烂 讲了也不听 06/16 13:31
9F:→ DarkerDuck : 因为纠错与重新规划算是系统二的能力 06/16 13:33
10F:→ DarkerDuck : 我用AI写程式也是一样,debug非常困难 06/16 13:33
※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 13:42:00
11F:推 seemoon2000 : 其实普通人的思考 也比不上LLM系统的直出回答... 06/16 13:45
12F:→ seemoon2000 : 想不到这个非常小的题目 竟然可以讨论这麽多篇... 06/16 13:45
13F:→ DarkerDuck : 是啊,所以我觉得让外星人来评估思考能力 06/16 13:46
14F:→ DarkerDuck : 大部分的人类群体会被归类成不会思考的.... 06/16 13:47
15F:→ DarkerDuck : 像是币圈就被玩成蠢币进化论,真是笑死外星人 06/16 13:47
※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 13:47:58
16F:推 capssan : 你说的其实就是我一直以来对这件事情的认知 06/16 13:48
17F:→ capssan : 的确就是快思慢想的概念 06/16 13:49
18F:推 bamama56 : 快思慢想我熟 一个靠老公乱翻的 06/16 13:49
19F:→ haha98 : 你用啥写啊 我用sonnet 配cursor debug 蛮强的 06/16 13:55
20F:→ haha98 : 我现在已经不能没有他们 06/16 13:56
21F:→ KuRaZuHa : 靠老公接案 靠学生乱翻 就唬兰啊 06/16 13:58
22F:→ DarkerDuck : 现在除非公司规定,不然应该没有程式设计师不用AI了 06/16 14:00
23F:→ FatFatQQ : 先定义人类思考是什麽 06/16 14:01
24F:→ DarkerDuck : 一些执行期才会发生的非重现bug还是要自己trace就是 06/16 14:03
25F:→ DarkerDuck : 还有那种元件耦合性错误,AI也很难跨那麽远去抓 06/16 14:04
26F:推 ProTrader : 新或再优化的AI模型 肯定很多研究者投入 06/16 14:05
※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 14:37:30 ※ 编辑: DarkerDuck (122.121.186.56 台湾), 06/16/2025 14:44:42
27F:推 mdkn35 : 当初Manus不是炒超大的 帐号能卖好价钱 结果ㄏㄏ喔? 06/16 15:06
28F:推 NoMomoNoLife: 是的如haha98所言,其他路线也有人在研究了。 06/16 15:06
29F:推 traz04067 : 我们需要重新定义苹果AI的思考 06/16 17:45
30F:推 qqpbpp : ai现在做不到的是後设认知,直接跳脱内容,回到互动 06/17 00:58
31F:→ qqpbpp : 本身来思考 06/17 00:58







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:BuyTogether站内搜寻

TOP