Stock 板


LINE

首先啦,在公眾對於AI發展的看法,有個很有趣的現象。 就是只要AI會做了某件任務,就會直接說,這不需要"思考"。 譬如AI在二十幾年前打敗西洋棋棋王,後來華生也打敗益智節目的人類冠軍。 人們直覺反應就是這不是思考啦,西洋棋就是暴力算棋譜,益智節目背題庫就好啦。 到了十年前還有人認為AI永遠不可能擊敗人類棋王,因為圍棋不是硬靠算力可以暴力解的。 還需要人的模式辨認與推理能力,而AI不會。 結果嘛,現在變成幾乎每個棋手都要靠AI訓練,還要尊稱AI為老師。 到現在LLM文字接龍因為量變產生質變,開始湧現出各種當初想不到的能力。 譬如翻譯、寫故事、甚至是更高階看起來需要推理的寫程式、在各種限制下規劃行程。 那現在的AI真可以直接說他不會思考thinking嗎? 心理學家把人類的thinking歸類為兩大系統(快思慢想) 系統一(快思): 不需要意識控制,常靠經驗與啟發法(heuristics), 例如九九乘法表的乘法計算、開車時的習慣反應。 通常都是直覺、快速、自動化的"快思"任務。 系統二(慢想): 需要意識控制,用來做邏輯推理、計算、分析與抉擇, 例如解數學方程式或做財務規劃。 通常是需要邏輯、緩慢、且偏代理型的"慢想"任務。 目前LLM這系列的AI湧現出來的能力大都是系統一的快思任務,所以AI當然會thinking。 配合了一些CoT等後訓練技術甚至可以湧現出一些些系統二慢想的任務。 但我猜還是有極限啦,像是要有意識的知道自己搞錯了就需要系統二的能力。 因此LLM常常被人認為是一本正經的胡說八道。 又或者一些代理agent任務,就極需要系統二的規劃能力, 現在的LLM就算使用推理模式,也會因為token預算不足而無法長時間執行。 像是蘋果這篇論文反而展示了LLM會思考的一面,他有許多問題都過於困難。 思考token預算不足,當然就直接放棄,但這不代表AI不會thinking。 只是AI目前的確很難處理非常大的問題,需要新的思考預算控制模式。 這也就是現在AI領域積極想要突破的agent領域。 Apple Intelligence之前Siri就已經很多agent類型任務的展示,也難怪一直生不出來。 連最近推出的通用型agent Manus都做不好了,慢人百步以上的Apple怎麼弄得好? 像是Meta的YanneCun就一直認為現在的LLM是弄不出AGI的,而是需要導入新的世界模型。 假如真的要能讓AI長期執行agent類型等系統二慢想任務,以及機器人能夠長期自主運作。 那這些AI的內心必須錨定一個世界模型,知道自己在這個世界中的狀態與定位。 才能夠調和自己的任務需求與外部的總總限制,而不是卡在死胡同裡。 而且能夠整合自己的工具與感官不斷地調整權重去做學習。 這些都是目前AI都還很欠缺的。若無法突破就很難達成人類等級的AGI。 而這方面能突破,那真的就可以期待AI能直接"取代"人力,達到新的工業革命。 --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.121.186.56 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1750051006.A.5BB.html ※ 編輯: DarkerDuck (122.121.186.56 臺灣), 06/16/2025 13:18:07 ※ 編輯: DarkerDuck (122.121.186.56 臺灣), 06/16/2025 13:19:50
1F:推 sdbb : 台肯 06/16 13:18
2F:推 webster1112 : 圖靈是神的地方在圖靈測試,不跟你廢話五四三的! 06/16 13:21
3F:→ haha98 : 實際上lecun一直在吹的世界模型很多人也在搞 目前 06/16 13:22
4F:→ haha98 : 李飛飛的公司和Google 的demo我覺得不錯 倒是lecun 06/16 13:22
5F:→ haha98 : 自己的V-JEPA2 沒啥驚艷 06/16 13:22
6F:→ webster1112 : 我們要先定義思考?? 耍嘴皮 06/16 13:23
7F:推 Samurai : 當然要先定義思考,這很重要的 06/16 13:26
8F:推 abccbaandy : 但現在AI確實很容易鬼打牆+唬爛 講了也不聽 06/16 13:31
9F:→ DarkerDuck : 因為糾錯與重新規劃算是系統二的能力 06/16 13:33
10F:→ DarkerDuck : 我用AI寫程式也是一樣,debug非常困難 06/16 13:33
※ 編輯: DarkerDuck (122.121.186.56 臺灣), 06/16/2025 13:42:00
11F:推 seemoon2000 : 其實普通人的思考 也比不上LLM系統的直出回答... 06/16 13:45
12F:→ seemoon2000 : 想不到這個非常小的題目 竟然可以討論這麼多篇... 06/16 13:45
13F:→ DarkerDuck : 是啊,所以我覺得讓外星人來評估思考能力 06/16 13:46
14F:→ DarkerDuck : 大部分的人類群體會被歸類成不會思考的.... 06/16 13:47
15F:→ DarkerDuck : 像是幣圈就被玩成蠢幣進化論,真是笑死外星人 06/16 13:47
※ 編輯: DarkerDuck (122.121.186.56 臺灣), 06/16/2025 13:47:58
16F:推 capssan : 你說的其實就是我一直以來對這件事情的認知 06/16 13:48
17F:→ capssan : 的確就是快思慢想的概念 06/16 13:49
18F:推 bamama56 : 快思慢想我熟 一個靠老公亂翻的 06/16 13:49
19F:→ haha98 : 你用啥寫啊 我用sonnet 配cursor debug 蠻強的 06/16 13:55
20F:→ haha98 : 我現在已經不能沒有他們 06/16 13:56
21F:→ KuRaZuHa : 靠老公接案 靠學生亂翻 就唬蘭啊 06/16 13:58
22F:→ DarkerDuck : 現在除非公司規定,不然應該沒有程式設計師不用AI了 06/16 14:00
23F:→ FatFatQQ : 先定義人類思考是什麼 06/16 14:01
24F:→ DarkerDuck : 一些執行期才會發生的非重現bug還是要自己trace就是 06/16 14:03
25F:→ DarkerDuck : 還有那種元件耦合性錯誤,AI也很難跨那麼遠去抓 06/16 14:04
26F:推 ProTrader : 新或再優化的AI模型 肯定很多研究者投入 06/16 14:05
※ 編輯: DarkerDuck (122.121.186.56 臺灣), 06/16/2025 14:37:30 ※ 編輯: DarkerDuck (122.121.186.56 臺灣), 06/16/2025 14:44:42
27F:推 mdkn35 : 當初Manus不是炒超大的 帳號能賣好價錢 結果ㄏㄏ喔? 06/16 15:06
28F:推 NoMomoNoLife: 是的如haha98所言,其他路線也有人在研究了。 06/16 15:06
29F:推 traz04067 : 我們需要重新定義蘋果AI的思考 06/16 17:45
30F:推 qqpbpp : ai現在做不到的是後設認知,直接跳脫內容,回到互動 06/17 00:58
31F:→ qqpbpp : 本身來思考 06/17 00:58







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Tech_Job站內搜尋

TOP