Stock 板


LINE

蘋果要讓AI變強當然是難 不然siri早變強了 蘋果要找AI毛病當然是容易的多 其實改進AI的人也常常發現各種毛病 只是不一定會針對毛病作為研究成果發表 發表側重點不一樣罷了 如引文 LLM大致就是對海量資料幾何意義上的理解啊 文內說人類邏輯思考 是指 Deduction/Induction/Abduction 嗎?? 那這類東西先天更接近代數上的東西哇 不過廣義上的 Deduction/Induction/Abduction 也是帶有機率的 參見 Bayesian statistics 很難說LLM最終掌握不了 Bayesian statistics 吧 一點想法 ※ 引述《midas82539 (喵)》之銘言: : 大語言模型(LLM)它的原始目的是要「模仿人類回答出人類看得懂的答案。」 : 但跟人類的語言不同,你我使用的與言語表達會是一系列的文字規則, : 例如「主詞,動詞,受詞」的SVO結構。 : 但模型本身並不是這樣學習的,它是把你看到的字,拆成詞素(token) : 然後將這些詞向量化,變成一系列數列: : king → [0.8, 0.1, 0.3, 0.7] : queen → [0.9, 0.1, 0.5, 0.9] : man → [0.9, 0.0, 0.3, 0.6] : woman → [0.8, 0.0, 0.5, 0.8] : 這個數列可以很長,例如有必要的話,可以到有300多個。然後模型可以找到特徵。 : 這個特徵用人類可以理解例子,就姑且濃縮成一個角度,便為說明就簡化成: : king=右上 man=右上 : queen=左上 woman=左上 : 那麼就算是你,也可以找到king跟man都是右上,故似乎有關連性。 : 而king跟queen角度不同,所以這兩個不是同樣的東西。 : 再把朕、殿下、皇帝、國王,排在一起。 : 只要資訊夠多,理論上是可以讓模型自己圈出有向量角度相近的集合。 : 我們可以再增加這個字出現在字首、字尾、中間第幾個字的頻率作為變數。 : 那麼就可以算出這個字出現在哪裡的特徵比較大。 : 這時我們回到剛剛的SVO結構,模型就可以在不懂中文,但憑統計出的特徵, : 可以拼湊出一個你可以看懂的中文回答。 : 然而這並不是人類的理解與語意判定,以及衍伸的推理。 : 所以它就會造就出「中文房間」的錯覺,例如假設一個外國人被關在房間。 : 但他有一本教戰手則,上面說明了那些字出現了,可以給出哪些答案。 : 那他就算不懂中文,在手冊的指引上也可以回答定型文。 : 大語言模型也是同樣的概念,它是基於大量的資料來找出「特徵」, : 而這些特徵的組合在在它的神經網絡會給予特定的權重,最後形成類似"手冊" : 的東西,然後依照手冊找到近似值的解答,生成給你看。 : 但它不見得是理解回答是否有意義,所以才會出現錯誤。 : 比如說很常見的,現在threads被一堆詐騙仔用AI生成圖片, : 例如啥我是護理師給我一個讚好嗎?但裡面的圖片會出現一些錯誤, : 例如敘述自己是75年出生,但生成的身分證是57年出生。 : 或者有生成名字了,但它的字型大小很明顯不一致。 : 然而對於模型來說,它不會知道"怎麼樣才是對的格式",而它只是針對 : 中華民國身分證大概是長怎樣,而隨機生成一個結果。 : 故單純直接產出,就免不了會有以上的問題。 : GPT4-O3它是說有多一個推理功能。然而它的底層還是大語言模型(LLM) : 加上它的數據處理是弄成很長串的多維資料,你人類也看不懂, : 所以你還是不會知道,它的推理過程,是不是也是模仿生成人類看得懂的邏輯。 : 但這個算法是否正確與必要,不見得正確。 : 這個問題在你處理只有你會面對的數學問題就有機會發生。 : 例如假設你要模型生成一個模型由0至指定最大值,與指定最小值機率遞減, : 而機率遞減的分配公式,正常我們人類就是設一個權重來分配。 : 但我問過O3它就很奇葩,它想用自然常數來分配,然後算式會出現錯誤。 : 其他你看過的就是GPT跟deepseek下西洋棋,結果deepseek憑空出現棋子, : 或者無視規則走奇怪的動作。這些都說明了語言模型並不是真的了解規則, : 而只是像兩隻猴子看人類下棋,而模仿人類玩西洋棋。 : 由於這不是你熟知的建立規則(base rule),所以在面對複雜的隨機模擬。 : 它可能做出錯誤的資訊,而你沒有發現錯誤的話,它就會繼續引用上下文 : 而給出錯誤的結論,但你看起來覺得是對的。 : 比如說你不會選擇權,但你想要模型直接生成一個賣方與調整策略。 : 而模型基於call有正的delta,而錯誤認為sell call也有正dela, : 那它就會繼續基於錯誤資訊引用,而得出: : 當標的價格趨近於SC履約價,整體delta會變正而且增加,故需要買put調整的規則。 : 當然對我來說我可以看出哪裡有問題,但對於沒有理解的人來說, : 那他就不會發現這個推理與建立規則錯誤,就會導致利用而產生虧損。 : 而這我認為基於大語言模型的訓練方式,本質上是無解。 : 你只能靠自己判斷模型的回答是否邏輯正確。而不是期望模型像神燈精靈, : 你不用會你也可以產出一個東西跟專業的人競爭。 --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 99.36.164.58 (美國)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1750040377.A.DDF.html
1F:推 AudiA4Avant : 人類其實也沒真正理解大腦的運作,說不定最後殊途同 06/16 10:21
2F:→ AudiA4Avant : 歸呢 06/16 10:21
3F:推 CAFEHu : 蘋果美食家:我不懂做料理,但很懂吃 06/16 10:29
4F:推 lin007 : 其實跟人的學習差不多,都是找特徵值 06/16 10:53
5F:→ Eric0605 : 人類99乘法表還不是用背的 06/16 11:40
6F:→ Eric0605 : 一堆東西也是隨便說說靠感覺 06/16 11:40
7F:→ Eric0605 : 現在AI表現應該勝過9成9人類能力了 06/16 11:41
8F:→ Eric0605 : 而且還在持續進步中才是可怕 06/16 11:41
9F:推 ProTrader : 貝氏統計可以幫現在的AI優化結果吧 06/16 13:47
10F:推 aegis43210 : 貝氏統計是做出AGI的輔助方案之一 06/16 17:55







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Gossiping站內搜尋

TOP