Math 板


LINE

※ 引述 《Bugquan (靠近邊緣)》 之銘言: : 推 LPH66 : 話說回來, 我看到有一篇論文是他們用 ChatGPT 產生 11/06 20:35 : → LPH66 : 了 Lean 程式碼並且成功編過了, 這種應該算是生成式 11/06 20:36 : → LPH66 : AI 的一種意外應用方式吧 (Lean 程式碼能編過表示 11/06 20:36 : → LPH66 : 邏輯推理是通的) 11/06 20:36 : → LPH66 : 這篇論文的作者有說他們在這之前不會 Lean 11/07 08:52 https://xenaproject.wordpress.com/2025/10/22/formal-or-not-formal-that-is-the-qu estion-in-ai-for-theorem-proving/ 根據 Kevin Buzzard(倫敦帝國學院教授,https://reurl.cc/LQ0Ddx)的觀點,我們來探 討 AI 證明數學猜想時的核心問題。 小知識:關於 Kevin Buzzard 這位數學家正帶領團隊,試圖利用 Lean 形式化證明費馬最後定理。他甚至邀請到他的指導 教授 Richard Taylor(費馬最後定理證明關鍵貢獻者之一)來協助制定一套現代化且更具 可行性的形式化藍圖。 (參考:https://imperialcollegelondon.github.io/FLT/blueprint/) Kevin Buzzard 在文章中指出,AI 證明數學時面臨兩大挑戰: 1. AI 的「幻覺」與證明可靠性 問題核心: 像大型語言模型(LLM)這樣的 AI 存在「幻覺」(Hallucination)問題。 在數學證明中,只要證明過程出現一個幻覺,就足以完全破壞整個數學論證的有效性。 形式化的作用與局限: 如果我們要求 AI 在提供證明的同時,也以 Lean 形式化語言呈 現,是否就能高枕無憂? 答案是否定的。 雖然 Lean 可以以超人類水平校驗邏輯步驟,但人類仍然需要仔細檢查 :定理的陳述和證明的過程是否被正確地翻譯成了 Lean 語言。 確保「人類想證明的」與「Lean 實際檢查的」是同一件事,是至關重要的環節。 2. AI 配合 Lean 的發展瓶頸 問題核心: AI 與 Lean 混合系統能走多遠? Buzzard 的觀點: 他認為目前的瓶頸在於,即便是最好的形式化數學函式庫(如 Lean 的 mathlib),仍不具備理解大多數現代研究級數學所需的「定義」。 範例: 目前的定理證明器尚不了解(或缺乏足夠形式化定義)這些複雜但又極其重要和 常用的數學對象,例如: Tate-Shafarevich 群 Calabi-Yau 簇 代數疊 (algebraic stacks) 自守表示 (automorphic representations) 因此,在 AI 能夠真正協助進行研究級數學證明之前,仍需要人類研究人員投入時間,為 L ean 等證明器提供和形式化這些現代數學的基礎定義。 --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 27.53.161.22 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Math/M.1762480024.A.346.html
1F:→ xcycl : 這邊有點太神話 Lean ,它並不具備「理解」的能力 11/09 21:21
2F:→ xcycl : 簡單說是數理邏輯(或型別論)的實作,能夠檢查證明 11/09 21:22
3F:→ xcycl : 的有效性。因為語言很底層,要把現代數學完整形式化 11/09 21:24
4F:→ xcycl : 而且要能夠以數學家可以理解的形式是還有一段路要走 11/09 21:25
5F:→ mantour : 意思是在把我要證明的定理,翻譯成Lean語言,跟Lea 11/11 07:06
6F:→ mantour : n語言中發現的定理翻譯成人能懂的命題,這兩個轉換 11/11 07:06
7F:→ mantour : 的過程可能還有困難和錯誤。結果是機器實際證明出 11/11 07:06
8F:→ mantour : 的東西,跟我以為機器證明出的東西,可能根本是不 11/11 07:06
9F:→ mantour : 同的。是這樣嗎? 11/11 07:06
10F:→ xcycl : 這兩個翻譯是普遍性的問題,就想像教科書所有的命題 11/11 13:19
11F:→ xcycl : 全部都只用數理邏輯的符號表達 11/11 13:19
12F:→ xcycl : 旁邊可以用自然語言的註解,但 Lean 只看符號的部分 11/11 13:20
13F:→ xcycl : 就跟寫程式一樣,預期的行為跟實際可能不一樣 11/11 13:20
14F:→ ginstein : 創作不易,感謝回文評論! 11/18 09:12
15F:→ ginstein : B大比較理想,我設想利用轉譯原理翻譯標準分析就好 11/18 09:14
16F:→ ginstein : https://www.zhihu.com/pin/1966294562063513595 11/18 12:58
17F:→ ginstein : 可以參考上篇想法,理想是自發從零到一,現實給一 11/18 12:58
18F:→ ginstein : 讓 AI 產生十百千萬的結果比較實際 11/18 12:58







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Soft_Job站內搜尋

TOP