[其他] GoogleAI達到國際數學奧林匹克銀牌水平

時間Fri Jul 26 15:43:39 2024

https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/ 一年一度的國際奧林匹克數學競賽（IMO）是最負盛名的高中數學競賽，每年的IMO會設有 6道代數、幾何、數論以及組合學方面的題目。近來，IMO被認為是機器學習領域的重要挑戰，可用於衡量人工智慧（AI）系統的高級數學推理能力，這種能力對實現通用人工智慧（AGI）很重要。 Google的DeepMind公司在今年年初推出了AlphaGeometry，該模型擅長解決幾何證明題，已逼近人類金牌選手的水平，但無法應對幾何之外的代數、數論等問題。 7月25日， DeepMind宣布推出基於強化學習、可用於形式數學推理的AlphaProof，以及改進的幾何證明模型AlphaGeometry 2。這兩個系統共同解決了今年IMO6題目中的4 道，首次達到了人類銀牌選手的水準。相較於上一代AlphaGeometry，DeepMind基於Gemini重新訓練了AlphaGeometry 2用到的語言模型，並優化了符號引擎，提升了它解決複雜幾何問題的能力和效率。對於IMO 2024 的問題4，AlphaGeometry 2只用19秒便給了答案。 AlphaProof則結合了預先訓練的語言模型與強化學習演算法AlphaZero（通用棋類AI），並接受了一種名為Lean的形式化語言的訓練。其中，Lean是一種互動式定理證明語言，可用來檢驗數學證明的可靠性。因此用它訓練的模型可以避免自然語言訓練常出現的看似合理但不正確的答案。對於IMO 2024的題目，AlphaProof花了三天時間解決了兩道代數問題，和一道數論問題，包括比賽中最難的、僅有5位參賽選手解決的問題，但無法解決其餘兩道組合問題。最終，經過數學家評分，AlphaProof和AlphaGeometry 2共獲得了28分（滿分42），與金牌線29分相差僅有1分，首次達到了銀牌選手的水平。 --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.253.162.64 (臺灣) ※ 文章網址: https://webptt.com/m.aspx?n=bbs/Math/M.1721979825.A.1CB.html

1^F：推 GaussQQ : 幾何的證明產生機幾十年前就看到有了。 07/26 18:59

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

Math 板

[其他] GoogleAI達到國際數學奧林匹克銀牌水平

熱門看板

贊助商連結