[其他] 陶哲轩等式理论计画57天完成2200万证明

时间Sat Nov 23 15:51:46 2024

https://www.qbitai.com/2024/11/222842.html 陶哲轩宣布「等式理论计画」成功，57天完成2200万+数学关系证明一水专案进度比陶哲轩预期更快 57天，人类和AI合作搞定了4694个等式之间22028942个蕴含关系！大神陶哲轩激动宣布：等式理论计划，成功。 “等式理论计划”，由陶哲轩本人在2024年9月25日发起，目的是探索按蕴含关系排序的原群（magma）等式理论空间。特别的是，在这个计画里，陶哲轩不仅集合了人类数学家的力量，还把 AI工具纳入了合作者的范围，包括 ChatGPT 、 Claude 和 GitHub Copilot 。计画发起当日就正式启动，仅仅9天，计画进度就达到了 99.866% 。而现在，在2200万+个需要证明的蕴含关系中，8178279个已被证实，13855193个已被证伪，仅有162个还悬而未决。按陶哲轩的说法，就是离「宣布完全成功」基本上只是「时间问题」：因此，我们现在已经开始着手撰写论文了。什麽是“等式理论计划” 还是先来扒一扒陶哲轩这回究竟是整了个什麽样的活儿。简单说，「等式理论计画」是指：采用”数学家+AI（包括自动定理证明系统和大模型）+证明辅助语言Lean”这样的协作方式，构建一个展示 4694个 magma等式（最多四次使用magma操作）之间所有蕴含关系的“ 蕴含图」。首先，这个计画的最初灵感源自於陶哲轩本人对「去中心化」研究方式的畅想。传统上，大部分数学研究计画都由少数专业数学家（通常1~5名）进行，每个人都对自己的部分更专业，彼此可以相互验证。不过也是因为有验证环节，组织更大规模的数学计画（尤其是需要涉及公众贡献），一直具有挑战性。而现在，透过AI工具以及Lean这样的证明辅助语言，数学专案的大规模协作变得可能。打前阵的就有开源社群寻找梅森素数的成功尝试，在这个代号GIMPS的志工计画中，任何拥有强大PC或GPU的人都可以加入寻找梅森素数。虽然证明助手这样的AI工具在这个专案里用得还不多，但表达的精神是类似的。因此，在进行等式理论计画之前，陶哲轩就打算搞一个实验：在一个数学专案中，聚齐专业/业余数学家、AI工具、证明辅助语言Lean等，一同干大事！受去年MathOverflow上一个等式问题的启发，这一次，陶哲轩将目光瞄准了代数领域中的 magma。当时的问题是酱婶儿的：交换恒等式和常量恒等式之间是否存在等价关系？撇开具体问题不谈，这里主要想说明magma 涉及等式之间的关系。简单来说，magma是一个代数结构，它由一个集合和一个在该集合上定义的二元运算组成，但不要求满足任何额外的代数性质，如结合律、交换律等。我们常见的有关magma的等式包括： https://www.qbitai.com/wp-content/uploads/replace/61f72f9841578d4672fe7bb14a473497.jpeg

而等式理论计划，就是要找出magma中不同等式之间的等价、推出与非推出关系。就拿上面这11个等式来看，最终的关系图be like： https://www.qbitai.com/wp-content/uploads/replace/7f5721c969934397beca04d568a59483.jpeg

可以看出，常量公理等式（1）蕴含了其他所有等式，即如果1成立，那麽其他等式也自动成立；而反身公理等式（11）由於最宽松（x=x），几乎所有的magma都满足这个公理。回到计画本身，陶哲轩等人在初始阶段集中研究了那些只包含一个方程式的magma定律，这些方程式最多包含四个magma操作（即二元运算）。举个例子，如果我们有一个magma（M，^，其中M是元素的集合，O定义在M上的二元运算。则一个「最多四次使用magma操作」的表达式如下： https://imgur.com/rMowiSn 其中,,,,都是集合M中的元素，每次*的使用都算一次magma操作。这样的等式定律有 4694个，由於每个定律都可能蕴含其他4693个定律（一个定律不能蕴含自身），因此总共有4694*(4694-1) = 22,028,942个可能的蕴含关系需要被证明或反驳。这里的蕴含关系包括“蕴含”和“反蕴含”，其中“蕴含”关系又涉及两种类型：已证明的蕴含：在Lean中已验证推测的蕴含：尚未在Lean中验证，可能由人或电脑生成更多项目细节，陶哲轩在专案日志中，留下了非常详细的记录—— 9天进度99.866%，大模型有用但“表现低於预期” 简单总结「等式理论计画」的进度，就是一个字：快。陶哲轩本人都说：这个专案的进度远远超出我的预期。有多快？仅仅 48小时，很大一部分蕴含关系就已「解决在望」。计画启动第5天，计画参与者们已从最初的约2,200万条蕴含关系中解决了大量简单蕴含，只剩下约300万的数量尚待解决。项目启动第9天，随着首次重大重构的完成——合作者们改进了magma的运算符号，以使 Lean代码的编译速度显着加快，以及一些研究问题的推进，项目完成度一举从 87% 跃升到了 99.866% 。第19天，专案进度来到 99.9963% 。陶哲轩在他的部落格文章中提及，写论文的事已经提上日程，并且可能包含数十名作者。 GitHub显示此专案有45位贡献者： https://www.qbitai.com/wp-content/uploads/replace/e9faa5cee56f713e751926baedf02acd.jpeg

到了11月21日，也就是专案第57天，随着主专案最後一个未解决的蕴含关系被搞定（待验证），「等式理论计画」目标已宣告达成。论文可以正式开写了。陶哲轩透露，论文的框架早已拟好，但後续还需要大量工作来更新，并转换为可以提交的形式。日志中也详细谈到了大模型工具所发挥的作用。第一天，陶哲轩就对GitHub Copilot大加赞赏： GitHub Copilot在处理日常任务时非常有用，例如输入需要证明的新Lean定理，或更新蓝图来整合最新的PR结果。他具体举了个例子：要将Lean转换为LaTeX，把Lean程式码贴为注释，开始敲LaTeX， GitHub Copilot就会自动补全剩下的内容。不过，陶哲轩也坦率表示，大模型们在专案中的表现“低於预期” ，更多的时候，数学家们用到的还是“经典AI”，比如自动定理证明器Vampire等。他也提到：计画的参与者非常多元化，包括处於职业生涯各个阶段的数学家和电脑科学家，学生和业余爱好者。 Lean在整合人类和机器生成的贡献方面表现出色。机器产生的部分在数量上是贡献的最主要来源，不过，许多自动产生的结果最初是人类在特殊情况下得出的，之後被进一步推广和形式化。具体到专案中，GitHub Copilot的主要作用还是加快程式码的编写，而Claude则被用来帮忙创建视觉化工具，例如这个「等式浏览器」： https://www.qbitai.com/wp-content/uploads/replace/1507c4b2f9c361314d206e9e5807a3c6.jpeg

ChatGPT则更多扮演激发数学家们灵感的小助手角色。对陶哲轩来说，ChatGPT能帮他快速掌握通用代数的一些细节。而lyphyser、Daniel Weber、Fan Zheng和Bhavik Mehta这几位计画参与者，也透过跟 ChatGPT的讨论，证明1659这个等式可能具有非平凡的合流性。主项目里程碑达成，不过「等式理论计画」的其他衍生项目仍在进行中，例如研究在有限原群限制下的类似蕴含图、对蕴含图进行资料分析等等。陶哲轩也再次强调了这个计画和AI的连结：希望专案中的蕴含关系能够作为未来AI数学工具的基准测试。除了陶哲轩之外，专案的主要维护人还有义大利数学家Pietro Monticone和Shreyas Srinivas。两位都是Lean重度爱好者。 △Shreyas Srinivas主页 Pietro Monticone也和他特伦托大学的同事们一起搞过指数3的费马大定理的Lean版证明。 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.253.138.68 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Math/M.1732348314.A.995.html

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Math 板

[其他] 陶哲轩等式理论计画57天完成2200万证明

热门看板

赞助商连结