[其他] AI助攻菜鸟数学家解决忙碌海狸问题，陶哲

时间Fri Jul 5 11:14:04 2024

AI助攻「菜鸟数学家」解决忙碌海狸问题，陶哲轩转发分享 https://www.jiqizhixin.com/articles/2024-07-04-10 在AI 的帮助下，越来越多的数学问题得到了解决。 AI在数学领域的应用对大家来说并不陌生了。数学家陶哲轩作为倡议者，一直走在使用 AI辅助证明的前端。他倡导使用像Lean和Coq这样的证明助手工具。这些工具可以形式化和验证复杂的数学证明，减少人为错误的可能性。也有不少数学家在他的启发下有了新成果，例如利用AI形式化费马大定理的证明。他参与了由Talia Ringer发起的AI在数学中资源清单的推广和编辑工作。这个资源清单专注於AI for Math，为那些希望进入数学AI 领域的人提供帮助。陶哲轩在推进专案研究进度的同时，也试着学习如何创建动画图表，他决定对零密度估计进行文献回顾。他讲到，自己一直很好奇为什麽没有全面的综述来涵盖这些年来建立的所有零密度定理，现在他清楚了，是因为文献太过复杂，尤其在3/4m＜1的这个范围，使用了多种方法。界限通常是逐段的，主要是因为这些方法依赖控制整数矩而不是分数矩。然而，这些界限虽然以人类可读形式陈述时显得杂乱，但对电脑来说却很容易处理。陶哲轩将所有的界限汇总到一个Python档案中，并用它创建了附带的动画。 https://reurl.cc/3X2ZKl 在这篇部落格的评论中，陶哲轩补充道：不得不说，我确实使用了一些AI辅助来帮助编写程式码。在某种程度上，我将AI辅助视为一种心理支持——当我知道除了传统的调试和搜寻方法外，还有AI工具可以提供初始程式码并自动完成部分程式码时，更容易说服自己花时间编程。不过，我发现这些工具在调试方面并不是特别有用。不过，GPT能够快速创建一个简单的动画测试函数，并且在第一次尝试时就成功编译了。尽管如此，我仍花了大部分时间来调整和调试，才得到了我想要的动画。显然，这次尝试的结果还不错。後续陶哲轩也转发了一篇文章，生动地展示了数学智能助理如何帮助一群「菜鸟数学家」解决了数学界最难解的问题。原文连结： https://www.quantamagazine.org/amateur-mathematicians-find-fifth-busy-beaver-turing-machine-20240702/ 程式设计师通常希望最大程度减少程式码运行所需的时间，忙碌海狸函数（BB(n））这个计算机科学中的经典问题却在探寻，一个简单的计算机程式在终止之前可以运行多长时间，即图灵机在特定状态和符号数量限制下所能达到的最大运行步数。最近的研究表明，寻找长时间运行的电脑程式可以揭示数学知识的现状，甚至告诉我们哪些是可知的。忙碌海狸游戏为评估某些问题的难度提供了一个具体的基准，例如未解决的哥德巴赫猜想和黎曼假设。它甚至提供了一个探索数学逻辑计算极限的视角。那要怎麽理解忙碌海狸函数呢？想像一个小机器人( 图灵机 )，它有一套指令(对应图灵机的状态)，可以在一条无限长的纸带上移动和写字。纸带最开始是空白的。这个机器人的目标是尽可能在纸带上写字，然後停下来。忙碌海狸问题就是要找到这样的机器人，在给定状态数下可以写最多字的情况。这个问题由匈牙利裔数学家蒂博尔·拉多（Tibor Radó）在1962年提出，由於其复杂性和递增的计算需求，忙碌海狸函数（BB(n)）的值在n较小时可以确定，但随着n的增加，问题变得极为困难，目前只有前几个BB(n)值被确定。 1962年，蒂博尔·拉多重新描述了关於图灵机行为的着名不可解问题，提出了忙碌海狸挑战。单规则的情况很简单，因为实际上只有两种可能性。如果规则规定图灵机在看到0 时停止计算，它将在第一步停止。有了两条规则，就有超过6,000 个不同的图灵机需要考虑；有了三条规则，这个数字就会膨胀到数百万，有了四条规则，这个数字就会膨胀到数十亿。手动计算所有这些情况是不可能的。这意味着这个问题只能用计算机来解决。一个简单的程式可以算出BB(2) = 6。但 BB(3) 已经很难找到了。而更棘手的是无限循环问题。有的时候图灵机并没有真正停机，而是陷入了无限循环。研究者需要找到一种判断图灵机是否真正停机的判断方法。在拉多推出忙碌海狸挑战後不久，一些研究人员就开始了搜寻。从1964年到1974年， Allen Brady花了十年，证出了BB(4) 的数值。研究启动时，他还是俄勒冈州立大学数学系研究生，发表时，他已然成为内华达大学雷诺分校的电脑科学教授。此後40年，研究者前赴後继，但始终无法捕捉第五个忙碌海狸函数的身影。如果图灵机需要遵守五条规则，潜在符合可能的图灵机数量接近17 兆台——即使以每毫秒一台的速度列出所有图灵机，也需要500 多年的时间。狩猎「海狸」的猎人们，将图灵机的范围不断缩小。 1989年，德国程式设计师Heiner Marxen 发现了一个在 47,176,870 步後停止的图灵机，但是他还需证明所有剩余的机器在此时仍未停机，要算出进一步的结果，还需要30年。 21世纪初，迷恋研究BB(5) 的保加利亚电脑科学家Georgi Ivanov Geogiev，将17亿万台图灵机的名单精简到了只剩43个。在一封电子邮件中，Geogiev表示，研究忙碌海狸函数问题让他疲惫不堪。对於「忙碌海狸」的「猎人」们，这是常见的结果。几十年来，他们独自或结对工作，却没有得到学术界的广泛认可。需要集体努力才能完成这项工作。 2015年，一位名叫Code Golf Addict的匿名GitHub用户发布了一个27规则图灵机的程式码，机器只有在哥德巴赫猜想为假时才会停止。其工作原理是透过所有大於4的偶数进行计数；对於每一个偶数，它会遍历所有可能的两数之和，检查这对数是否为素数。当找到合适的一对素数时，它会移动到下一个偶数并重复此过程。如果找到一个不能由一对素数总和组成的偶数，它就会停止。运行这种无脑机器并不是解决猜测的实际方法，因为我们无法知道它是否会停止。但是，忙碌海狸游戏可以对这个问题提供一些见解。如果能够计算出BB(27)，就可以确定自动解决哥德巴赫猜想所需的最长时间。这是因为BB(27)对应的是这台27条规则图灵机为了停止所需执行的最大步数。如果我们知道这个数，我们可以运行这台图灵机恰好那麽多步。如果它在这段期间停止了，我们就知道哥德巴赫猜想是假的。但如果它在这麽多步骤内没有停止，我们就能确定它永远不会停止，从而证明猜想为真。问题在於，BB(27)是一个无法理解的大数，甚至将其写下来都不可能，更不用说让哥德巴赫反例机运行这麽多步了。 2016年，类似的结果得出了，这次是Aaronson等人所做的成果。他们发现了一台744规则的图灵机，只有在黎曼假设为假的情况下才会停止。黎曼假设涉及质数的分布问题，是Clay数学研究所的「千禧年问题」之一，奖金为100万美元。 Aaronson的图灵机将在 BB(744)步内自动得出解答。当然，BB(744)是比BB(27)更难企及的大数。 Aaronson表示，致力於确定更简单的数值，例如BB(5)，可能会发现一些新的、有趣的数论问题。最近，Aaronson使用忙碌海狸衍生的尺度来衡量他称之为「不可知阈值」的数学系统整体。受Aaronson论文的启发，来自Tristan Stérin在Discord上发起了「忙碌的海狸挑战」。随着时间推移，线上社群逐渐壮大，来自世界各地的20多名参与者因为验证BB(5)的真实值相聚。一位名为Maja Kzioa波兰程式设计师在日常的程式设计工作中常用到Coq智能证明助手。 Coq是一款强大的工具，用於帮助数学家和程式设计师进行形式化的数学证明和验证。它透过Gallina程式语言，让使用者定义数学物件、陈述定理，并一步一步建构证明。使用者可以与Coq进行交互，逐步验证每一步的正确性。 Coq也提供了多种自动化工具，帮助简化证明流程。广泛应用於数学研究、程序验证和软体开发，Coq提高了证明和程式码的准确性和可靠性。在学习了Coq之後，Maja开始寻找一个开放性的问题，就在这时，她刷到了「忙碌的海狸挑战」，并开始将社区内的几个证明用Coq来解决。和「忙碌的海狸挑战」使用的其他电脑程式不同，在Coq 证明中，除非每一行都符合逻辑，否则程式码将无法运行，因此几乎不可能出错。因此，社区里的成员渐渐对使用Coq「上瘾」了。於是，在接下来的几个月里，Coq接手了社区内未完成的对BB(5)的证明。 2024年5月10日，「忙碌的海狸挑战」社区中一位神秘的成员发了一条讯息，称「BB(5) 的Coq 证明已完成。」结果证明，30多年前，德国程式设计师Heiner Marxen和他的搭档 Buntrock发现的那台图灵机在走了4700 万步之後就停了下来，这其实就是第五只忙碌的海狸——BB(5)的真实值。伊利诺大学厄巴纳-香槟分校电脑科学系的助理教授Talia在看完用Coq解决BB(5)的真实值的故事後表示，她喜欢这些数学证明助手的原因之一，是它们能让更多的人参与数学研究当中。 AI正如陶哲轩所说的那样，帮助数学家处理更多问题，让数学之谜逐渐解开。参考连结： https://mathstodon.xyz/@TaliaRinger/112719444060361451 https://mathstodon.xyz/@tao https://www.quantamagazine.org/how-the-slowest-computer-programs-illuminate-maths-fundamental-limits-20201210/ --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.253.175.228 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Math/M.1720149253.A.B9A.html

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Math 板

[其他] AI助攻菜鸟数学家解决忙碌海狸问题，陶哲

热门看板

赞助商连结