Math 板


LINE

AI助攻「菜鸟数学家」解决忙碌海狸问题,陶哲轩转发分享 https://www.jiqizhixin.com/articles/2024-07-04-10 在AI 的帮助下,越来越多的数学问题得到了解决。 AI在数学领域的应用对大家来说并不陌生了。 数学家陶哲轩作为倡议者,一直走在使用 AI辅助证明的前端。 他倡导使用像Lean和Coq这样的证明助手工具。 这些工具可以形式 化和验证复杂的数学证明,减少人为错误的可能性。 也有不少数学家在他的启发下有了 新成果,例如利用AI形式化费马大定理的证明。 他参与了由Talia Ringer发起的AI在数 学中资源清单的推广和编辑工作。 这个资源清单专注於AI for Math,为那些希望进入数 学AI 领域的人提供帮助。 陶哲轩在推进专案研究进度的同时,也试着学习如何创建动画图表,他决定对零密度估计 进行文献回顾。 他讲到,自己一直很好奇为什麽没有全面的综述来涵盖这些年来建立的 所有零密度定理,现在他清楚了,是因为文献太过复杂,尤其在3/4m<1的这个范围 , 使用了多种方法。 界限通常是逐段的,主要是因为这些方法依赖控制整数矩而不是分 数矩。 然而,这些界限虽然以人类可读形式陈述时显得杂乱,但对电脑来说却很容易处 理。 陶哲轩将所有的界限汇总到一个Python档案中,并用它创建了附带的动画。 https://reurl.cc/3X2ZKl 在这篇部落格的评论中,陶哲轩补充道: 不得不说,我确实使用了一些AI辅助来帮助编写程式码。 在某种程度上,我将AI辅 助视为一种心理支持——当我知道除了传统的调试和搜寻方法外,还有AI工具可以提供初 始程式码并自动完成部分程式码时,更容易说服自己花时间编程。 不过,我发现这些工 具在调试方面并不是特别有用。 不过,GPT能够快速创建一个简单的动画测试函数,并且 在第一次尝试时就成功编译了。 尽管如此,我仍花了大部分时间来调整和调试,才得到 了我想要的动画。 显然,这次尝试的结果还不错。 後续陶哲轩也转发了一篇文章,生动地展示了数学智能 助理如何帮助一群「菜鸟数学家」解决了数学界最难解的问题。 原文连结: https://www.quantamagazine.org/amateur-mathematicians-find-fifth-busy-beaver-turing-machine-20240702/ 程式设计师通常希望最大程度减少程式码运行所需的时间,忙碌海狸函数(BB(n))这个 计算机科学中的经典问题却在探寻,一个简单的计算机程式在终止之前可以运行多长时间 ,即 图灵机 在特定状态和符号数量限制下所能达到的最大运行步数。 最近的研究表明,寻找长时间运行的电脑程式可以揭示数学知识的现状,甚至告诉我们哪 些是可知的。 忙碌海狸游戏为评估某些问题的难度提供了一个具体的 基准 ,例如未解 决的哥德巴赫猜想和黎曼假设。 它甚至提供了一个探索数学 逻辑 计算极限的视角。 那要怎麽理解忙碌海狸函数呢? 想像一个小机器人( 图灵机 ),它有一套指令(对应 图 灵机 的状态),可以在一条无限长的纸带上移动和写字。 纸带最开始是空白的。 这个机 器人的目标是尽可能在纸带上写字,然後停下来。 忙碌海狸问题就是要找到这样的机器 人,在给定状态数下可以写最多字的情况。 这个问题由匈牙利裔数学家蒂博尔·拉多(Tibor Radó)在1962年提出,由於其复杂性 和递增的计算需求,忙碌海狸函数(BB(n))的值在n较小时可以确定,但随着n的增加, 问题变得极为困难,目前只有前几个BB(n)值被确定。 1962年,蒂博尔·拉多重新描述了关於 图灵机 行为的着名不可解问题,提出了忙碌海狸 挑战。 单规则的情况很简单,因为实际上只有两种可能性。 如果规则规定 图灵机 在看到0 时 停止计算,它将在第一步停止。 有了两条规则,就有超过6,000 个不同的 图灵机 需要 考虑;有了三条规则,这个数字就会膨胀到数百万,有了四条规则,这个数字就会膨胀到 数十亿。 手动计算所有这些情况是不可能的。 这意味着这个问题只能用计算机来解决。 一个简单的程式可以算出BB(2) = 6。 但 BB(3) 已经很难找到了。 而更棘手的是无限循环问题。 有的时候 图灵机 并没有真正停 机,而是陷入了无限循环。 研究者需要找到一种判断 图灵机 是否真正停机的判断方法 。 在拉多推出忙碌海狸挑战後不久,一些研究人员就开始了搜寻。 从1964年到1974年, Allen Brady花了十年,证出了BB(4) 的数值。 研究启动时,他还是俄勒冈州立大学数学 系研究生,发表时,他已然成为内华达大学雷诺分校的电脑科学教授。 此後40年,研究者前赴後继,但始终无法捕捉第五个忙碌海狸函数的身影。 如果 图灵 机 需要遵守五条规则,潜在符合可能的 图灵机 数量接近17 兆台——即使以每毫秒一台 的速度列出所有 图灵机 ,也需要500 多年的时间。 狩猎「海狸」的猎人们,将 图灵 机 的范围不断缩小。 1989年,德国程式设计师Heiner Marxen 发现了一个在 47,176,870 步後停止的 图灵机 ,但是他还需证明所有剩余的机器在此时仍未停机,要 算出进一步的结果,还需要30年。 21世纪初,迷恋研究BB(5) 的保加利亚电脑科学家Georgi Ivanov Geogiev,将17亿万台 图灵机 的名单精简到了只剩43个。 在一封电子邮件中,Geogiev表示,研究忙碌海狸函 数问题让他疲惫不堪。 对於「忙碌海狸」的「猎人」们,这是常见的结果。 几十年来, 他们独自或结对工作,却没有得到学术界的广泛认可。 需要集体努力才能完成这项工作 。 2015年,一位名叫Code Golf Addict的匿名GitHub用户发布了一个27规则 图灵机 的程式 码,机器只有在哥德巴赫猜想为假时才会停止。 其工作原理是透过所有大於4的偶数进行 计数;对於每一个偶数,它会遍历所有可能的两数之和,检查这对数是否为素数。 当找 到合适的一对素数时,它会移动到下一个偶数并重复此过程。 如果找到一个不能由一对 素数总和组成的偶数,它就会停止。 运行这种无脑机器并不是解决猜测的实际方法,因为我们无法知道它是否会停止。 但是 ,忙碌海狸游戏可以对这个问题提供一些见解。 如果能够计算出BB(27),就可以确定自 动解决哥德巴赫猜想所需的最长时间。 这是因为BB(27)对应的是这台27条规则 图灵机 为了停止所需执行的最大步数。 如果我们知道这个数,我们可以运行这台 图灵机 恰好 那麽多步。 如果它在这段期间停止了,我们就知道哥德巴赫猜想是假的。 但如果它在这 麽多步骤内没有停止,我们就能确定它永远不会停止,从而证明猜想为真。 问题在於,BB(27)是一个无法理解的大数,甚至将其写下来都不可能,更不用说让哥德巴 赫反例机运行这麽多步了。 2016年,类似的结果得出了,这次是Aaronson等人所做的成果。 他们发现了一台744规则 的 图灵机 ,只有在黎曼假设为假的情况下才会停止。 黎曼假设涉及质数的分布问题, 是Clay数学研究所的「千禧年问题」之一,奖金为100万美元。 Aaronson的 图灵机 将在 BB(744)步内自动得出解答。 当然,BB(744)是比BB(27)更难企及的大数。 Aaronson表示,致力於确定更简单的数值, 例如BB(5),可能会发现一些新的、有趣的数论问题。 最近,Aaronson使用忙碌海狸衍生 的尺度来衡量他称之为「不可知阈值」的数学系统整体。 受Aaronson论文的启发,来自Tristan Stérin在Discord上发起了「忙碌的海狸挑战」 。 随着时间推移,线上社群逐渐壮大,来自世界各地的20多名参与者因为验证BB(5)的真 实值相聚。 一位名为Maja Kzioa波兰程式设计师在日常的程式设计工作中常用到Coq智能证明 助手。 Coq是一款强大的工具,用於帮助数学家和程式设计师进行形式化的数学证明和验 证。 它透过Gallina程式语言,让使用者定义数学物件、陈述定理,并一步一步建构证明 。 使用者可以与Coq进行交互,逐步验证每一步的正确性。 Coq也提供了多种自动化工具 ,帮助简化证明流程。 广泛应用於数学研究、程序验证和软体开发,Coq提高了证明和程 式码的准确性和可靠性。 在学习了Coq之後,Maja开始寻找一个开放性的问题,就在这时,她刷到了「忙碌的海狸 挑战」,并开始将社区内的几个证明用Coq来解决。 和「忙碌的海狸挑战」使用的其他电 脑程式不同,在Coq 证明中,除非每一行都符合 逻辑 ,否则程式码将无法运行,因此几 乎不可能出错。 因此,社区里的成员渐渐对使用Coq「上瘾」了。 於是,在接下来的几 个月里,Coq接手了社区内未完成的对BB(5)的证明。 2024年5月10日,「忙碌的海狸挑战」社区中一位神秘的成员发了一条讯息,称「BB(5) 的Coq 证明已完成。」结果证明,30多年前,德国程式设计师Heiner Marxen和他的搭档 Buntrock发现的那台 图灵机 在走了4700 万步之後就停了下来,这其实就是第五只忙碌 的海狸——BB(5)的真实值。 伊利诺大学厄巴纳-香槟分校电脑科学系的助理教授Talia在看完用Coq解决BB(5)的真实值 的故事後表示,她喜欢这些数学证明助手的原因之一,是它们能让更多的人参与数学研究 当中。 AI正如陶哲轩所说的那样,帮助数学家处理更多问题,让数学之谜逐渐解开。 参考连结: https://mathstodon.xyz/@TaliaRinger/112719444060361451 https://mathstodon.xyz/@tao https://www.quantamagazine.org/how-the-slowest-computer-programs-illuminate-maths-fundamental-limits-20201210/ --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.253.175.228 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Math/M.1720149253.A.B9A.html







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Tech_Job站内搜寻

TOP