[新闻] AI专家：攻克围棋原理已找到 GPT学围棋令

时间Tue May 14 22:21:08 2024

AI专家：攻克围棋原理已找到 GPT学围棋令人期待　　国家围棋队官方合作夥伴少年纵横特约报导。　　2017年柯洁泪洒乌镇後，人类围棋与人工智慧围棋之间的对抗彻底没有了悬念。虽然 AlphaGo退役了，但根据他们的相关论文，後来又衍生出了绝艺、天壤、星阵、KataGo等诸多围棋人工智慧，有的已经成为了大家日常研究围棋的工具。在研发这些人工智慧的专家眼里，“人工智慧攻克围棋了吗”这个问题是什麽样的呢？　　天壤与朴廷桓的“人机大战” 　　李凯华，原天壤围棋负责人，2018年人机对弈击败朴廷桓。　　新浪棋牌：您觉得人工智慧攻克围棋了吗？　　李凯华：没有。围棋的变化数量决定了其最优解集合都可能是一个无法估计的大小。人工智慧当然没有攻克围棋。人工智慧目前所做到的是其探索的围棋变化数量比人类已经探索的围棋变化数量大出很多个数量级，大约是：AI目前所有的训练棋谱 / （人类已经下过的所有棋谱+人类已经研究过的变化图）大约 = 1万倍到10万倍。　　这个数量距离围棋合法变化总数也就是10的170次方个盘面，仍然有相当大的差距。　　当然对於科学研究来说，AI已经做到了在现有技术条件下最大限度的探索。原因有两点：　　1。通过数学层面的推导，可以得出通过深度神经网路和强化学习可以不断让棋力变强，所以只要：人类有足够的时间和足够的存放装置可以生成并存储10的170次方个盘面，一定可以找到围棋的最优解。科学研究上走通了这条路就可以了。毕竟即使每一颗原子上都能存一个合法变化的，宇宙里也只有10的70次方个原子，离围棋的合法盘面总数还有 10的100次方倍。　　2。围棋是完全资讯下的零和博弈，相比之下，德扑、麻将这种非完全资讯博弈，以及协作情况下的非零和博弈，甚至跳出博弈论层面，在生成层面，有更复杂的情况需要去研究，所以在14年Ian Goodfellow搞出来了生成式对抗网路，17年Google大脑搞出来了《 Attention is All You Need》，也就是ChatGPT的基础Transformer模型。然後AI研究的领域前沿就一直是在Transformer模型了。　　3。现在来看结论是客观上AI并没有真的攻克围棋，但是原理上已经找通了攻克围棋的方法，所以科学上可以认为“人工智慧已经攻克了围棋”。　　新浪棋牌：您认为当前人工智慧围棋最高水准达到了什麽程度？　　李凯华：1。因为围棋的合法盘面数是10的170次方，人类大概探索过不超过100万种变化，人工智慧探索过差不多100亿种变化。即使如此，还有10的160次方种变化，所以如果围棋上帝是100的话，目前AI探索了不到兆分之一。人类是AI的万分之一。离之前说的 7%，都相去甚远。　　2。当前人工智慧的最高水准如果按最新的KataGo的强化学习来说，最新的模型达到了13500左右的Elo分。　　3。注意Elo分只能用来比较同一个体系下的相互强弱，也就是AI的Elo分和人的等级分是两个体系，不能直接比较数值。除非找到一个锚点，比如用李世石的Elo分来估计 AlphaGo Lee版本的棋力。　　4。但是只有两个人有充分的对局之後，Elo分所体现的强弱才有效，所以比如古力和李世石两个人下了几十盘棋，他们之间的Elo分差距可以表示他们的棋力强弱，但是想要Elo分的误差在5分以内，两个选手需要对局至少89局。想要误差在3分以内，两个选手需要对局至少200局。所以所谓用李世石的Elo分带入AlphaGo的Elo分再比较AlphaGo和当时的棋手之间的棋力差距，纯属娱乐。对局太少。　　5。 Elo分还有膨胀的现象，即如果模型都是同一个风格，或者同一个体系的话，同时没有外部模型的干扰，如果一个阶段的模型出现过拟合的现象，那麽很快分数就会因为这些模型被膨胀起来。後续也无法进行修正。　　6。目前如果粗略估计一下棋力的话，最强的KataGo如果搭配很好的分散式伺服器，比如说给个100张A800显卡，或者最新的那个GB800显卡，让人类最强棋手3-4子是可能的。不过那一局棋的电费恐怕得小10万了。　　2018年与天壤对弈的朴廷桓九段　　新浪棋牌：後续研究的终点在哪里，还有无难关？　　李凯华： 1。从AlphaGo到Leela到KataGo的路线相当於让一个婴儿只看棋谱学下棋。脑子只会下棋。所以需要大量的棋谱来教他。同时因为他其实是看图学下棋，没有逻辑推理能力，所以想要变强只能不停地自己下，看更多的变化来学习下棋。显得很笨重。　　2。後续可能会希望让ChatGPT，一个10几岁智商但是什麽都会的孩子，但是有一定的语言方面的推理能力，看能不能不通过看图的方式，而是研究棋谱的方式来学下棋，有没有可能用更少的棋谱来实现跟AlphaGo一样的强度。甚至等更强的ChatGPT 5.0版本，如果能相当於一个成年人的推理能力，应该会更顺利。　　人机对弈现场　　新浪棋牌：人工智慧围棋陪练技术有何发展？　　李凯华： 1。如果能走通让语言模型来下棋的话，那麽让语言模型来解释它为什麽这麽下棋就是一件很轻松的事情了。　　2。目前的话职业棋手主要还是靠背和猜来理解人工智慧下的棋。　　3。面向孩子的AI陪练的等级和难度非常能把握，因为孩子棋力的提升是不连续的，往往是一个阶段性跃升的情况。而且不同的棋力所对应的计算力、博弈能力也不是线性提升的，导致目前所有的调参都很蠢，基本上是无参可调的情况。这一方面可能是一个长期存在的问题。不妨等着4（a）解决了之後交给AI来解决吧。　　（周游） https://sports.sina.com.cn/go/2024-05-14/doc-inavenmw3616642.shtml --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 180.176.190.76 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/GO/M.1715696472.A.435.html

1^F：推 KAOKAOKAO: 但是没有理由认为 Chain of Thought 串出来的「解析」 05/15 14:11

2^F：→ KAOKAOKAO: 真的是它下出那手的理由 05/15 14:11

3^F：推 aegis43210: 近期围棋AI并没有革命性的进化，对GPT下棋应该也没明 05/15 23:10

4^F：→ aegis43210: 显优势 05/15 23:10

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

GO 板

[新闻] AI专家：攻克围棋原理已找到 GPT学围棋令

热门看板

赞助商连结