GO 板


LINE

看板 GO  RSS
AI专家:攻克围棋原理已找到 GPT学围棋令人期待   国家围棋队官方合作夥伴少年纵横特约报导。   2017年柯洁泪洒乌镇後,人类围棋与人工智慧围棋之间的对抗彻底没有了悬念。虽然 AlphaGo退役了,但根据他们的相关论文,後来又衍生出了绝艺、天壤、星阵、KataGo等 诸多围棋人工智慧,有的已经成为了大家日常研究围棋的工具。在研发这些人工智慧的专 家眼里,“人工智慧攻克围棋了吗”这个问题是什麽样的呢?   天壤与朴廷桓的“人机大战”   李凯华,原天壤围棋负责人,2018年人机对弈击败朴廷桓。   新浪棋牌:您觉得人工智慧攻克围棋了吗?   李凯华:没有。围棋的变化数量决定了其最优解集合都可能是一个无法估计的大小。 人工智慧当然没有攻克围棋。人工智慧目前所做到的是其探索的围棋变化数量比人类已经 探索的围棋变化数量大出很多个数量级,大约是:AI目前所有的训练棋谱 / (人类已经 下过的所有棋谱+人类已经研究过的变化图) 大约 = 1万倍到10万倍。   这个数量距离围棋合法变化总数也就是10的170次方个盘面,仍然有相当大的差距。   当然对於科学研究来说,AI已经做到了在现有技术条件下最大限度的探索。原因有两 点:   1。 通过数学层面的推导,可以得出通过深度神经网路和强化学习可以不断让棋力变 强,所以只要:人类有足够的时间和足够的存放装置可以生成并存储10的170次方个盘面 ,一定可以找到围棋的最优解。科学研究上走通了这条路就可以了。毕竟即使每一颗原子 上都能存一个合法变化的,宇宙里也只有10的70次方个原子,离围棋的合法盘面总数还有 10的100次方倍。   2。 围棋是完全资讯下的零和博弈,相比之下,德扑、麻将这种非完全资讯博弈,以 及协作情况下的非零和博弈,甚至跳出博弈论层面,在生成层面,有更复杂的情况需要去 研究,所以在14年Ian Goodfellow搞出来了生成式对抗网路,17年Google大脑搞出来了《 Attention is All You Need》,也就是ChatGPT的基础Transformer模型。然後AI研究的 领域前沿就一直是在Transformer模型了。   3。 现在来看结论是客观上AI并没有真的攻克围棋,但是原理上已经找通了攻克围棋 的方法,所以科学上可以认为“人工智慧已经攻克了围棋”。   新浪棋牌:您认为当前人工智慧围棋最高水准达到了什麽程度?   李凯华:1。因为围棋的合法盘面数是10的170次方,人类大概探索过不超过100万种 变化,人工智慧探索过差不多100亿种变化。即使如此,还有10的160次方种变化,所以如 果围棋上帝是100的话,目前AI探索了不到兆分之一。人类是AI的万分之一。离之前说的 7%,都相去甚远。   2。 当前人工智慧的最高水准如果按最新的KataGo的强化学习来说,最新的模型达到 了13500左右的Elo分。   3。 注意Elo分只能用来比较同一个体系下的相互强弱,也就是AI的Elo分和人的等级 分是两个体系,不能直接比较数值。除非找到一个锚点,比如用李世石的Elo分来估计 AlphaGo Lee版本的棋力。   4。 但是只有两个人有充分的对局之後,Elo分所体现的强弱才有效,所以比如古力 和李世石两个人下了几十盘棋,他们之间的Elo分差距可以表示他们的棋力强弱,但是想 要Elo分的误差在5分以内,两个选手需要对局至少89局。想要误差在3分以内,两个选手 需要对局至少200局。所以所谓用李世石的Elo分带入AlphaGo的Elo分再比较AlphaGo和当 时的棋手之间的棋力差距,纯属娱乐。对局太少。   5。 Elo分还有膨胀的现象,即如果模型都是同一个风格,或者同一个体系的话,同 时没有外部模型的干扰,如果一个阶段的模型出现过拟合的现象,那麽很快分数就会因为 这些模型被膨胀起来。後续也无法进行修正。   6。 目前如果粗略估计一下棋力的话,最强的KataGo如果搭配很好的分散式伺服器, 比如说给个100张A800显卡,或者最新的那个GB800显卡,让人类最强棋手3-4子是可能的 。不过那一局棋的电费恐怕得小10万了。   2018年与天壤对弈的朴廷桓九段   新浪棋牌:後续研究的终点在哪里,还有无难关?   李凯华: 1。 从AlphaGo到Leela到KataGo的路线相当於让一个婴儿只看棋谱学下棋 。脑子只会下棋。所以需要大量的棋谱来教他。同时因为他其实是看图学下棋,没有逻辑 推理能力,所以想要变强只能不停地自己下,看更多的变化来学习下棋。显得很笨重。   2。 後续可能会希望让ChatGPT,一个10几岁智商但是什麽都会的孩子,但是有一定 的语言方面的推理能力,看能不能不通过看图的方式,而是研究棋谱的方式来学下棋,有 没有可能用更少的棋谱来实现跟AlphaGo一样的强度。甚至等更强的ChatGPT 5.0版本,如 果能相当於一个成年人的推理能力,应该会更顺利。   人机对弈现场   新浪棋牌:人工智慧围棋陪练技术有何发展?   李凯华: 1。 如果能走通让语言模型来下棋的话,那麽让语言模型来解释它为什麽 这麽下棋就是一件很轻松的事情了。   2。 目前的话职业棋手主要还是靠背和猜来理解人工智慧下的棋。   3。 面向孩子的AI陪练的等级和难度非常能把握,因为孩子棋力的提升是不连续的, 往往是一个阶段性跃升的情况。而且不同的棋力所对应的计算力、博弈能力也不是线性提 升的,导致目前所有的调参都很蠢,基本上是无参可调的情况。这一方面可能是一个长期 存在的问题。不妨等着4(a)解决了之後交给AI来解决吧。   (周游) https://sports.sina.com.cn/go/2024-05-14/doc-inavenmw3616642.shtml --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 180.176.190.76 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/GO/M.1715696472.A.435.html
1F:推 KAOKAOKAO: 但是没有理由认为 Chain of Thought 串出来的「解析」 05/15 14:11
2F:→ KAOKAOKAO: 真的是它下出那手的理由 05/15 14:11
3F:推 aegis43210: 近期围棋AI并没有革命性的进化,对GPT下棋应该也没明 05/15 23:10
4F:→ aegis43210: 显优势 05/15 23:10







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:WOW站内搜寻

TOP