作者wadashi1 (阿拉丁)
看板GO
标题[情报]DeepMind宣布更强的AlphaGo算法
时间Tue Dec 31 00:17:47 2019
一个月前的新闻了
冥冥天意:李世石退役 DeepMind宣布更强的AlphaGo算法
原文网址:
https://kknews.cc/tech/zyojoql.html
11月19日,韩国棋院宣布,李世石九段辞去职业棋手职务,正式宣布退役。在与AlphaGo
的第一次人机大战当中,李世石神奇的一挖,成就了人类与AlphaGo唯一的胜局。
或许是天意,就在昨天,谷歌的DeepMind再次发表论文,宣布推出全新的算法MuZero,通
过这一算法,可以加快人工智慧的训练速度。目前在围棋、西洋棋、将棋以及数十个
Atari游戏的学习表现当中优於目前所有算法,具体到围棋上,已经可以超越之前的
AlphaZero。
==============================================
另一个说明MuZero的网页:
https://www.chainnews.com/zh-hant/articles/175196541080.htm
通用 AlphaGo 诞生?DeepMind 的 MuZero 在多种棋类游戏中超越人类
DeepMind 近期的一项研究提出了 MuZero 算法,该算法在不具备任何底层动态知识的情
况下,通过结合基於树的搜索和学得模型,在雅达利 2600 游戏中达到了 SOTA 表现,在
国际象棋、日本将棋和围棋的精确规划任务中可以匹敌 AlphaZero,甚至超过了提前得知
规则的围棋版 AlphaZero。
==============================================
就在大家都说deepmind的AlphaGo已退役,不可能再出来,什麽都是张飞打岳飞!
殊不知,Deepmind依然继续再研究,再次超越Alphazero的新演算法MuZero再次横空出现!
就在李世石和leelazero相继表明退休及结束训练的这时候。
要不要让张飞可以跟岳飞打,决定权在Deepmind,祖师爷不想跟徒子徒孙打也没办法。
AlphaZero是在既定规则下训练出来会下围棋。
MuZero据说层次更高,在没有规则下..由人类诱导下,发明了围棋,又成为棋圣!
希望MuZero可以在让子棋上有更强大的发挥!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 106.104.98.191 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/GO/M.1577722671.A.3BC.html
1F:推 kenwufederer: 期待棋谱 12/31 00:40
※ 编辑: wadashi1 (106.104.98.191 台湾), 12/31/2019 00:52:10
2F:推 rnoro: 不过deepmind的文章中好像没有说MuZero超越AlphaZero, 12/31 03:57
3F:→ rnoro: 我想他的意思是在学习的效率上可以匹配(match),但文章的 12/31 03:58
4F:→ rnoro: 的图表中并没有表明MuZero的棋力更高明~ 12/31 03:58
5F:→ rnoro: 事实上在figure 3A中,MuZero在长期的表现中还是稍稍输给 12/31 04:01
6F:→ rnoro: AlphaZero 12/31 04:01
7F:推 aegis43210: 话说Leela被bjiyxo大续命後,目前又卡关了 12/31 04:45
8F:推 HeterCompute: 强是强在通用,棋力应该没有更高明 12/31 09:00
9F:推 abc0922001: 现在 bjiyxo 还在努力要给 LZ续命! 12/31 09:12
10F:推 pan0531: 楼上从何处得知的消息?@@ 01/01 00:48
11F:推 maplefoxs: 效率更高 是不是代表不用那麽强的硬体 01/01 13:39
13F:→ abc0922001: 滑鼠移到权重那边会显示资讯 01/01 15:07
14F:推 pan0531: 又出更强的权重了...bjiyxo大好猛 01/01 20:20
15F:推 lwei781: liminf 还是重点啊 01/01 22:35
16F:推 intointo: 演算效率提升吧? 01/03 08:40