作者asglay (收收收尾)
看板chess
标题Fw: [情报] AlphaZero战胜将棋与西洋棋最强软体
时间Thu Dec 7 00:15:41 2017
※ [本文转录自 GO 看板 #1Q9-Ito- ]
作者: HeterCompute (异质运算) 看板: GO
标题: [情报] AlphaZero战胜将棋与西洋棋最强软体
时间: Wed Dec 6 20:38:11 2017
https://arxiv.org/pdf/1712.01815.pdf
这次论文的标题是:
Mastering Chess and Shogi by Self-Play with a
General Reinforcement Learning Algorithm
从零学棋,
使用相似的神经网路架构,
一样没有使用任何人类知识,
4小时打败西洋棋最强软体Stockfish,
2小时打败将棋最强软体Elmo,
34小时打败围棋AlphaGoZero 20blocks 3天版本,
(围棋其实有些争议,因为他这次用了5000TPU,上次AlphaGoZero只用2000TPU),
以MCTS打倒传统的alpha beta search,
通用於完全讯息游戏,
又一伟大的突破。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.169.176.30
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/GO/M.1512563895.A.CBE.html
1F:推 staristic: 一个通用於下棋的AI? 12/06 20:45
没错
2F:推 tetratio: 又达到新境界了 12/06 20:50
3F:推 BBSealion: 不知道限制多严格,有运气成分的(例如暗棋)或多人的 12/06 20:54
4F:→ BBSealion: (例如跳棋)不知道能否通用过去 12/06 20:54
暗棋这种非完全讯息游戏很难说,跳棋这种只有多人应该没什麽问题。
※ 编辑: HeterCompute (118.169.176.30), 12/06/2017 20:56:17
5F:推 birdy590: 力王:大家可以回家啦~ 12/06 20:55
6F:推 harrybbs: 逆天啦 发展这麽快 12/06 20:59
7F:推 dongy: 暗棋可以计算机率的,但因复杂度不高,且有部分运气,所以人类 12/06 21:01
8F:→ dongy: 棋手会有一定胜率 12/06 21:02
9F:推 TWN2: 想看阿法零跟赤木茂打麻将 12/06 21:04
10F:推 zeat: AlphaGO老师:我是说在座的各位都是__ 12/06 21:06
11F:推 aegis43210: 已经征服完全讯息游戏了,希望星海二也会有突破 12/06 21:15
12F:推 s891234: 真的是在座的各位都是哈哈,可以回家啦~~~ 12/06 21:41
13F:→ Lordaeron: 多人跟双人是有很多不同,没问题就有鬼罗. 12/06 21:43
14F:推 turing: 这也终结了西洋棋的西西里防御。 12/06 22:22
15F:推 MonkeyCL: 这世界变化太快好累啊 12/06 22:35
16F:推 hne: 太强了 O o 12/06 22:52
17F:推 asglay: 借转chess 12/07 00:11
※ 发信站: 批踢踢实业坊(ptt.cc)
※ 转录者: asglay (111.254.37.40), 12/07/2017 00:15:41
18F:→ ssccg: 虽然演算法很强,但是真的有资源能玩更是关键... 12/07 00:35
19F:→ ssccg: 不知道在电王的规则下多强就是了 12/07 00:40
20F:推 lwei781: 应该差不多强 耗资源的部分是训练 12/07 01:43
21F:→ ssccg: 实战用的是4TPU,先不说电王没TPU,TPU是CPU的几十倍吧? 12/07 02:30
22F:→ ssccg: 64T vs 4TPU感觉不算公平,当然再多训练下去一定是Alpha强 12/07 02:39
23F:推 NewYAWARA: 请他们明年到电王战比一次就知道了,现在的elmo也不是 12/07 10:11
24F:→ NewYAWARA: 最强,而且大家有被限制统一硬体规格 12/07 10:11
25F:→ fossil313: 跟StockFish每秒搜寻7000k比 AlphaZero只有搜寻80k 12/07 12:25
26F:→ fossil313: 感觉应该是没什麽悬念了 12/07 12:25
27F:→ ssccg: 在一个node上要做的evaluation不同,不能比NPS吧 12/07 12:58
28F:→ ssccg: AlphaZero比较强是一定的,只是好奇TPU优化的程式用4TPU跑 12/07 13:01
29F:→ ssccg: 要改写成一般CPU能跑的话会是要多少CPU才有同样强度 12/07 13:02
30F:推 NewYAWARA: 後来测试最新tanuki确实是比elmo强 12/07 20:16
31F:推 kcl0801: 新电王ぽんぽこ近日直播时正式上线 被日本观众嫌的要死xd 12/08 13:10
32F:→ kcl0801: 因为预测的太短视 刚上直播时常常只预测下一步 昨天看时 12/08 13:10
33F:→ kcl0801: 好一点 可是在画面上有预测後9步的空间 却完美的只预设了 12/08 13:10
34F:→ kcl0801: 8步空一格... 12/08 13:10
35F:→ ssccg: 那是UI和探索引擎配合的问题吧 12/08 13:52