作者andy920262 (andy920262)
看板StarCraft
标题[外絮] 腾讯最新AI在SC2上击败作弊电脑
时间Wed Sep 26 14:23:15 2018
原始论文:
https://arxiv.org/pdf/1809.07193v1.pdf
我本身是SC2玩家也对AI稍有研究,最近刚好看到这篇上礼拜才发表的论文,台湾似乎还没什麽新闻或讨论。
这篇应该是目前第一篇“公开”研究声称可以“进行整场游戏并击败玩家”的论文,先前SC2的研究都是只能进行小游戏的程度。
简单来讲,腾讯发表了2个不同的AI称为TStarBot1跟TStarBot2在深海礁岩这张地图进行ZvZ游戏,APM限制在400-800。
TStarBot1是跟电脑对局了700万场自我学习的,TStartBot2则是没有经过学习直接被人类给予规则的AI(Rule-base AI)。
这两只AI对上作弊电脑分别取得80%跟90%的胜率,并成功击败白金~钻石段位的玩家(不过场次很少)。
不过论文中有提到,TStarBot1在玩了700万场後学到胜率最高的招式是异化虫快攻,因此对上真实玩家多打几场就会被破解。
而TStarBot2使用的战术就比较多元,但以AI研究的角度来看,Rule-base AI就只是根据人类赋予的知识进行游戏,并没有办法自行学习更强的战术,因此现在的AI研究多半是自我学习为重点。
技术细节的部分我就不提了,有兴趣了解的可以推文我尽量解答。
重点就是现在SC2 AI的研究还只能打打电脑,先前天梯高端有AI出没的传言多半是假的,不然就是除了腾讯外有其他尚未公开的研究在测试,虽然个人认为机率不高就是了。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.136.97.96
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/StarCraft/M.1537942999.A.CBF.html
1F:推 homelife: 之前在API发表之後,Deepmind玩SC2似乎都还没有消息?09/26 14:45
2F:推 ws870325: 700万场只会12d???09/26 14:45
3F:推 kira925: 700万场的Z学会了一个12D...09/26 14:48
4F:→ kira925: 而且是ZvZ...09/26 14:48
5F:推 eternalviva: 应该不是只学会12D 而是12D效率最佳 XD09/26 14:51
6F:→ eternalviva: 学T的时候 大概也是每一场2BB09/26 14:51
7F:推 homelife: 没有读档案内文,但如果是照AlphaGO的模式,一开始应该 09/26 15:00
8F:→ homelife: 是从AI连规则都不清楚就让他自己摸索? 09/26 15:00
AlphaGo是先模仿人类之後才自我学习,一般来讲这种学法比较有效,但SC2要取得大量可学习的replay比较困难,看文章应该是重头学没错
9F:推 fragmentwing: deepmind的不是还在人族建筑起飞战术?09/26 15:10
10F:推 lather: 2bb 12D 野bg 应该都是最高的 博弈心态再加上操作 09/26 15:13
11F:→ kira925: 400~800APM也太高了 200~400才合理吧 09/26 15:16
12F:→ kira925: 看了下内容 他直接做了165个Macro 换句话说他已经先绑好 09/26 15:18
13F:→ kira925: AI会做什麽子动作了...09/26 15:18
14F:→ kira925: 不能说偷鸡拉 因为确实这些动作是可以先设定好的 09/26 15:19
15F:→ kira925: 但是就不是从0开始 09/26 15:19
16F:推 penut85420: 我觉得一开始有些Marco应该还算合理,如果一出世就有09/26 15:22
17F:→ penut85420: 个Rule Base而且没绑脚本感觉有点太可怕。不过很看好09/26 15:22
18F:→ penut85420: 他的前景,期许有天可以改善游戏内建的AI,甚至有机会 09/26 15:22
19F:→ penut85420: 指导玩家哪些细节需要改善09/26 15:22
20F:→ penut85420: 发现笔误,不是说Rule Base而是只有纯输入Rule09/26 15:23
21F:推 aegis43210: 强化奖励的部份最难09/26 15:40
22F:推 zero790425: AIp要是碾压另外两族ai算不算是pimba(被拉走 09/26 16:00
23F:推 Adonisy: 谢谢你告诉我12D转大龙 09/26 16:20
24F:推 abc0922001: 能打赢作弊难度的电脑很厉害欸 09/26 16:59
25F:→ qqq87112: 以为看到吃肉人族 先打电脑 09/26 17:00
※ 编辑: andy920262 (114.136.97.96), 09/26/2018 17:37:19
26F:推 win4104: 12D胜感觉...很靠赛 09/26 17:36
27F:推 firefoxriko: 感觉ai条件比新人还差,新人还能上网找攻略,AI看攻 09/26 19:16
28F:→ firefoxriko: 略的话就被说作弊了。 09/26 19:16
29F:→ zseineo: 因为目标不一样啊XD 09/26 19:33
30F:推 firefoxriko: 我只是想说这样还打的赢很厉害,我看了攻略都没能打 09/26 20:02
31F:→ firefoxriko: 赢 09/26 20:02
32F:推 kirimaru73: 其实从来就没有规定AI不能参考这个参考那个 09/26 21:28
33F:→ kirimaru73: 只是那只狗Re:0的威能太大 所有人都会想拿来比一下 09/26 21:28
34F:推 wiki2548: 期待像围棋一样能探索出一个全新的世界 09/26 21:30
35F:推 only1032: 二楼好好笑 09/26 21:51
36F:推 shiyhsien: 我APM只有100不到 09/26 23:30
37F:→ Mensholaten: 星海的变化比围棋复杂太多 要training很久才有可能适 09/26 23:33
38F:→ Mensholaten: 应各种情况吧 09/26 23:33
39F:推 rodney228: 看了一下,Bot1只是给了165个"基本概念"比如甚麽是挖矿 09/27 03:54
40F:→ rodney228: 攻击的时候要点选目标、甚麽是科技之类的 09/27 03:55
41F:→ rodney228: deepmind则是故意甚麽都不教? 09/27 03:56
42F:→ rodney228: 只是APM设计得有点太高了,职业选手也很难一直这样 09/27 03:58
43F:→ rodney228: 更何况,学习战术、操作一定程度之後,理论上Bot不会有 09/27 03:59
44F:→ rodney228: 操作失误吧 09/27 03:59
45F:推 kira925: Deepmind是故意什麽都不教 Bot1是先设定好了一点结构 09/27 08:25
46F:→ kira925: 不是不可以拉 但是要详细看到写得多死 09/27 08:26
47F:推 jim8596: 我还以为最强是ai是甩毒爆的枪兵 09/28 15:38
48F:→ jim8596: 而且rouge曾经出现2000apm过 限制不为过吧 09/28 15:39
49F:推 kira925: 那我用加速键盘丢蛋瞬间APM破万也算吗... 09/28 15:43
50F:推 amsmsk: 2000APM是产单位吧 09/28 21:58