作者LCamel (LCamel)
看板StarCraft
标题[情报] DeepMind 和 Blizzard 发表 AI 环境
时间Thu Aug 10 09:46:56 2017
DeepMind and Blizzard open StarCraft II as an AI research environment
Wednesday, 9 August 2017 (缩
https://goo.gl/KSfFFa )
DeepMind (世界最强围棋 AI 那家) 和 Blizzard 共同发表新的 AI 开发环境,
"SC2LE" , 其中包括了:
* A Machine Learning API developed by Blizzard that gives researchers
and developers hooks into the game. This includes the release of tools
for Linux for the first time.
Blizzard 公开一套给机器学习用的接口
https://github.com/Blizzard/s2client-proto
The StarCraft II API is an interface that provides full external control
of StarCraft II.
可以让外部程式控制 SC2.
This API exposes functionality for developing software for:
这套接口可以用来开发:
* Scripted bots. 写死规则的传统 bot
* Machine-learning based bots. 机器学习的 bot
* Replay analysis. 分析 replay 录影 (才知道高手怎麽玩)
* Tool assisted human play. 人玩, 同时工具在旁协助 (这没问题吗?)
The API is available in the retail Windows and Mac clients.
There are also Linux clients available at the download links below.
零售版的 Windows / Mac 星海可用. Linux 也有.
* A dataset of anonymised game replays, which will increase from 65k
to more than half a million in the coming weeks.
将陆续公开超过 50 万场 replay 来让大家有得学.
* An open source version of DeepMind’s toolset, PySC2,
to allow researchers to easily use Blizzard’s feature-layer API
with their agents.
https://github.com/deepmind/pysc2
"... It exposes Blizzard Entertainment's StarCraft II
Machine Learning API as a Python RL Environment."
把上述接口包成 python 语言可以用的强化学习环境.
* A series of simple RL mini-games to allow researchers to test
the performance of agents on specific tasks.
一些让研究者可测试的小任务.
采矿采矿 生兵生兵
https://www.youtube.com/watch?v=6L448yg0Sm0
* A joint paper that outlines the environment, and reports initial
baseline results on the mini-games, supervised learning from replays,
and the full 1v1 ladder game against the built-in AI.
https://deepmind.com/documents/110/sc2le.pdf
一篇两家公司共同发表的目前成果, 作为大家开始的起点.
影片中右边的训练成果看起来还有模有样的呢:
https://www.youtube.com/watch?v=WEOzide5XFc
LCamel
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.227.89.51
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/StarCraft/M.1502329625.A.C72.html
※ 编辑: LCamel (36.227.89.51), 08/10/2017 09:47:55
1F:推 kira925: 为什麽要在矿区盖BS...XD 08/10 09:48
2F:推 abc0922001: AI常常会下出与自身常识不符合的动作 08/10 09:54
3F:→ abc0922001: 万一这样采矿效率比较高呢XDDD 08/10 09:54
说不定喔... 像 AlphaGo 下围棋会开局点三三取实利,
一般人不会那样下, 可是後来研究以後, 柯洁也模仿了这种下法
又, 是不是很久以前有盖建筑改变采气路径来加速的作法?
4F:推 EGsux: 那个只是在训练里的动作 不是在对战 08/10 09:56
5F:推 kira925: 是可以理解对T来说可以偷一咪咪的来回时间拉 08/10 10:12
6F:→ kira925: 但是卡到的时间成本大概没被计入... 08/10 10:12
电脑大局观没有人强 不过最佳化这种事情倒是可以期待...
7F:推 azureblaze: 因为还只是初学者 08/10 10:17
8F:推 kira925: 有趣的是 为什麽现在都只看到人族? 08/10 10:26
9F:→ lovinlover: 因为吕布是人族 08/10 10:29
10F:推 lather: 因为t可以多线投到你崩溃 08/10 10:58
多线坦克电梯甩女妖散枪兵
还是像 Automaton 2000 一样自动计算坦克弹道散狗...?
https://www.youtube.com/watch?v=IKVFZ28ybQs
11F:→ azureblaze: 因为目标只有生马林 PZ生不出马林 T IMBA 08/10 11:15
原来如此 XD
12F:推 teren: 因为AI认证的TIMBA 08/10 11:17
13F:推 itsdelovely: cool! 08/10 11:19
14F:推 APM99: 影片中的AI是学了50万场青铜组的录像吗 ... 08/10 11:22
看来还有得学 ^^
15F:推 win4104: 因为这个AI不像我们有十几年的游戏经验 08/10 11:25
16F:→ win4104: 他没有一般玩家的游戏直觉吧 08/10 11:26
我想电脑虽然没有直觉 不过或许可以透过近乎完美的计算和侦查
找到双方兵力差距的窗口捅穿对手...
17F:推 abc0922001: 可能是DeepMind没买序号,只能玩免费的XDDD 08/10 11:37
18F:推 luckhunter: 因为人类的操作空间在AI下可以无限大 08/10 11:41
19F:推 kira925: 那个AI只有采矿一个任务 08/10 11:47
20F:推 FallenAngelX: Tool assisted human play应该意思是 08/10 11:48
21F:→ FallenAngelX: 用工具辅助达成 人类理论上可以办到的完美play 08/10 11:49
22F:→ FallenAngelX: 就像是Tool assisted speedrun (TAS) 也都是人玩的 08/10 11:50
23F:→ FallenAngelX: 但实际上根本玩不出来 XD 08/10 11:50
这个看来要等更多资讯公开了 ^^
24F:推 gmoz: API也出了XD 08/10 11:59
谢谢资讯 ~
26F:推 gmoz: 借转八卦? 08/10 12:02
欢迎 XD
27F:推 eggli: 贴个[天网]tag (误 08/10 12:03
28F:推 positMIT: push! 08/10 12:50
29F:推 DevilEnvy: 比较想看两个顶级外挂AI打的操作 08/10 12:55
※ 编辑: LCamel (202.174.4.5), 08/10/2017 13:22:26
30F:→ positMIT: untrained AI----->trained AI----->>innovation 08/10 13:17
31F:推 homelife: 这些工具可以让一般人做出什麽呢? 类似可以在自订开游戏 08/10 13:34
32F:→ homelife: 然後让AI自己操控电脑打吗? 08/10 13:35
基於这个接口应该做的出来
33F:推 kira925: 给想要玩AI开发的人可以玩 08/10 13:38
基於这个接口应该做的出来
34F:推 win4104: 我讲的直觉是GameSence 也是透过游戏经验的累积 08/10 14:37
35F:→ win4104: 透过参考过往的经验来分析 这点应该跟AI的学习是一致的 08/10 14:38
了解 ~
36F:推 kira925: 确实是一致的 训练AI的时候会有个模拟奖赏的机制鼓励AI 08/10 14:57
37F:→ kira925: 的类神经网路权值矩阵 只是RTS因为战争迷雾让他变复杂 08/10 14:58
因为不是一条条的规则 可能我们也很难描述AI怎麽学和学到了什麽 :p
38F:推 shasen1235: Bug report:Shu Dong Huang 08/10 15:21
39F:推 tasin: 快赢得时候砸AI矿螺 它会学起来吗 08/10 15:29
40F:推 gouran: 太阳拳!!! 08/10 16:23
我家AI本来很乖的 都是上网才学坏的
41F:推 JokerRF: AI:干死黄旭东 08/10 18:05
42F:推 Pony5566: AI不知道会不会受到四川神秘力量影响 08/10 19:08
43F:推 kane111: 星海操作的影响程度太大,不知道最後怎麽样评断训练的 08/10 20:13
44F:→ kane111: 结果 08/10 20:13
看在限制 apm 的条件下爬天梯可以爬到哪里... ?
45F:推 Timba: 狂!!!!! 他会不会模仿对手阿??? 08/10 22:34
46F:→ Timba: 输了时候 都被丢矿螺 赢的时候会不会也学起来?? 08/10 22:34
好的不学学坏的 TIMBA 啦
※ 编辑: LCamel (36.227.89.51), 08/10/2017 22:47:36
後来想想不管是电脑操控的 T 赢还是人类赢 都是人类赢. TIMBA 啦
47F:推 vul3kuo: 期待看到像围棋那样 出现颠覆常理的玩法 08/10 22:45
比方说发现其实光炮快攻必胜之类的 (翻桌)
48F:推 shentis: 说不定後面知道自己快赢了,一堆工兵跑到对手家喷漆XD 08/10 23:24
太坏 XD
49F:推 KillerMoDo: 可能会来比个 执政官 阿法狗:可以投降了 玩家:我不要 08/10 23:34
50F:→ KillerMoDo: 阿法狗默默的放推 08/10 23:34
阿法狗可以让人类玩家有颜面的输半目 XD
51F:推 h311013: 大卫精一调整 AI武功尽失 XD 08/11 01:29
结果 AI 一怒就毁灭人类了 XD
52F:推 jyunwei: 操作除了分钟操作数以外会不会点错也是影响 08/11 11:40
结果 apm 完全等於有效apm (抖)
53F:推 gmoz: 理论上不会点错 08/11 12:54
54F:→ banmi: 照这样发展下去,不知道有没有一天会出现天网?? 08/11 15:31
前一阵子钢铁人和脸书老板才在吵这个...
55F:推 kira925: AI是不会点错的阿.... 08/11 16:48
56F:推 aegis43210: AI要发展营运策略可能还要一段时间 08/11 20:12
57F:推 oldTim: 这篇可以让围棋界那些瞧不起星海的人闭嘴了 08/11 21:00
58F:→ oldTim: 论文上Deepmind试了各种不同的深度学习架构,结果根本没用 08/11 21:01
59F:→ oldTim: 只有在某些mini-game里面才能训练出职业等级的操作 08/11 21:02
60F:→ oldTim: 要打full game还打不过暴雪内建AI,看来Deepmind没办法了 08/11 21:04
61F:→ oldTim: 所以开源来请大家集思广益。 08/11 21:05
这样 O_O
※ 编辑: LCamel (36.227.77.123), 08/12/2017 21:49:31
62F:推 edward40812: 计算能力可能要比天河二号还要强N倍... 08/13 16:16