作者zkow (逍遥山水忆秋年)
看板StarCraft
标题[新闻] Facebook偷偷参加了一场AI星海争霸赛 结
时间Sat Oct 14 08:38:11 2017
Facebook偷偷参加了一场AI星海争霸赛 结果输了
来源:36氪
在银河系遥远的克普鲁星区,Facebook的一群跳虫(Zerglings)正在焦躁不安的在
敌军基地外面徘徊。在脑袋缺根筋的指挥官打开大门後,该社交网路的外星人蜂拥而入,
在一场争夺人工智慧研究前沿阵地的战斗中对驻紮在里面的部队大开杀戒。
这场血腥事件是一年一度的由AI软体机器人参赛的星海争霸比赛的一部分,今年的比
赛刚刚在本周日结束。Facebook悄悄的派了一个名为CherryPi的机器人参赛,这是有其AI
研究实验室的8个人设计出来的。
这场秘密的太空站说明Facebook对与Google等就率先达到AI的下一个闪耀的里程碑的
竞争是认真的。Google的DeepMind AI研究部门去年因为Alphago击败了围棋世界冠军而登
上了新闻头条。今年8月,DeepMind宣布将最新版的星海争霸II作为自己的下一个目标。
就像本领域大多数的AI研究一样,Facebook参加的这场比赛使用的是更旧版的星海争
霸,这个版本在难度上被认为对软体和玩家都是一视同仁的。Facebook的AI研究部门由纽
约大学教授Yann LeCun牵头,旗下有80多位研究人员,目前已经发表了很多的研究论文,
但是还没有取得任何像Google在围棋方面一样令人震惊的成就。关於星海争霸Facebook已
经发表了3篇研究论文,但还没有宣布要征服此游戏的任何特别行动。
周日公布的最终结果表明Facebook仍然有一段路要走:在总共28位参赛选手中
CherryPi的排名为第6;而前3位都是由独立的程式设计爱好者写出来的。
Facebook的研究科学家Gabriel Synnaeve把CherryPi说成是将来对星海争霸研究的“
基线”。他说:“我们希望看到它跟其他现有机器人的对比情况,尤其是想测试一下是不
是还有需要修正的瑕疵。” CherryPi参加了一场马拉松式的竞赛,这是研究AI在娱乐业
应用的学术会议AIIDE的一部分。Facebook还赞助了今年的竞赛,成千上万的机器人对战
游戏所用的硬体都是由Facebook出钱的。
自从1950年代以来,像一字棋、跳棋、国际象棋以及围棋这样的游戏一直都是人工智
慧新思路的试验台。这段日子以来,随着公司日益用AI来作为打磨自身产品和服务的手段
,AI还要服务於严肃的商业目的。Facebook、Google等技术公司用AI来改进定向广告和个
性化系统,并且给虚拟助手和增强现实等新产品提供支援。
星海争霸对AI研究人员的诱惑力可不仅仅在於操弄武器发号施令的乐趣。尽管该游戏
看似比围棋或者国际象棋更平易近人,但是复杂度却要比後者高得多,因为玩家的装备和
行动都不是局限在固定的棋盘上并且处在对方的完整视图下面的。围棋棋盘的有效位置数
是1後面跟170个0。研究人员估计,要想遍历星海争霸的复杂度,你还需要在那个数後再
加100个0。
今年获胜的机器人叫ZZZKBot,开发者是澳大利亚珀斯的软体发展者Chris Coxe,他
之前曾在纳斯达克工作过。这个机器人是他自己一个人开发的,後来为了留出更多的时间
做做这个他甚至停了一段时间工作。在最终结果出炉前1一天,Coxe曾经这样调侃自己的
作品。他说:“这东西只是用来概念验证。源码一点都不好。”
就像迄今为止所有的星海争霸机器人一样,在游戏技能一般的人类玩家面前ZZZKBot
也顶不了太久。对异族人部队的调动做出预测和反应需要的计画和记忆远远超出了目前软
体的能力范畴。
随着在网上广告和AI方面同时展开竞争的两大巨头表现出兴趣,爱好者做出最好的星
海争霸机器人的日子似乎已经屈指可数。这次AIIDE竞赛的组织者,纽芬兰纪念大学教授
David Churchill预计,未来几年星海争霸机器人的局面将会发生天翻地覆的变化。
Facebook和Google称自己开发星海争霸机器人的办法跟大多数个人程式师都不一样。
领先的机器人大多数是基於创建者制订的规则和策略进行游戏的。Coxes说他的机器人最
好的功能之一是简单学习功能,机器人会尝试预先程式设计的针对其他对战机器人的策略
,然後记录下来哪一种策略有效,从而为下一场比赛做准备。两大技术巨头打算更倚重於
机器学习,计画让机器人依靠检查过去比赛资料的庞大缓存或者重复实验从头开始制订自
己的策略。Facebook并没有按照自己发布的想法开发CherryPi。而机器学习则是Google的
Alphago不可战胜的核心。
虽然Facebook的机器人没能赢得星海争霸战,但排名第二的机器人PurpleWave的开发
者Dan Gant却看到了CherryPi将来的走势。大多数机器人的选择是根据敌方的相对人数要
麽正面进攻,要麽撤退。但Gant说,从竞赛结果公布前发布的视频看,CherryPi似乎知道
什麽时候自己可以足够快地偷袭地方基地。
尽管如此,不要指望独立机器人开发者一夜之间就会消失得无影无踪——或者指望星
海争霸很快就会被征服。Churchill说:“问题仍然非常困难。我预计几年之内爱好者做
的主要基於规则的机器人仍然会表现出色。”他猜测任何机器人想要击败专家级玩家仍需
要5年的时间——但承认也许会更快。
纽约的软体发展者Gant今年停下了手头的工作,用了几个月的时间专门来做
PurpleWave。他说技术巨头的加入增加了一项代表着独特学习机会的追求的影响力。他说
:“无论你是Facebook还是DeepMind或者是刚刚在学习程式设计的小孩,大家都在同一个
竞技场公平竞技。能限制你的只有自己的努力和能教到自己的东西。”
做出一个星海争霸的超级玩家能给技术巨头带来的不只是满足感。Google说DeepMind
的机器学习已经帮助它削减了自己资料中心的制冷成本。微软今年的一篇有关机器学习的
研究论文说,预测用户何时会点击的准确率哪怕只提升0.1个百分点也能带来数亿美元的
新收入。有能力领导虫族队伍冲锋陷阵击溃任何人类的机器人也许很快就能赚大钱。
http://sports.sina.com.cn/go/2017-10-13/doc-ifymviyp0843275.shtml
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 123.192.74.47
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/StarCraft/M.1507941494.A.A3C.html
1F:推 Adonisy: 我觉得自我学习对星海无用,把各兵种常用套路输入就好了 10/14 12:04
2F:→ Adonisy: 莽克偷,偷克奶这种套路 10/14 12:06
3F:→ zseineo: 他们做AI就是在研究自我学习啊 10/14 12:09
4F:→ zseineo: 叫他们把AI写死没有意义 10/14 12:09
5F:推 Adonisy: 先用稳套路,再去侦查改套路应对 10/14 12:12
6F:→ zseineo: 这样很大程度上就不是自我学习啦 10/14 12:14
7F:推 kira925: AI的目标就是要他们自己找自己的套路 写死套路不是目标 10/14 12:32
8F:推 estupid: 玩星海只是一种手段 是要培养能自我学习的AI 10/14 12:42
9F:推 micbrimac: 他们又不是要赢比赛XDD 主要目的是研究ai 10/14 12:52
10F:推 sampp1213205: 他们目的又不是要赢星海= = 10/14 13:16
11F:推 Adonisy: 总要像围棋一样先教基本观念再自我学习吧... 10/14 13:36
12F:推 only1032: AI最棒的地方不在於教他学会 10/14 14:07
13F:→ only1032: 而是给他大量资料,让AI自行从资料中找出最佳或可行模式 10/14 14:08
14F:→ only1032: 以长远来看,给基本观念会限制AI发展 10/14 14:08
15F:→ zseineo: 围棋只有教规则啊…其他全是自学 10/14 14:41
16F:→ sampp1213205: 星海也给他规则:打爆对面 剩下的他就自己会思考了 10/14 14:55
17F:→ sampp1213205: 啦 10/14 14:55
18F:→ sampp1213205: Ai不是人 不要把他当人看好爆= = 10/14 14:57
19F:→ sampp1213205: ai的运算速度跟思考速度远超过人类 还要教它观念就 10/14 14:59
20F:→ sampp1213205: 是小看它 10/14 14:59
21F:推 Adonisy: 不知道会不会有新的套路可以用 10/14 15:36
22F:推 shinwind: 又在用人类思维看AI...先搞懂什麽是程设原理好吗 10/14 15:58
23F:→ shinwind: 再 10/14 15:59
24F:推 WrongHole: shinwind 10/14 16:09
25F:→ fly9588: 还自己思考哩www电影看太多喔 10/14 19:54
26F:推 kira925: 现在的问题其实是 我们给不出AI那个胜利的概念XD 10/14 19:59
27F:推 ilohoo: 所以之前用分数当依据结果出了一个农夫AI 10/14 20:49
28F:→ sampp1213205: 不会自己思考 那打围棋都打假的就是了? 10/14 22:28
29F:→ zseineo: 这是哲学领域吧 阿法狗有在思考吗 XDD 10/14 22:46
30F:→ sampp1213205: 什麽是ai 即是人工智慧 何谓智慧 即是知识、逻辑等 10/14 22:47
31F:→ sampp1213205: 一切可思考之物 什麽是ai的思考 就是资料库内的运 10/14 22:48
32F:→ sampp1213205: 算 10/14 22:48
33F:→ sampp1213205: 某f你告诉我ai自己思考这个逻辑哪里出问题了??? 10/14 22:48
34F:→ sampp1213205: 阿法狗就是不断透过运算 将每一步在资料库定义 算出 10/14 22:52
35F:→ sampp1213205: 每一步的最佳解 即是阿法狗的思考 10/14 22:52
36F:推 kira925: ....还真不是这样的 10/14 23:01
37F:推 c60203: 可能还有人无法接受人工智能这环 不要怪他 10/14 23:04
38F:推 Benbenyale: 还蛮期待有独立AI来挑战职业SC玩家的 10/15 00:23
39F:推 aegis43210: 等由类神经网路训练出来的AI打赢星海二世界冠军时 10/16 03:30
40F:→ aegis43210: 就像徵着强人工智慧时代的来临 10/16 03:30
41F:→ aegis43210: 因为星海二所涉及的变化比目前任何游戏都多 10/16 03:31
42F:推 kohinoor: 对围棋来说,大局观就是棋子数量和占据的位置,能用数 10/18 10:29
43F:→ kohinoor: 学定义。但是星海就没办法,只有赢和输两个档位。 10/18 10:29