StarCraft 板


LINE

星海争霸 AI 大赛冠军出炉!没用机器学习的三星,打爆脸书在内的二十几个 AI 选手 --- 【为什麽我们要选这篇文章】今年的星际 AI 大赛结果出炉,冠军 选手居然没有「学习技能」还是第一次参赛!这个由三星出品的人工智能令所有团队惊艳,而其他参赛者还有 Facebook 的 AI 团队,以及中国知名影音平台 Bilibili 等多家科技公司参与,至於他们战况如何,就来看看以下文章吧!(责任编辑:郑惟馨) 本文经 AI 新媒体量子位(公众号 ID:QbitAI)授权转载,转载请联系出处 作者:量子位/夏乙 问耕 刚刚,星海争霸 AI 大赛新王诞生! 二十多个掌握了机器学习技能的 AI,全都在一个不会学习、只会基於规则机械行动的 bot 面前,俯首称臣。包括三巨头之一 Yann LeCun 底下的 Facebook AI 团队。他们的 AI 获得亚军,但在与新王的 100 回合大战中,战绩是 83 负 17 胜,劣势明显。 其他 AI 更不是对手。新霸主与全部对手的 2600 场厮杀中,胜率达到了 95.91%。而往届比赛中,冠军胜率最高的一次,也不过 89%。 到底是谁?哪个团队的人工规则,能如此碾压人工智慧? 答案是: 赛达(SAIDA)。 三星出品的 AI 没有学习能力,勇夺冠军靠得是人类经验! 来自三星,首次参赛的 赛达 ,完全基於规则,在这个机器学习大爆炸的时代,一个如此「复古」的系统,俾睨一众 AI。赛达之所以如此厉害,一个重要原因是,背後有韩国职业星际选手助力。要知道,星际一度被称为韩国的国技。 这次星海争霸 AI 大赛的组织者戴夫.邱吉尔(Dave Churchill)总结说,今年的比赛成了两家巨头之间的争夺。第一名三星赛达,代表顶级人类玩家的经验总结;第二名 Facebook 的 CherryPi,有顶级工程师坐镇,3 位顶尖 bot 作者都在麾下。(TO 编按:bot 为软体代理的口语) 目前,三星职业选手组更胜一筹,但这还不是赛达的全部成就。在另一个星海赛事——星际 AI 锦标赛(SSCAIT)上,它的 ELO 等级分也排在第一名。(TO 编按:ELO 等级分制度是基於统计学的一种评估棋手水准的方法。一些线上游戏的竞技对战系统也采用此评分) 总体来看,它已经是地表最强星际 AI 了。让我们来认识一下这匹黑马。 基於规则的演算法+选手经验,成就赛达的冠军之路 这次大赛还是基於星海争霸:母巢之战(Starcraft Broodwar)。 赛达使用人族(Terran),以稳定的防守优先战略开局,到中期过後,它会寻找最佳 rush 时机,一波强攻击败对手拿下比赛。 和现在主流方法不一样的是,赛达没有用机器学习方法。 三星的工程师们尝试了用卷积神经网路(Convolutional Neural Network, CNN)和编码器—解码器从游戏视频中学习战斗时机,也尝试了用多智能体强化学习演算法来控制单位……然後决定,在参赛演算法里不用这些东西了。 这些研究当然也没有白费,他们把研究结果写进论文,投稿到了 AAAI 2019。哪位朋友见到这篇论文的预印本,欢迎通知我们,和更多读者分享。 我们说回参赛版本的赛达,它都是手工编写基於规则的演算法,一共 49702 行。不过,这并不是说它的打法就是一成不变的。它所用的策略不是一开始就预设好的,而是会根据侦查和扫描收集的讯息来建构。除了选择策略的程式,赛达还包含用来控制单位和建筑物的有限状态机,用来寻找建基地位置或者敌人基地的几种搜索演算法。 那麽,人类工程师是如何给这个演算法制定规则的呢? 背後有韩国职业星际选手的帮助。戴夫说,把大赛官方提供的样本程式 UAlbertaBot 和专业软体开发者、韩国职业星际选手放到一起,就有了赛达。 赛达目前只能应付业余玩家,距击败顶尖职业选手还要一两年 赛达的源头,可以追溯到 2017 年三星 SDS 举办的演算法大赛。 当时的主题刚好是星际。比赛中成绩不错的工程师们惺惺相惜,向公司提出要联手打造一个超级厉害的星海 AI。 於是,2018 年 1 月,赛达诞生了。现在,这个诞生还不到一年的新秀不仅是两大星际 AI 赛事的第一名,还已经和人类业余玩家、职业选手都交过手。人类业余玩家已经不是它的对手。 虽然赛达目前,暂时,还打不过职业选手,但开发团队认为「已经不远了」,内心充满了希望。他们说,现在的星海 AI 已经达到了高端业余玩家的水平,战网天梯 1800 分左右的那种。再有一两年,就能击败战网 3000 多分的最强 7 位职业选手之一。 筹办者戴夫对这个展望似乎半信半疑,他说,“I’ll believe that when I see it :)”,「眼见为实」吧。 他们的目标是:成为第一个击败人类星海职业选手的 AI。 赛达团队 上面,就是赛达的 8 名创造者:Iljoo Yoon、Daehun Jun、Junseung Lee、Hyunjin Choi、Changhyeon Bae、Hyunjae Lee、Yonghyun Jeong、Uk Jo。其中,Changhyeon Bae 是这支队伍的 leader。 Facebook 团队 CherryPi 进步明显,影片平台 bilibili 也有参赛 下面,说说今年的其他选手。先看看最终的排名。 今年的星际 AI 大赛成绩单 第二名是 CherryPi。如果你关注过这项赛事,一定不会对这个名字陌生。樱桃派这个选手,家世显赫,出自着名的 Facebook AI Research 团队,领军人物是大名鼎鼎的 Yann LeCun。战队成员包括:Jonas Gehring, Vegard Mella, Daniel Gant, Zeming Lin, Da Ju, Danielle Rothermel, Nicolas Carion, Nicolas Usunier, Gabriel Synnaeve 去年,CherryPi 参赛获得第六名。今年,经过一番车轮鏖战,CherryPi 最终夺得亚军,仅次於三星 SAIDA 战队。要知道去年的冠军 ZZZKBot,今年只获得第 10 名的成绩。 CherryPi 会有 8-13 个候选策略。每场比赛开始时,它会根据与对手之间的历史表现,基於具有时间衰减权重的强盗模型,选择一个策略(通俗的说,也就是越是最近的比赛,权重越高)。随着比赛进行,CherryPi 会根据当前情况,使用预训练的模型,使用每种策略估计获胜的可能性,满足一些条件的情况下,会切换到胜率最高的策略。 所以,这也是一种来回切换的「混合」策略。 策略选择上有几个基本的要素。一是多样性,能够考虑到尽可能多的情况。二是稳健性,以及追求 100% 的胜率。三是更好的扬长避短。 CherryPi 使用了非常多的 AI 技术,包括: 基於搜索的 AI。CherryPi 使用了区域级寻路来指挥单位绕过地图上的障碍,使用威胁感知寻路来风筝或者引导单位脱离战斗。CherryPi 也会基於人类数据学习建筑摆放的位置,还用了离线强化学习,以及在线学习,也使用了 BWEM 进行自定义的地图分析。 与去年相比,现在的 CherryPi 使用了 LSTM 模型进行高级策略的选择,使用部分观察的游戏状态作为输入;在巨集观管理方面进行了优化,微观管理也进行了改进。 CherryPi 使用了 Torch 框架,全部的代码是大约 5 万行的 C++。 第三名到第八名的共同特点:全是神族! 第三名 CSE。这是一个中国战队。成员包括:Junge Zhang、Wei Guo、Qiyue Yin、Dong Zhan、Qiwei Wang、Yihui Hu、Shengqi Shen、Kaiqi Huang。 其中第一位应该是中科院自动化所的张俊格,去年他也带领团队参加了星际 AI 大赛,只不过去年他们的 AI 是 CPAC,今年改了名字。这支战队算是「改装」派打法,他们的 AI 去年基於 Steamhammer bot,而今年则基於 Locutus。他们在 Locutus 的基础上,做了一些策略和微观层面的优化。 第四名 BlueBlueSky,也基於 Locutus,作者是科罗拉多大学的博士生 Pengfei Hou。 第五名是正牌的 Locutus。在八月的 CIG 星际 AI 大赛上,丹麦独立游戏 AI 开发者编写的 Locutus 一举夺魁。(当时 ZZZKBot 也参赛了,最终排名第七。) 可能正是由於 Locutus 的成功,今年 3-8 名的战队,全都是使用神族的 AI。全部战队中,有 11 支使用了神族,虫族的热度有所下降。 其实 Locutus 是基於 Steamhammer 改进的,不同之处在於,Steamhammer 玩虫族,而 Locutus 玩神族。 Steamhammer 本尊这次排名第十一。 除了 CSE 和 BlueBlueSky,这届 AIIDE 星际 AI 大赛还有其他的中国团队参赛。 排名第六的 ISAMind,作者 Fang Gao,来自中国电子科技集团公司认知与智能实验室。 排名第七的 DaQin,作者 Lion Gis,看 GitHub 的画风应该也是来自中国: https://github.com/liongis。 而排名第 13 位的 LastOrder,来自 B 站(Bilibili AI Research)。LastOrder 使用了 TensorFlow 机器学习框架。 B 站这个 bot,据说用了 1000 台机器进行分布训练,也被对手认为很有潜力。 从胜率中发现的小细节:赛达轻微下降、CherryPi 却缓缓上升 虽然「不会学习」的赛达击败了各路 AI,但有个细节很有意思。 我们注意到,如上图所示,随着比赛时间的推移,三星赛达的胜率虽然一直很高,但总体上在轻微但持续的下降。与此同时,获得第二名的 CherryPi 的胜率,在轻微而持续的上升。 尽管星海很难,但对於 AI 来说,也许未来有一天也能跟围棋一样,不用依靠人类的知识,自己成长为一代高手。 最後,给几个开源地址。 赛达的源代码目前还没有放出,不过,GitHub 页面已经有了,谁知道官方什麽时候会补一些除了 readme 之外的东西呢: https://github.com/TeamSAIDA/SAIDA CherryPi 的 GitHub 页面传送门: https://github.com/TorchCraft/TorchCraft Locutus 的 GitHub 页面传送门: https://github.com/bmnielsen/Locutus/ (本文经原作者 量子位 授权转载,并同意 TechOrange 编写导读与修订标题,原文标题为 〈2018 星际 AI 大赛冠军诞生!一个个机器学习演算法,都输给不会学习的韩国 bot〉。) 原文连结: https://buzzorange.com/techorange/2018/11/21/aiide-starcraft-ai-competition/?fbclid=IwAR2PzhsYSCY6nRz4YXHjWnAFHz3Q7yol6VV2Ua7Ji67GYKTjeAuJnJ70z3M --- 心得: 他们的 AI 获得亚军,但在与新王的 100 回合大战中,战绩是 83 负 17 胜,劣势明显。 内建Flash经验的AI? AI领域连韩T也要主宰世界了吗 --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 49.215.246.127
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/StarCraft/M.1542861297.A.110.html
1F:推 henry1915: 竟然不learning 11/22 13:06
2F:推 Ashiev: 推 一早看到新闻也吓到,心脏颇大颗 11/22 13:12
3F:推 larailing: 直接龟一波然後RUSH? 11/22 13:51
4F:→ TheDragonBug: 他们能用的数据库跟对战资料太丰富 直接硬写就好 11/22 14:01
5F:推 greg7575: 打T高手 11/22 14:22
6F:推 kuoll: 它自己就是T 然後3~8名都是P 11/22 14:42
7F:推 kira925: 其实是反了 他们的资料库与对战资料还是不够练出够强的AI 11/22 14:44
8F:推 perfects1988: 幸好P不是冠军~甚感欣慰...不好意思我是P黑!! 11/22 15:06
9F:推 aa1477888: AI领域也是韩T霸权 不玩了不玩了 11/22 16:20
10F:→ JellyKing: 不太懂耶 用星海练AI的用意不就是让AI自行摸索学习吗? 11/22 16:29
11F:→ capssan: 看起来是靠选手经验写出来的程式击败纯靠逻辑写的程式 11/22 16:30
12F:→ capssan: 有点像偷吃步吧我觉得.. 11/22 16:30
13F:→ JellyKing: 感觉很像是直接吃人类rp 再转成脚本当牌出..? 11/22 16:33
14F:推 kira925: 这没有偷吃步阿 就是内建了一个很巨大的巨集 11/22 16:40
15F:→ kira925: 侦测到某些东西就做出预先设定好的动作 11/22 16:40
16F:→ kira925: 所以他还是算AI 但是这家伙就不是现在流行的自我学习AI 11/22 16:41
17F:→ JellyKing: 人家要有什麽反应都自己学 他靠工程师先写好 这不... 11/22 16:54
18F:推 madeinheaven: 影片:https://www.youtube.com/watch?v=TvNJh_m_qH4 11/22 16:56
19F:→ lovinlover: 简单来说天花板已经订好 只能手动提升 11/22 17:01
20F:→ positMIT: T____ 11/22 18:07
21F:推 jack900727: 咦deepmind没有参战喔? 11/22 19:47
22F:→ dongogo: deepmind主攻的是sc2 11/22 20:57
23F:推 papertim: deepmind主攻SC2 11/22 21:00
24F:推 TheDragonBug: 完全没有反 94我上面推文讲那样 只要少量估值就能做 11/22 22:53
25F:→ TheDragonBug: 到强大的timing攻击 因为事先庞大资料人类已选择过 11/22 22:53
26F:→ TheDragonBug: 你讲的炼蛊法或自我复制对战才是反了 11/22 22:55
27F:推 kowtheone: 就是个自嗨产物啊,没学习力的,严格来说连AI都称不上 11/22 23:39
28F:→ kowtheone: ,就只是个巨集 11/22 23:39
29F:→ eyesg: 蛤?没有学习机能就是个垃圾啊 11/22 23:57
30F:推 et00211: 没学习技能不行吧 11/23 00:49
31F:→ SSSONIC: 这是专对星海用的电脑程式啊 11/23 06:40
32F:推 miha80425: 航空母舰级电脑 现在的AI打不赢正常阿... 11/23 07:27
33F:推 Butcherdon: 无聊 一定打不赢内建bot 11/23 10:27
34F:→ hotofsheep: 中国用语看了就讨厌 11/23 12:52
35F:→ Carloslin: 韩国应该是主机里面躲一个人参赛吧 11/23 17:14
36F:推 qoo60606: 结果证明记流程还是最稳 要ai自己找流程还是太累了 11/23 17:54
37F:推 RIFF: SAIDA像教主 而一场输给P是输给强大的扩张策略 11/23 19:32
38F:→ RIFF: 2.SAIDA可以拿来策试低阶玩家VS AI 也蛮重要的 11/23 19:33
39F:推 ken32293355: 没学习得很渣欸,只有一些branch 11/23 20:41
40F:推 TheDragonBug: 也不是没用 这说明不是所有问题都需要万用型的学习 11/23 21:39
41F:→ TheDragonBug: AI 就像人类的自主神经 在特定问题或短期要做出效果 11/23 21:42
42F:→ TheDragonBug: 的用这种最适合 或者是鸡尾酒式的混合AI 到未知领域 11/23 21:43
43F:→ TheDragonBug: 时才使用学习型AI 11/23 21:43
44F:推 ohmylove347: 没用是因为目前的ai在SC2还不是最佳方案,所以才有比 11/24 09:47
45F:→ ohmylove347: 赛的必要,不过三星的做法也明显体现目前人类对AI的 11/24 09:47
46F:→ ohmylove347: 设计真的还不够 11/24 09:47







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Soft_Job站内搜寻

TOP