[情報] DeepMind AI「AlphaStar」

時間Sat Jan 26 19:27:02 2019

感想先寫在前頭，這篇有講到一些設定的部分，事實上每五場都是五個不同模型。然後輸的那場有要讓AI切螢幕，而且只訓練一個星期而已。也就是說別的模型說不定未必會有那個空投拉扯問題。 APM部分的限制不知道到底怎麼設定的，感覺是峰值APM也應該限制一下。 DeepMind AI「AlphaStar」對戰《星海爭霸 II》職業高手，取得十勝一敗成績 https://engt.co/2Sahn4j 在基本上輾壓了圍棋界之後，DeepMind 團隊將目光放到了自由度更高的即時戰略遊戲，並且最近都在忙著調校一個新的「AlphaStar」AI，來挑戰《星海爭霸 II》的職業高手。在上月底連續兩組五局對戰中，AlphaStar 先全勝了 TLO，接著又在第二組對戰中全勝了 MaNa。唯有最後一場直播的對戰，才讓 MaNa 好歹為人類爭了一口氣，贏回唯一一場勝利。不過，事情當然不像表面那麼簡單。AlphaStar 相對於人類，其實是隱藏優勢的。這時候有在玩 RTS 的讀者大概會猜是反應速度、或是手速，但其實都不是 -- AlphaStar 的「手速」（也就是每分鐘動作數）其實平均只有 277 APM，比起星海職業選手的平均 559 APM 要少了不止一點，再加上 AI 從發現新狀況，到計畫出合理的回應，中間大約要 0.35 秒的時間，這也比一般職業高手差。在這部份， AlphaStar 完全是靠更有效率的操作，與更經濟的決策來彌補的。AlphaStar 真正「作弊」之處，在於它可以同時看到整個地圖，當然戰爭迷霧還是存在，只是 AlphaStar 不像人類對手一樣，要一直不停地在地圖來回跳動檢視，自然也不容易被偷襲囉。 AlphaStar 的訓練和其他類似的 AI 系統一樣，都是先由觀看無數的人類對戰影片，來產生一個模型，再由這模型產生一大堆類似但不完全相同的「分身」，再讓這些分身下去對打，直到決勝出最厲害的五個 AI「選手」為止。在一個月的虛擬對戰中，AlphaStar 的諸多分身份進行了等同於現實時間 200 年的對戰時長，最後選出的五個代表每個都有不同的遊戲風格，並且是 DeepMind 認為最有獲勝機會的。就是這五個代表被推上去與 TLO 和 MaNa 各對戰了一次（避免風格重複被看破手腳，同時 MaNa 面對的 AlphaStar 更有經驗一點），並取得了十戰全勝的成績。至於最後一場呢？原來這是個「實驗版」的 AlphaStar，拿掉了上面提到的那個「隱藏優勢」，讓模型必需和人類一樣時不時地檢查一下地圖的各個角落，自然也就有錯漏重要資訊的可能。雖然也有著一個禮拜的訓練時間，但 DeepMind 團隊未能讓它先與人類選手「切搓」一下，因此與 MaNa 在直播上的對戰是它與人類面對面的初戰，可惜輸給了對方。當然，對我們一般人來說，就是真正具備高度挑戰性的遊戲 AI 已經不再是個夢想，即使是即時戰略這樣沒有明確的勝敗因素、沒有完整的資訊、而且需要長遠的概念的遊戲，AI 都有打敗人類的潛力了。有興趣的話 DeepMind 自己的部落格上有 AlphaStar 與兩位人類的對戰影片，可以去看看 AlphaStar 採取的各種奇怪的戰略囉。 --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.165.93 ※ 文章網址: https://webptt.com/m.aspx?n=bbs/StarCraft/M.1548502025.A.A4F.html

1^F：推 Jotarun: APM的說明在這 https://goo.gl/f2kWPy 01/26 19:36

2^F：推 HenryLin123: AI的APM應該要降不然就是不能用API 用滑鼠輸入吧 01/26 21:19

3^F：推 jiaching: 看了VOD 人類除了兵力大優不然會戰完全被AI的操作完爆 01/26 21:51

4^F：→ hijacker: 閃追操作也很猛剩下一大堆殘血的追獵 01/26 21:54

5^F：推 clamperni: 只要APM合理操作就合理 01/26 22:28

6^F：推 HenryLin123: 一點都不合理滑鼠隨點隨到這樣練出一個只會操作的A 01/26 23:26

7^F：→ HenryLin123: I有何意義 01/26 23:26

8^F：推 Jotarun: 1. 就算練出只會操作的AI一樣神不然以前怎麼練不出 01/26 23:59

9^F：→ Jotarun: 2. 模擬滑鼠或者機器手臂什麼的都是花招而已 01/27 00:00

10^F：→ Jotarun: 真的要直接限制單位時間數量或特定動作延遲即可 01/27 00:00

11^F：→ Jotarun: 3. 這個不是最後結果不需要現在就蓋棺論定 01/27 00:01

12^F：推 gn00604767: 阿法星以後成長到一定程度會不會覺得很屈辱,泥馬的 01/27 00:53

13^F：→ gn00604767: 限制我的手速這算是怎麼一回事 01/27 00:53

14^F：推 nissptt: 兵不厭詐，這是我們訓練AI的最終目的，能使詐，並預測對 01/27 01:12

15^F：→ nissptt: 手(使詐), 權衡得失以獲得勝利。其他的都是附加而已。 01/27 01:12

16^F：推 arrenwu: APM沒啥好限制的吧本質上就只是操作比較強而已 01/27 04:54

17^F：→ arrenwu: 職業選手之間進行比賽，也有操作的高低，難道我們就會去 01/27 04:54

18^F：→ arrenwu: 跟操作比較強的選手說請他放慢嗎？ 01/27 04:54

19^F：→ arrenwu: 頂多是希望DeepMind不要做出一個只有操作比較強的AI 01/27 04:55

20^F：推 shasen1235: AI如果是靠操作打贏人類就完全違背這個研究的意義了 01/27 08:02

21^F：→ shasen1235: ，DM的計畫向來就不是如何打敗人類，而是看AI能不能 01/27 08:02

22^F：→ shasen1235: 找出更好的營運和會戰方法，都歷經一次AlphaGo了還有 01/27 08:02

23^F：→ shasen1235: 人不知道這個計畫在幹嘛 01/27 08:02

24^F：推 hankower: 加入模擬滑鼠的操作限制移動速度應該可以防止非人操作 01/27 08:59

25^F：→ jiaching: 希望能公布AI的第一視角VOD 一定很有趣 01/27 09:50

26^F：推 HenryLin123: APM沒限制好就是出現這樣的AI 01/27 09:51

27^F：推 mrmowmow: ai的目的不是什麼找出新戰術好嗎？dm的目的是讓ai自己學 01/27 11:02

28^F：→ mrmowmow: 習遊戲到打敗人類，他們才不管你有沒有什麼新戰術 01/27 11:02

29^F：推 pheather: DeepMind的目的是讓AI學會玩這個遊戲，然後它們目前學習 01/27 12:31

30^F：→ pheather: 得出的結論是SC2這遊戲靠操作。好像也不是很意外？尤其 01/27 12:31

31^F：→ pheather: 是同族對決 01/27 12:31

32^F：推 arrenwu: 其實應該說我們應該要有輔助系統幫助人類處理手速問題 01/27 12:40

33^F：→ arrenwu: 這樣這個實驗才好繼續做下去 01/27 12:40

34^F：→ arrenwu: 因為APM還是其次，AI不可能模仿人類「注意力下降」的部分 01/27 12:41

35^F：推 Adonisy: AI模仿人類的紀律性與戰略 01/27 13:32

36^F：推 LochtsStorM: 還在扯手速= = 01/27 19:45

37^F：推 fragmentwing: 有在用智能指令就知道 ai 破千的apm和玩家的意義絕 01/27 21:36

38^F：→ fragmentwing: 對不一樣 01/27 21:36

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

StarCraft 板

[情報] DeepMind AI「AlphaStar」

熱門看板

贊助商連結