作者andy920262 (andy920262)
看板StarCraft
標題[外絮] 騰訊最新AI在SC2上擊敗作弊電腦
時間Wed Sep 26 14:23:15 2018
原始論文:
https://arxiv.org/pdf/1809.07193v1.pdf
我本身是SC2玩家也對AI稍有研究,最近剛好看到這篇上禮拜才發表的論文,台灣似乎還沒什麼新聞或討論。
這篇應該是目前第一篇“公開”研究聲稱可以“進行整場遊戲並擊敗玩家”的論文,先前SC2的研究都是只能進行小遊戲的程度。
簡單來講,騰訊發表了2個不同的AI稱為TStarBot1跟TStarBot2在深海礁岩這張地圖進行ZvZ遊戲,APM限制在400-800。
TStarBot1是跟電腦對局了700萬場自我學習的,TStartBot2則是沒有經過學習直接被人類給予規則的AI(Rule-base AI)。
這兩隻AI對上作弊電腦分別取得80%跟90%的勝率,並成功擊敗白金~鑽石段位的玩家(不過場次很少)。
不過論文中有提到,TStarBot1在玩了700萬場後學到勝率最高的招式是異化蟲快攻,因此對上真實玩家多打幾場就會被破解。
而TStarBot2使用的戰術就比較多元,但以AI研究的角度來看,Rule-base AI就只是根據人類賦予的知識進行遊戲,並沒有辦法自行學習更強的戰術,因此現在的AI研究多半是自我學習為重點。
技術細節的部分我就不提了,有興趣了解的可以推文我盡量解答。
重點就是現在SC2 AI的研究還只能打打電腦,先前天梯高端有AI出沒的傳言多半是假的,不然就是除了騰訊外有其他尚未公開的研究在測試,雖然個人認為機率不高就是了。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.97.96
※ 文章網址: https://webptt.com/m.aspx?n=bbs/StarCraft/M.1537942999.A.CBF.html
1F:推 homelife: 之前在API發表之後,Deepmind玩SC2似乎都還沒有消息?09/26 14:45
2F:推 ws870325: 700萬場只會12d???09/26 14:45
3F:推 kira925: 700萬場的Z學會了一個12D...09/26 14:48
4F:→ kira925: 而且是ZvZ...09/26 14:48
5F:推 eternalviva: 應該不是只學會12D 而是12D效率最佳 XD09/26 14:51
6F:→ eternalviva: 學T的時候 大概也是每一場2BB09/26 14:51
7F:推 homelife: 沒有讀檔案內文,但如果是照AlphaGO的模式,一開始應該 09/26 15:00
8F:→ homelife: 是從AI連規則都不清楚就讓他自己摸索? 09/26 15:00
AlphaGo是先模仿人類之後才自我學習,一般來講這種學法比較有效,但SC2要取得大量可學習的replay比較困難,看文章應該是重頭學沒錯
9F:推 fragmentwing: deepmind的不是還在人族建築起飛戰術?09/26 15:10
10F:推 lather: 2bb 12D 野bg 應該都是最高的 博弈心態再加上操作 09/26 15:13
11F:→ kira925: 400~800APM也太高了 200~400才合理吧 09/26 15:16
12F:→ kira925: 看了下內容 他直接做了165個Macro 換句話說他已經先綁好 09/26 15:18
13F:→ kira925: AI會做什麼子動作了...09/26 15:18
14F:→ kira925: 不能說偷雞拉 因為確實這些動作是可以先設定好的 09/26 15:19
15F:→ kira925: 但是就不是從0開始 09/26 15:19
16F:推 penut85420: 我覺得一開始有些Marco應該還算合理,如果一出世就有09/26 15:22
17F:→ penut85420: 個Rule Base而且沒綁腳本感覺有點太可怕。不過很看好09/26 15:22
18F:→ penut85420: 他的前景,期許有天可以改善遊戲內建的AI,甚至有機會 09/26 15:22
19F:→ penut85420: 指導玩家哪些細節需要改善09/26 15:22
20F:→ penut85420: 發現筆誤,不是說Rule Base而是只有純輸入Rule09/26 15:23
21F:推 aegis43210: 強化獎勵的部份最難09/26 15:40
22F:推 zero790425: AIp要是碾壓另外兩族ai算不算是pimba(被拉走 09/26 16:00
23F:推 Adonisy: 謝謝你告訴我12D轉大龍 09/26 16:20
24F:推 abc0922001: 能打贏作弊難度的電腦很厲害欸 09/26 16:59
25F:→ qqq87112: 以為看到吃肉人族 先打電腦 09/26 17:00
※ 編輯: andy920262 (114.136.97.96), 09/26/2018 17:37:19
26F:推 win4104: 12D勝感覺...很靠賽 09/26 17:36
27F:推 firefoxriko: 感覺ai條件比新人還差,新人還能上網找攻略,AI看攻 09/26 19:16
28F:→ firefoxriko: 略的話就被說作弊了。 09/26 19:16
29F:→ zseineo: 因為目標不一樣啊XD 09/26 19:33
30F:推 firefoxriko: 我只是想說這樣還打的贏很厲害,我看了攻略都沒能打 09/26 20:02
31F:→ firefoxriko: 贏 09/26 20:02
32F:推 kirimaru73: 其實從來就沒有規定AI不能參考這個參考那個 09/26 21:28
33F:→ kirimaru73: 只是那隻狗Re:0的威能太大 所有人都會想拿來比一下 09/26 21:28
34F:推 wiki2548: 期待像圍棋一樣能探索出一個全新的世界 09/26 21:30
35F:推 only1032: 二樓好好笑 09/26 21:51
36F:推 shiyhsien: 我APM只有100不到 09/26 23:30
37F:→ Mensholaten: 星海的變化比圍棋複雜太多 要training很久才有可能適 09/26 23:33
38F:→ Mensholaten: 應各種情況吧 09/26 23:33
39F:推 rodney228: 看了一下,Bot1只是給了165個"基本概念"比如甚麼是挖礦 09/27 03:54
40F:→ rodney228: 攻擊的時候要點選目標、甚麼是科技之類的 09/27 03:55
41F:→ rodney228: deepmind則是故意甚麼都不教? 09/27 03:56
42F:→ rodney228: 只是APM設計得有點太高了,職業選手也很難一直這樣 09/27 03:58
43F:→ rodney228: 更何況,學習戰術、操作一定程度之後,理論上Bot不會有 09/27 03:59
44F:→ rodney228: 操作失誤吧 09/27 03:59
45F:推 kira925: Deepmind是故意什麼都不教 Bot1是先設定好了一點結構 09/27 08:25
46F:→ kira925: 不是不可以拉 但是要詳細看到寫得多死 09/27 08:26
47F:推 jim8596: 我還以為最強是ai是甩毒爆的槍兵 09/28 15:38
48F:→ jim8596: 而且rouge曾經出現2000apm過 限制不為過吧 09/28 15:39
49F:推 kira925: 那我用加速鍵盤丟蛋瞬間APM破萬也算嗎... 09/28 15:43
50F:推 amsmsk: 2000APM是產單位吧 09/28 21:58