作者LCamel (LCamel)
看板StarCraft
標題[情報] DeepMind 和 Blizzard 發表 AI 環境
時間Thu Aug 10 09:46:56 2017
DeepMind and Blizzard open StarCraft II as an AI research environment
Wednesday, 9 August 2017 (縮
https://goo.gl/KSfFFa )
DeepMind (世界最強圍棋 AI 那家) 和 Blizzard 共同發表新的 AI 開發環境,
"SC2LE" , 其中包括了:
* A Machine Learning API developed by Blizzard that gives researchers
and developers hooks into the game. This includes the release of tools
for Linux for the first time.
Blizzard 公開一套給機器學習用的接口
https://github.com/Blizzard/s2client-proto
The StarCraft II API is an interface that provides full external control
of StarCraft II.
可以讓外部程式控制 SC2.
This API exposes functionality for developing software for:
這套接口可以用來開發:
* Scripted bots. 寫死規則的傳統 bot
* Machine-learning based bots. 機器學習的 bot
* Replay analysis. 分析 replay 錄影 (才知道高手怎麼玩)
* Tool assisted human play. 人玩, 同時工具在旁協助 (這沒問題嗎?)
The API is available in the retail Windows and Mac clients.
There are also Linux clients available at the download links below.
零售版的 Windows / Mac 星海可用. Linux 也有.
* A dataset of anonymised game replays, which will increase from 65k
to more than half a million in the coming weeks.
將陸續公開超過 50 萬場 replay 來讓大家有得學.
* An open source version of DeepMind’s toolset, PySC2,
to allow researchers to easily use Blizzard’s feature-layer API
with their agents.
https://github.com/deepmind/pysc2
"... It exposes Blizzard Entertainment's StarCraft II
Machine Learning API as a Python RL Environment."
把上述接口包成 python 語言可以用的強化學習環境.
* A series of simple RL mini-games to allow researchers to test
the performance of agents on specific tasks.
一些讓研究者可測試的小任務.
採礦採礦 生兵生兵
https://www.youtube.com/watch?v=6L448yg0Sm0
* A joint paper that outlines the environment, and reports initial
baseline results on the mini-games, supervised learning from replays,
and the full 1v1 ladder game against the built-in AI.
https://deepmind.com/documents/110/sc2le.pdf
一篇兩家公司共同發表的目前成果, 作為大家開始的起點.
影片中右邊的訓練成果看起來還有模有樣的呢:
https://www.youtube.com/watch?v=WEOzide5XFc
LCamel
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.227.89.51
※ 文章網址: https://webptt.com/m.aspx?n=bbs/StarCraft/M.1502329625.A.C72.html
※ 編輯: LCamel (36.227.89.51), 08/10/2017 09:47:55
1F:推 kira925: 為什麼要在礦區蓋BS...XD 08/10 09:48
2F:推 abc0922001: AI常常會下出與自身常識不符合的動作 08/10 09:54
3F:→ abc0922001: 萬一這樣採礦效率比較高呢XDDD 08/10 09:54
說不定喔... 像 AlphaGo 下圍棋會開局點三三取實利,
一般人不會那樣下, 可是後來研究以後, 柯潔也模仿了這種下法
又, 是不是很久以前有蓋建築改變採氣路徑來加速的作法?
4F:推 EGsux: 那個只是在訓練裡的動作 不是在對戰 08/10 09:56
5F:推 kira925: 是可以理解對T來說可以偷一咪咪的來回時間拉 08/10 10:12
6F:→ kira925: 但是卡到的時間成本大概沒被計入... 08/10 10:12
電腦大局觀沒有人強 不過最佳化這種事情倒是可以期待...
7F:推 azureblaze: 因為還只是初學者 08/10 10:17
8F:推 kira925: 有趣的是 為什麼現在都只看到人族? 08/10 10:26
9F:→ lovinlover: 因為呂布是人族 08/10 10:29
10F:推 lather: 因為t可以多線投到你崩潰 08/10 10:58
多線坦克電梯甩女妖散槍兵
還是像 Automaton 2000 一樣自動計算坦克彈道散狗...?
https://www.youtube.com/watch?v=IKVFZ28ybQs
11F:→ azureblaze: 因為目標只有生馬林 PZ生不出馬林 T IMBA 08/10 11:15
原來如此 XD
12F:推 teren: 因為AI認證的TIMBA 08/10 11:17
13F:推 itsdelovely: cool! 08/10 11:19
14F:推 APM99: 影片中的AI是學了50萬場青銅組的錄像嗎 ... 08/10 11:22
看來還有得學 ^^
15F:推 win4104: 因為這個AI不像我們有十幾年的遊戲經驗 08/10 11:25
16F:→ win4104: 他沒有一般玩家的遊戲直覺吧 08/10 11:26
我想電腦雖然沒有直覺 不過或許可以透過近乎完美的計算和偵查
找到雙方兵力差距的窗口捅穿對手...
17F:推 abc0922001: 可能是DeepMind沒買序號,只能玩免費的XDDD 08/10 11:37
18F:推 luckhunter: 因為人類的操作空間在AI下可以無限大 08/10 11:41
19F:推 kira925: 那個AI只有採礦一個任務 08/10 11:47
20F:推 FallenAngelX: Tool assisted human play應該意思是 08/10 11:48
21F:→ FallenAngelX: 用工具輔助達成 人類理論上可以辦到的完美play 08/10 11:49
22F:→ FallenAngelX: 就像是Tool assisted speedrun (TAS) 也都是人玩的 08/10 11:50
23F:→ FallenAngelX: 但實際上根本玩不出來 XD 08/10 11:50
這個看來要等更多資訊公開了 ^^
24F:推 gmoz: API也出了XD 08/10 11:59
謝謝資訊 ~
26F:推 gmoz: 借轉八卦? 08/10 12:02
歡迎 XD
27F:推 eggli: 貼個[天網]tag (誤 08/10 12:03
28F:推 positMIT: push! 08/10 12:50
29F:推 DevilEnvy: 比較想看兩個頂級外掛AI打的操作 08/10 12:55
※ 編輯: LCamel (202.174.4.5), 08/10/2017 13:22:26
30F:→ positMIT: untrained AI----->trained AI----->>innovation 08/10 13:17
31F:推 homelife: 這些工具可以讓一般人做出什麼呢? 類似可以在自訂開遊戲 08/10 13:34
32F:→ homelife: 然後讓AI自己操控電腦打嗎? 08/10 13:35
基於這個接口應該做的出來
33F:推 kira925: 給想要玩AI開發的人可以玩 08/10 13:38
基於這個接口應該做的出來
34F:推 win4104: 我講的直覺是GameSence 也是透過遊戲經驗的累積 08/10 14:37
35F:→ win4104: 透過參考過往的經驗來分析 這點應該跟AI的學習是一致的 08/10 14:38
了解 ~
36F:推 kira925: 確實是一致的 訓練AI的時候會有個模擬獎賞的機制鼓勵AI 08/10 14:57
37F:→ kira925: 的類神經網路權值矩陣 只是RTS因為戰爭迷霧讓他變複雜 08/10 14:58
因為不是一條條的規則 可能我們也很難描述AI怎麼學和學到了什麼 :p
38F:推 shasen1235: Bug report:Shu Dong Huang 08/10 15:21
39F:推 tasin: 快贏得時候砸AI礦螺 它會學起來嗎 08/10 15:29
40F:推 gouran: 太陽拳!!! 08/10 16:23
我家AI本來很乖的 都是上網才學壞的
41F:推 JokerRF: AI:干死黃旭東 08/10 18:05
42F:推 Pony5566: AI不知道會不會受到四川神祕力量影響 08/10 19:08
43F:推 kane111: 星海操作的影響程度太大,不知道最後怎麼樣評斷訓練的 08/10 20:13
44F:→ kane111: 結果 08/10 20:13
看在限制 apm 的條件下爬天梯可以爬到哪裡... ?
45F:推 Timba: 狂!!!!! 他會不會模仿對手阿??? 08/10 22:34
46F:→ Timba: 輸了時候 都被丟礦螺 贏的時候會不會也學起來?? 08/10 22:34
好的不學學壞的 TIMBA 啦
※ 編輯: LCamel (36.227.89.51), 08/10/2017 22:47:36
後來想想不管是電腦操控的 T 贏還是人類贏 都是人類贏. TIMBA 啦
47F:推 vul3kuo: 期待看到像圍棋那樣 出現顛覆常理的玩法 08/10 22:45
比方說發現其實光砲快攻必勝之類的 (翻桌)
48F:推 shentis: 說不定後面知道自己快贏了,一堆工兵跑到對手家噴漆XD 08/10 23:24
太壞 XD
49F:推 KillerMoDo: 可能會來比個 執政官 阿法狗:可以投降了 玩家:我不要 08/10 23:34
50F:→ KillerMoDo: 阿法狗默默的放推 08/10 23:34
阿法狗可以讓人類玩家有顏面的輸半目 XD
51F:推 h311013: 大衛精一調整 AI武功盡失 XD 08/11 01:29
結果 AI 一怒就毀滅人類了 XD
52F:推 jyunwei: 操作除了分鐘操作數以外會不會點錯也是影響 08/11 11:40
結果 apm 完全等於有效apm (抖)
53F:推 gmoz: 理論上不會點錯 08/11 12:54
54F:→ banmi: 照這樣發展下去,不知道有沒有一天會出現天網?? 08/11 15:31
前一陣子鋼鐵人和臉書老闆才在吵這個...
55F:推 kira925: AI是不會點錯的阿.... 08/11 16:48
56F:推 aegis43210: AI要發展營運策略可能還要一段時間 08/11 20:12
57F:推 oldTim: 這篇可以讓圍棋界那些瞧不起星海的人閉嘴了 08/11 21:00
58F:→ oldTim: 論文上Deepmind試了各種不同的深度學習架構,結果根本沒用 08/11 21:01
59F:→ oldTim: 只有在某些mini-game裡面才能訓練出職業等級的操作 08/11 21:02
60F:→ oldTim: 要打full game還打不過暴雪內建AI,看來Deepmind沒辦法了 08/11 21:04
61F:→ oldTim: 所以開源來請大家集思廣益。 08/11 21:05
這樣 O_O
※ 編輯: LCamel (36.227.77.123), 08/12/2017 21:49:31
62F:推 edward40812: 計算能力可能要比天河二號還要強N倍... 08/13 16:16