作者cookieyu (Taiwanese)

看板StarCraft

標題

Re: [問題] 星海爭霸AI比賽的遊戲訊息輸入方式？

時間Tue May 23 17:27:45 2017

※ 引述《dharma (達)》之銘言： : 有人說可能是架設攝影機來觀看螢幕畫面 : 機械手臂操控鍵鼠(限制手速) : 讓AI能以最接近人類的方式來競賽 : 也有人說是遊戲內容會轉換成給AI軟體讀取的資訊 : 類似下面影片這樣 : https://www.youtube.com/watch?v=5iZlrBqDYPM

: 請問比賽方式有定案了嗎 : thanks 剛好這個禮拜又迎來了AlphaGo對柯潔的對局。不過目前Deepmind對星海這部分透露的還不多，只能聊一些對未來可能作法的猜測了。就像很多板友在推文裡談到的，人類與AI的對決會有很多技術性問題。例如要如何讓AI認識每個單位、地形、資源，這也是原po連結中我們目前唯一可以瞥見的相關技術釋出。其他的還有常常在爭議的輸入方式，包括APM等等。不過我認為對Deepmind來說，最重要的問題還是「如何建立一個成功的決策系統」，而不會是悍馬2000這種對比於人類幾乎無限APM 的操作方式。圍棋的資訊對兩方玩家都是完全公開的。玩家們都是靠著當下局面的同樣訊息進行決策。而在攻克圍棋這個項目後，會來嘗試星海我想也是不讓人那麼意外的。圍棋和星海同樣是現成的遊戲，所以它們的規則清楚、目標明確；而兩個遊戲在決策上最大的不同處則可能在於資訊的透明程度。從設計圍棋的決策系統來看，AlphaGo必須要能評估每個局面下的利益，這樣才能知道自己下的這步棋是不是「好」的。對比到星海，我們可以常常想到小色和91這些「專業解說」在下判斷時也常常會有「雖然吃掉這波兵，但是經濟落後太多」、「目前局勢對他不利，就看他能用領先的科技打到什麼東西」，這類的「價值判斷」。而價值判斷正確與否的最終判準在於遊戲最後是不是贏了。所以像是如何拿捏經濟、科技、兵力這種資源分配的決策就是AI需要去學習的。另外，還有兵種如何搭配，例如人類機械化雖然正面強，但如果被對方拖住戰線，自己的後方就很容易受到騷擾而又機動力不足，無法即時回撤。又比如有時候「沒回頭路了，只能換家」、「這時候再不推出去就沒機會了」之類的戰機把握也是相當重要的決策。比起圍棋，因為規則的不同而使得星海的決策種類變得非常不同。而最該死的，更是這些決策時常是建立在資訊的不完整上。「要如何運用手上已有的資訊來預測對方可能作出的決策，並作出合理的決策來進行應對」，這話說起來很饒口，用例子可能比較清楚，最單純的可能是看蟲族的農民數、有無開氣來猜測對方是慢狗開、快狗開、搶經濟等的戰略。比較神乎其神的是像教主開圖那樣，覺得事情不對勁，抓到對方野兵營。比如很久以前看到一場大雨神的比賽，對方野隱刀，但是大雨神(對我來說)莫名其妙的在沒偵查到隱刀塔的情況下用三水晶把自己的家門封住。這樣的決策絕對是有理由的，其他板友的解釋是說由於在偵察對方基地時看到對方早開氣，但又一直沒看到耗氣的兵種，所以下了對方野隱刀這樣的判斷。這使得如何、何時更新手上的資訊本身就變成重要的決策之一。例如幾分鐘灑雷達？幾分鍾看到什麼代表什麼意思？前期的毒暴蟲巢是一波；中期的反而是為了防守。什麼時候又要二次偵查？確定自己的情報不是被對方作表情誤導的？這樣說起來，在星海中要做出一個成功的決策系統實在是滿高的挑戰。目前AlphaGo的勝率也許可以挑戰九成以上了，雖然目前樣本不多，但從最舊的版本到目前最新的版本，人類能贏的只有李世石那唯一的一盤。可以說在圍棋規則的決策環境中，AI已經可以代替人類作出更好的決定了。跟星海比較起來，我想比較不同之處在於星海的資訊不透明上，另一點則是決策時間更短，需要運算得更快。如何調配資源、配兵、出兵這類的決策我想對AI 來說不算太難，有足夠的時間應該就能建立起來。比較難的還是如何在有限的資訊量下持續作出更好的決策，同時還得克服比起圍棋更加動態的局面。 APM等等問題，在人類對決中是重中之重，決定何方高手更能執行自己的決策。但我想對於 Deepmind來說，更重要的是透過遊戲這種「規則明確」、「價值判斷明確」的特性來學習如何建立一個成功的決策系統。再不斷挑戰各種限制和複雜程度的環境之後，才更有機會面對人類社會中的其他決策，畢竟生活之中有許多問題的決策比起遊戲更加複雜，或者曖昧不明...... --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 27.242.139.173 ※ 文章網址: https://webptt.com/m.aspx?n=bbs/StarCraft/M.1495531668.A.A38.html

1^F：推 monkjohnny: 推一個，google絕對不是想做個「打星海會贏人類的AI 05/23 18:02

2^F：→ monkjohnny: 」，而是希望透過這個遊戲能讓AI接近人類的思考決策 05/23 18:02

3^F：→ DiAbLoE: 如果是純AI對戰早就在sc1辦超過10年啦之前twitch還天天 05/23 18:06

4^F：→ DiAbLoE: 播也用不到deepmind 無人車其實已經能解決基本的像素畫 05/23 18:08

5^F：→ DiAbLoE: 面判斷跟偽道德兩難問題 05/23 18:09

6^F：→ cookieyu: 推樓上，視覺辨識挺難的，但是技術已逐漸克服這個問題。 05/23 18:12

7^F：→ DiAbLoE: 重點是AI不用做到完美只要比人類好個一兩倍就夠了看看 05/23 18:13

8^F：→ DiAbLoE: 路上的3寶決策用數學演算法超過他們似乎不是很困難 XDDD 05/23 18:14

9^F：推 APM99: 樓上那可未必,演算法發現違規效率>>>守法時絕對比三寶還 05/23 18:18

10^F：→ APM99: 寶 05/23 18:18

11^F：推 alan129: 很精闢拭目以待 05/23 18:25

12^F：推 WrongHole: 05/23 19:16

13^F：推 waimcat: 印象中deepmind是自己去學怎麼玩 SC AI靠人寫好的程式跑 05/23 20:22

14^F：→ skychy: 有篇專欄文章 https://rocket.cafe/talks/82045 05/23 20:58

15^F：→ skychy: 裡面舉的例子很寫實，也代表現在無人車AI其實還很不成熟 05/23 20:58

16^F：推 aaddaaddjack: 之前看到一個文章深度學習機的神經網路層數越高反 05/24 13:23

17^F：→ aaddaaddjack: 而錯誤率比少一點點層數還高但星海比圍棋複雜太多 05/24 13:23

18^F：→ aaddaaddjack: 是不是能用多組深度學習系統配合演算例如一個負責 05/24 13:23

19^F：→ aaddaaddjack: 會戰一個負責營運每個最佳解整合出一個勝率最高 05/24 13:23

20^F：→ aaddaaddjack: 的決策? 那這樣的話剩下就是演算法跟效能需要突破 05/24 13:23

21^F：→ aaddaaddjack: 的問題因為星海是即時制效能太重要了 05/24 13:23

22^F：推 teren: 決策從微觀的操作(拉哪隻兵集火誰)到營運資源分配到大局觀 05/24 13:35

23^F：推 kira925: 不行因為APM是有限資源 05/24 13:35

24^F：→ teren: 要思考/運算的東西其實超級多很期待看看deepmind怎麼學 05/24 13:36

25^F：→ kira925: APM是無限資源的話掛幾個AI都可以但有限資源就要有分配 05/24 13:36

26^F：→ teren: APM當然要有限因為現實世界就是有限資源下做思考 05/24 13:37

27^F：推 kira925: 阿，我是回aadd 不是teren 05/24 13:46

28^F：→ kira925: 在可使用的操作有限下那個分配的AI對其他區域解會有嚴重 05/24 13:47

29^F：→ kira925: 的干擾譬如會戰的AI會想要操作每一隻追獵/槍兵可是APM 05/24 13:47

30^F：→ kira925: 有限&與營運需要的視野轉換有衝突那怎麼分? 05/24 13:48

31^F：推 aaddaaddjack: K大：我知道會限制APM但是思考判斷應該不會限制所 05/24 14:09

32^F：→ aaddaaddjack: 以我在想應該會有一個優先順序畫面切會戰當然主要 05/24 14:09

33^F：→ aaddaaddjack: 操作在控兵但是快捷鍵也能做一點營運跟補兵沒錯吧 05/24 14:09

34^F：→ aaddaaddjack: 就是優先順序的問題 05/24 14:09

35^F：推 aaddaaddjack: 而且就是限制操作所以電腦應該會更偏向人類真實操作 05/24 14:12

36^F：→ aaddaaddjack: 而不會想去控每一隻兵反而沒效率 05/24 14:12

37^F：→ myhole: 不太同意接近人類思考那段。打贏人類的思考才是根本吧 05/24 23:15

38^F：→ myhole: 然後所謂AI並不是微操+倍的那種層面好嗎=_= 05/24 23:16

39^F：推 APM99: 給奈奈ByuN的操作跟阿法狗對局第一招就是3BB跳死神或槍兵 05/24 23:25

40^F：→ APM99: 阿法狗要贏也只能乖乖靠操作了 05/24 23:25

41^F：→ cookieyu: 推myhole大。從AlphaGo看起來，AI的學習和決策方式跟人 05/25 04:49

42^F：→ cookieyu: 類不太一樣。 05/25 04:49

43^F：推 lolucky531: 電腦比較大的優勢應該是分兵防守能準確分兵 05/27 03:49

44^F：→ lolucky531: 感覺對電腦來說多線應該不能達到拉扯陣型的效果 05/27 03:49

45^F：→ lolucky531: 可以想像的是電腦正面會非常猛畢竟基本功能達到完美 05/27 03:50

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

StarCraft 板

Re: [問題] 星海爭霸AI比賽的遊戲訊息輸入方式？

熱門看板

贊助商連結