作者dharma (達)

看板GO

標題

[問題] AlphaZero如果突然給它20x20的棋盤

時間Sat Jun 15 14:32:45 2019

這個演示非常令人驚訝，但哈薩比斯還是有所保留。如果虛擬平板略微往上移動一點點，程式就會失敗。DeepMind程式所學到的技能是如此受限制－－它甚至無法對環境的微小變化（比人類走路時對環境產生的微小影響還小）作出反應－－至少在沒有數千輪強化學習的情況下既是如此。但是現實世界已經內置了這樣的應對系統。 https://tinyurl.com/yydt55tn Deepmind老大說即使是已經訓練好的「打磚塊」遊戲AI 只要遊戲設定做個微小的調整 AI就會失敗需要再更多的訓練，才能因應新的狀況圍棋「人類」棋手如果突然面對20x20的棋盤可能對棋力沒什麼影響那麼如果突然讓目前最強圍棋AI「AlphaZero」和人類下20x20 AI可能會表現的如何？ thanks --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 211.72.78.253 (臺灣) ※ 文章網址: https://webptt.com/m.aspx?n=bbs/GO/M.1560580368.A.8CD.html

1^F：推 maplefoxs: 前幾盤可能可以贏吧 06/15 15:08

2^F：→ maplefoxs: 我覺得這個議題蠻好的值得一試 06/15 15:09

3^F：→ HeterCompute: 如果什麼都不動，alphago不能下20路圍棋，因為連輸 06/15 16:28

4^F：→ HeterCompute: 入只能是19路棋盤，但是如果經過一些技巧訓練個1天 06/15 16:28

5^F：→ HeterCompute: ，贏過人類還是綽綽有餘 06/15 16:28

6^F：推 kria5304: 應該要重新train吧但只要input維度改一下其他架構大概 06/15 16:48

7^F：→ kria5304: 可以沿用感覺是這樣 06/15 16:48

8^F：推 q6261901: 之前用leela跑19路之外，全部都當成19路在下 06/15 21:01

9^F：→ forb9823018: 有影響但不會到非常劇烈 06/15 22:54

10^F：→ forb9823018: 對人類而言 06/15 22:54

11^F：→ AmibaGelos: 主要是cnn對邊緣太敏感提供座標給cnn能部分解決問題 06/15 23:16

12^F：→ AmibaGelos: 圍棋的話多輸入盤面大小應該任意盤面都能共用網路吧 06/15 23:16

13^F：推 ddavid: 其實了解深度學習的話就知道這沒什麼好驚訝的啊XD 06/16 00:27

14^F：→ ddavid: @AmibaGelos 把棋盤大小也都當參數當然也不是不行，但這樣 06/16 00:29

15^F：→ ddavid: 實質上等價於每種大小的棋盤分別訓練，甚至未必比較好 06/16 00:29

16^F：→ ddavid: 你如果想要用這種方式把20x20也同時訓練起來，造成的結果 06/16 00:30

17^F：→ ddavid: 就是所花的時間（或訓練到一定棋力所需局數）就是19x19所 06/16 00:30

18^F：→ ddavid: 需 + 20x20所需，至少以現有架構而言它沒有學習不同盤面大 06/16 00:32

19^F：→ ddavid: 小共通知識的能力。未來技術再發展也許慢慢會往這邊前進， 06/16 00:33

20^F：→ ddavid: 人類舉一反三的能力一直都是共通型AI的長遠目標 06/16 00:34

21^F：→ AmibaGelos: 不一定吧如果有無關盤面大小的準則的話大小就標定 06/16 17:35

22^F：→ AmibaGelos: 邊緣而已類似標定黑白策略確實不同但不是不會重疊 06/16 17:35

23^F：推 enjoytbook: 人家AI就跟人類不一樣啊 06/17 10:10

24^F：推 ddavid: AI目前這種學習方式就是學不到那樣的通則 06/17 17:47

25^F：→ ddavid: 現在是貼目數不同都會無法完全通用的狀態，AI學不到那種「 06/17 17:49

26^F：→ ddavid: 我把現在當作落後所以攻兇一點就搞定了」的轉換性概念。當 06/17 17:50

27^F：→ ddavid: 然有一組AI的目標設定為就算領先也會盡可能繼續取得目數而 06/17 17:50

28^F：→ ddavid: 不要退守，那個設定就相對能應付貼目改變問題，但付出的代 06/17 17:51

29^F：→ ddavid: 價就會是潛在的安定性。 06/17 17:52

30^F：→ ddavid: 至於盤面大小，現況是不同盤面肯定要重新訓練的情況，不然 06/17 17:53

31^F：→ ddavid: 別說複雜細算了，征子算錯的情況都有可能發生。在19路棋盤 06/17 17:54

32^F：→ ddavid: 訓練出來的模組採用一個征子有利的下法，到了20路變成征子 06/17 17:55

33^F：→ ddavid: 不利，深度學習選取棋步時可能並不會發現這個問題 06/17 17:56

34^F：→ ddavid: 這點反而是傳統搜尋式AI有機會搜尋下去發現問題，搜尋層數 06/17 17:57

35^F：→ ddavid: 足夠的話。 06/17 17:57

36^F：→ AmibaGelos: 也許吧有空設計個網路混合訓練6*6~9*9 應該很有趣xd 06/18 00:41

37^F：推 staristic: 說到征子，以現在的架構，盤面越大征子好像要練訓越久? 06/18 00:50

38^F：→ staristic: 理論上好像越大的棋盤人類越有機會用征子套爆AI 06/18 00:50

39^F：推 ddavid: 應該說本來手數多的套路如大型定石、長時間劫爭這些本來就 06/18 17:59

40^F：→ ddavid: 是要訓練更多局才會有機率覆蓋到完整最佳著手 06/18 17:59

41^F：推 ddavid: 征子本來可以視為一個很長的套路，然而征子是一個人類能 06/18 18:06

42^F：→ ddavid: 夠用共通概念推理快速簡化計算的特例，圍棋AI沒有這種簡 06/18 18:06

43^F：→ ddavid: 化概念，需要真的實際算過 06/18 18:06

44^F：推 ddavid: 所以盤面越大當然就大幅增加訓練時間。一方面要模擬完一 06/18 18:08

45^F：→ ddavid: 局需要更久，而獲取足夠資訊所需的訓練對局數也大幅增加 06/18 18:08

46^F：推 ddavid: @AmibaGelos 混合訓練不同大小目前事實上就是無意義啦。 06/18 18:12

47^F：→ ddavid: 對AI問題是全等於分開訓練，而且反而有可能因為對於盤面大 06/18 18:12

48^F：→ ddavid: 小這個參數的模糊化導致模型品質的下降 06/18 18:12

49^F：推 jojoStar: 以人類觀點來說這不就叫做不知變通嗎XD 09/13 01:54

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

GO 板

[問題] AlphaZero如果突然給它20x20的棋盤

熱門看板

贊助商連結