作者e12518166339 (耐綸)
看板Soft_Job
標題[請益] 關於圍棋
時間Sat Mar 12 20:40:20 2016
抱歉,本來想發在演算法版,但是那邊人實在太少了
關於圍棋
在第二盤結束的新聞稿中與盤中賽評講解一樣,都認為AlphaGo在中段下得很奇怪
柯潔認為,今天李世石輸棋是因為他下的不太好:AlphaGo下的很多棋都不是常理下的棋
,李世石也下的不是常理,很多我都看不懂
所以我猜想
人在圍棋的博奕過程中,假設新手是嬰兒,透過不斷的博奕與閱讀經典的棋譜,其神經元
突觸自然而然的產生了每一個落子後的最佳解(演算法)
所以高手們的落子的行為,即便因為策略不同,但是建立她們神經元突觸的社會是一致的
,所以他們的演算法應該不至於有太大的落差
柯潔之所以看不懂AlphaGo的棋路,正是因為它不是尋著一般情境成長的棋士
因此,我們假定AlphaGo的演算法不是聖杯,我只需等待其模型收斂,我在來求得它的
worst-case
在這樣的情形之下,我只需要背譜即可
可是真的這麼簡單嗎?想知道有什麼地方漏想了
--
「不需要讓青少年有判斷力和批判力。只要給他們汽車、摩托車、美麗的明星、刺激的音
樂、流行的服飾,以及對同伴的競爭意識就行了。剝奪青少年的思考力,根植他們服從指
導者命令的服從心才是上策。讓他們對批判國家、社會和指導者保持著一種動物般原始的
憎惡。讓他們深信那是少數派和異端者的罪惡。讓他們都有同樣的想法。讓他們認為想法
和大家不同的人就是國家的敵人……」
by 阿道夫·希特勒
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.177.29.27
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Soft_Job/M.1457786427.A.2AC.html
1F:→ bobju: 背譜成不了高手, 中局戰鬥一脫譜你就接不下去了 03/12 20:45
2F:→ bobju: 決定棋力的高低的因素之一在於[審局能力], 就是對於當前的 03/12 20:47
3F:→ bobju: 局面能夠做出優劣的判斷, 以及預測幾種主要變化的發展趨勢 03/12 20:48
我在想的是19*19的棋面,必定會收斂,所以我如果用另一台電腦來求出對抗這樣棋路的最佳解呢?
就像當初IBM的深藍一樣,wiki中有記載到
"深藍在棋局之間曾被修改以符合卡斯巴羅夫的下棋風格,令電腦避免再陷入其曾兩次跌入
的陷阱"
4F:→ bobju: 人類具有抽象思考能力(所謂的棋感), 在過去的程式主要是靠 03/12 20:50
5F:→ bobju: 決策樹來模擬, 推演各種變化並以計分的方式決定出下一步該 03/12 20:51
6F:→ bobju: 怎麼下? 對上圍棋這種空間複雜度極高的遊戲顯然一切實際,這 03/12 20:52
※ 編輯: e12518166339 (180.177.29.27), 03/12/2016 20:55:23
7F:→ bobju: 也是在此次比賽之前人們普遍認為人類仍能憑著抽象思考能力 03/12 20:52
8F:→ bobju: 佔優勢, 殊不知這代的AI居然也能展示出類似人類抽象思考能 03/12 20:53
9F:→ bobju: 力的面向, 而且更勝一籌. 03/12 20:53
10F:→ bobju: 改錯字: [一]切實際 <- [不]切實際 03/12 20:55
11F:→ bibo9901: 你漏想了蒙地卡羅演算法, 漏想了neural nets, 漏想了 03/12 21:06
12F:→ bibo9901: reinforcement learning, 我還真想知道你想了什麼? 03/12 21:06
13F:→ e12518166339: 抱歉功課沒有作足,我需要再好好的學習一下 03/12 21:08
14F:→ remmurds: 你漏掉了圍棋和西洋棋最大的差異 圍棋沒有明確的目標 03/12 21:26
15F:→ remmurds: 西洋棋的目標很明確 (拿下國王) 03/12 21:26
16F:推 PRAM: 就算想了蒙地卡羅,類神經,XX學習,你能做出AlphaGo? 03/12 22:12
17F:→ goldberg123: 你看的懂高手的下法你就不會在這發文了 03/13 00:22