作者e12518166339 (耐纶)
看板Soft_Job
标题[请益] 关於围棋
时间Sat Mar 12 20:40:20 2016
抱歉,本来想发在演算法版,但是那边人实在太少了
关於围棋
在第二盘结束的新闻稿中与盘中赛评讲解一样,都认为AlphaGo在中段下得很奇怪
柯洁认为,今天李世石输棋是因为他下的不太好:AlphaGo下的很多棋都不是常理下的棋
,李世石也下的不是常理,很多我都看不懂
所以我猜想
人在围棋的博奕过程中,假设新手是婴儿,透过不断的博奕与阅读经典的棋谱,其神经元
突触自然而然的产生了每一个落子後的最佳解(演算法)
所以高手们的落子的行为,即便因为策略不同,但是建立她们神经元突触的社会是一致的
,所以他们的演算法应该不至於有太大的落差
柯洁之所以看不懂AlphaGo的棋路,正是因为它不是寻着一般情境成长的棋士
因此,我们假定AlphaGo的演算法不是圣杯,我只需等待其模型收敛,我在来求得它的
worst-case
在这样的情形之下,我只需要背谱即可
可是真的这麽简单吗?想知道有什麽地方漏想了
--
「不需要让青少年有判断力和批判力。只要给他们汽车、摩托车、美丽的明星、刺激的音
乐、流行的服饰,以及对同伴的竞争意识就行了。剥夺青少年的思考力,根植他们服从指
导者命令的服从心才是上策。让他们对批判国家、社会和指导者保持着一种动物般原始的
憎恶。让他们深信那是少数派和异端者的罪恶。让他们都有同样的想法。让他们认为想法
和大家不同的人就是国家的敌人……」
by 阿道夫·希特勒
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 180.177.29.27
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1457786427.A.2AC.html
1F:→ bobju: 背谱成不了高手, 中局战斗一脱谱你就接不下去了 03/12 20:45
2F:→ bobju: 决定棋力的高低的因素之一在於[审局能力], 就是对於当前的 03/12 20:47
3F:→ bobju: 局面能够做出优劣的判断, 以及预测几种主要变化的发展趋势 03/12 20:48
我在想的是19*19的棋面,必定会收敛,所以我如果用另一台电脑来求出对抗这样棋路的最佳解呢?
就像当初IBM的深蓝一样,wiki中有记载到
"深蓝在棋局之间曾被修改以符合卡斯巴罗夫的下棋风格,令电脑避免再陷入其曾两次跌入
的陷阱"
4F:→ bobju: 人类具有抽象思考能力(所谓的棋感), 在过去的程式主要是靠 03/12 20:50
5F:→ bobju: 决策树来模拟, 推演各种变化并以计分的方式决定出下一步该 03/12 20:51
6F:→ bobju: 怎麽下? 对上围棋这种空间复杂度极高的游戏显然一切实际,这 03/12 20:52
※ 编辑: e12518166339 (180.177.29.27), 03/12/2016 20:55:23
7F:→ bobju: 也是在此次比赛之前人们普遍认为人类仍能凭着抽象思考能力 03/12 20:52
8F:→ bobju: 占优势, 殊不知这代的AI居然也能展示出类似人类抽象思考能 03/12 20:53
9F:→ bobju: 力的面向, 而且更胜一筹. 03/12 20:53
10F:→ bobju: 改错字: [一]切实际 <- [不]切实际 03/12 20:55
11F:→ bibo9901: 你漏想了蒙地卡罗演算法, 漏想了neural nets, 漏想了 03/12 21:06
12F:→ bibo9901: reinforcement learning, 我还真想知道你想了什麽? 03/12 21:06
13F:→ e12518166339: 抱歉功课没有作足,我需要再好好的学习一下 03/12 21:08
14F:→ remmurds: 你漏掉了围棋和西洋棋最大的差异 围棋没有明确的目标 03/12 21:26
15F:→ remmurds: 西洋棋的目标很明确 (拿下国王) 03/12 21:26
16F:推 PRAM: 就算想了蒙地卡罗,类神经,XX学习,你能做出AlphaGo? 03/12 22:12
17F:→ goldberg123: 你看的懂高手的下法你就不会在这发文了 03/13 00:22