作者ddavid (谎言接线生)
看板GO
标题Re: [讨论] 黑不贴目,初手天元,能下吗?
时间Fri Jun 26 00:34:01 2020
※ 引述《staristic (ANSI lover)》之铭言:
: 有个问题,板上如果有赛局理论的专家的话还请解答一下
: 1、「明显」有利和不有利的分界在哪?
: 我记得AlphaGo当初有公布内部的黑白胜率
: 在3.75子的贴点下白棋起始胜率是55%左右
: 开发团队的评论是「两方差不多,很公平」
: 代表有顶尖专家的Deepmind团队都认为至少到55:45这个比例仍是可接受的
: 印象中人类的对局黑白胜率统计并没有超过这个数字?
: (一时不知去哪找,有请各位高手补充)
: 是否有办法用数学的理由说明
: 「现在的贴目对人类而言有没有差别」?
我分项来说:
1. 数学上的话,我们不妨这样思考:假设双方实力稳定而胜率固定,那麽如果让一
方永远拿黑棋,另一方永远拿白棋,到底要下多少盘,期望值才会出现有实质意义的
胜负差距?
详细的推导我在这边不提,总之:
在固定胜率r下,进行n局棋的胜局期望值 = n * r
也就是说,0.55胜率下一局棋,期望值就是赢下0.55局。下两局,期望值就是赢
下1.1局。
那麽什麽叫做有实质意义的差距?这边就没办法有100%绝对精确的定义了,但是
我提出两个简易而直觉的参考标准:
● 如果下n局後,双方的期望值会差到1局以上,那表示就算双方实力相当也足以影
响胜负结果了吧?
● 如果下n局後,双方的期望值会差到0.5局以上,那似乎也表示胜率落後方要努力
发挥还多拿下一局才会更有机会胜出整个系列赛了吧?
那我们来看看七番棋,0.55 vs 0.45胜局期望值对比:
3.85 vs 3.15
差距是0.7局,直觉上已经是落後方需要付出更多一点努力的程度了,但好像又
没有不可挽救到差整整一盘。
显而易见0.5的门槛是落在五番棋上,而期望值直接多胜出一局则在十番棋大战
「几乎必然发生」了。也就是说在不交换黑白子持续下下去的情况下,这样下十番棋
在期望值上等於直接多让一盘出去。
然而只下一盘的话,就只差0.1,这个差距看起来就没有像是无法挽回的情况。
我们看看73开下七番棋的情况:
4.9 vs 2.1
这就非常明显了吧,光七番棋要直接多输2.8盘,几乎等於领先方直接听牌才来
跟你公平下的感觉。
2. 然而,如果看单一棋局的话,评估方式又有所不同了。这个评估更不容易,我以
下讲的是一个很直觉但并不精确的初步想法。如果能有大量对局的细部统计数据,其
实我们就有机会建立出更好的评估方式:
我们先做一点假设:假设平均一局棋会下100手(方便计算)。那麽一方平均会
下50手。也就是说,双方轮流下一手,原本胜率落後方就必须把胜率追近:
(高胜率 - 低胜率) / 50
要能平均追近这麽多,一百手以後才会成为一个均势结束。拿0.55跟0.45来看,
这是0.002。以人类下棋目前的胜率震荡,好像没有什麽感觉嘛?
不对,我们要考虑到一件事情,就是下到结束时,胜率一定是变成1跟0。而假设
胜率计算精确且全局没有翻转,则可以想成是胜率领先一方的胜率慢慢成长到终局的
1。也就是胜率领先方其实先天可能拥有一个平均胜率自动增长量:
(1 - 高胜率) / 50
以0.55来说,他就得到一个0.009的平均来回一手之胜率自动增长。也就是说,
落後方其实要背负着0.002 + 0.009 = 0.011的胜率追赶速度。
每来回一手就必须要多追超过1%的胜率最後才真的会赢,是不是比较有感觉了一
些?
有人应该已经发现上面拆成两块来讲是在唬烂废话的,其实整合来说根本就是「
落後方到最後胜率要变1的平均胜率成长要求」:
(1 - 低胜率) / 50
我们看看73开的情况,是落後方每一手就要提升1.4%的胜率。如果实际常常用AI
验证自己棋局的棋友,应该会对这个要求的难度有更实际的体感。
然後我们就会发现,如果整局手数多,这个每来回一手平均胜率提升要求就会被
分摊得较少。这也可说符合棋理中落後方应该让盘面复杂,领先方应该让盘面简明的
概念,甚至落後方藉由打劫来进一步增加总着手数也是一种手段。100手其实算很短
的估计,所以前述的范例其实都是高估难度的情况。
: 2、预期心理的影响有多大?
: 是否相较於现在的环境,会出现更多那种双方都觉得自己优势/劣势的对局?
: 不止是围棋,这类先天的乐观或悲观的心理是普遍的现象吗?
: 对於胜负的影响有多少?
这肯定有,另外包括时间运用也都包含在内。
但「有多少」我觉得非常难以评估,这方面比较偏棋手自己的风格与内心活动。
有人可能虽落後但差距不大就都只尽力下出想到的最佳着手稳定追逐,但有人可
能一落後就倾向下双方都不容易算清的强手打乱局势,导致的後续结果差距很大,所
以我不认为这部分可以有很公平的估计标准。
这方面可能可以做的研究是,个别分析不同棋手,去看特定棋手的胜率变化情况
,可以看出该棋手对於当下胜率是否敏感,以及发现自己胜率高或低时是否会明显出
现下法的变化等等。然後再整体统计所有棋手的情况,从而得出所有棋手有多少比例
会因为贴目数而下法明显出现不同的波动,进一步估计心态影响的强度及普遍性。
--
「传说的最後,魔王总是被勇者封印。但勇者会逝去、封印会衰弱,魔王却永远
不灭。传说呢?传说持续着。只是,变质了。所以对於传说而言,只有反覆无常的自
己是主角,而魔王只是配角。勇者?勇者不过是消耗品罢了,封印则什麽也不是。你
好不容易有机会当上配角,怎麽走回头路想成为消耗品?你早晚会什麽也不是的。」
--星.幻.梦的传说
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.250.172.144 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/GO/M.1593102843.A.F17.html
※ 编辑: ddavid (111.250.172.144 台湾), 06/26/2020 00:35:44
1F:推 Aipr: 人下的棋局 从来都不是胜率慢慢增涨到1的 06/26 00:47
2F:→ Aipr: 也许可用人类棋局过程的胜率,计算开局胜率与胜负的相关性 06/26 00:48
是,所以我说这只是一个不精确的估计XD。毕竟这是个大问题,怎麽可能我在这
边随便写写就是一个完美解XD
真实情况是各种上下波动,所以其实可以把整条波动曲线丢进去分析评估。但要
怎麽做,这细节就多了。
※ 编辑: ddavid (111.250.172.144 台湾), 06/26/2020 02:26:23
3F:推 staristic: 从番棋的角度看这个真是个有趣的观点XD 06/26 19:33