作者farmerlu (光明居士)
看板five_chess
标题[9.3] 局势评估的「范围式分数」
时间Sun Dec 18 22:17:15 2011
对於每个局势的评估, 如果能算清其後所有变化的话,
对五子棋来讲, 只有 胜、负、和 3 种情况
如果把胜局定为 100 分, 负局定为 -100, 和局定为 0 分,
则结果只有 100, -100, 0 三种情况.
因为算不清楚, 所以会照「感觉」给个评估值. 再选评估值较高的盘面.
但对於较尖锐的情况, 评估值会是一个「范围」.
----------==========----------=========
例一:
假如对方做出一活三, 我方有两端可以选.
第 1 个着点, 局势分数范围在 -3 ~ -1 之间, 平均为 -2
第 2 个着点, 局势分数范围在 -7 ~ +1 之间, 平均为 -3
理论上(数学期望值)第一个着点较佳, 只负了 2 分. 但「小输还是输」.
第 2 个着点平均虽为 -3, 但有嬴的机会, 故可以放手一博选第 2 个着点.
此时我们选的是「分数范围上界」较高的着手.
这又常称为「胜负手」
-5 0 5 10 15 20
第1着点 | | | | | |
[-3~ -1] | | | | | |
平均 -2 | ■■| | | | |
| | | | | |
第2着点 ■■■■■■■ | | | |
[-7~ +1] | | | | | |
平均 -3
有了「局势分数的范围」做基础, 比赛时可根据规则拟定策略.
如果本例发生在围棋, 第 2 着点可想像成要杀对方一块棋,
如果杀到, 嬴1目, 如果没杀到, 输7目.
(但是不知道能不能杀到. 如果都知道, 那就是神了, 也不必讨论策略了)
如果比赛规则只论输嬴, 那就选 2 -- 胜负手.
如果比赛规则为按照输嬴点数算奖金(例如每输嬴一目 100 元), 则选1.(小输为嬴)
----------==========----------=========
例二:
-5 0 5 10 15 20
第1着点 | | | | | |
[-1~ +15] | | | | | |
平均 +7 | ■■■■■■■■■■■■■■■■■■■■ |
| | | | | |
第2着点 | | ■■■| | | |
[+2 ~ +4] | | | | | |
平均 +3
选第1点可能优很多, 也可能小输; 选第2点则一定是小优.
为了安全起见, 可以选 2. (安全手) 慢慢累积优势
--此时选的是「分数范围下界」较高的着手
----------==========----------=========
以上方法见於 颜士净先生的围棋博士论文. (感谢 bobocat 於 10 年前的介绍)
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 101.137.98.207
1F:→ farmerlu:bobo 中枪 12/18 22:25