作者perfectcamel (完美骆驼)
看板Inference
标题Re: [讨论] 一题机率游戏中的策略设计
时间Sun Feb 7 02:09:51 2010
※ 引述《brains (不认识)》之铭言:
: 甲乙两人在玩一个机率游戏。
: 每一回合里:
: 甲和乙各自从[0,1]取一个实数,
: 选好後一起公开, 并把自己选的x值输入给随机系统作评判.
: 随机系统有x的机率回传"Yes", 有(1-x)的机率回传"No".
: 若甲乙都收到"Yes", 则x值较小的一方得1分.
: 若一方收到"Yes", 另一方收到"No", 则收到"Yes"的一方得1分.
: 若甲乙都收到"No", 则大家都不得分.
: 若刚好甲乙都收到"Yes"且彼此的x值相等, 则大家各得0.5分.
: 新的回合要取新的x, 不停的比下去, 累积比分,
: 在某一定回合(如10回合)後比总分, 分数多方获胜.
: 假设甲乙都是绝对理性,
: 请问: 他们将采取什麽样的策略才能让自己不败呢?
下有令人厌烦的数学计算,不喜勿入
和原题或许稍有不同,我方考虑最安全的策略,
即寻找我方在敌方最佳策略下的最高期望值
假设取x得1分的机率为y
考虑对方的策略:
a. 对方选择无限趋近x而小於x的另一个实数
b. 对方选择1
先解释一下为什麽只有这两个选项:
若存在一数字k使对方选择另一此数字会同时胜过a,b两项
则若k > x,则这个选择必比选项b差
(若要选择大於对方的数字,选择1最大化己方yes机率)
若k <= x,则这个选择必比选项a差
(若要选择小於对方的数字,选则最接近对方的数字最大化己方Yes机率)
如果上面的解释接受的话,那我们来考虑一下在x等於多少时,
应对这两个策略有最高的最低期望值
小弟的数学都忘得差不多了,计算方法有比较繁琐的地方请见谅
a策略中, y = x(1-x) / [1-(1-x)(1-x)]
解释一下,得分的情况是我方回传yes(机率为x)而敌方回传no(机率无限趋近1-x)
样本空间则是双方间有人得分的情况,也就是1-(双方都no的机率)
y = x(1-x) / [1-(1-x)^2]
b 策略中
y = x
接下来的推论要先屏除x = 1 和 0的情况,不过这不影响,因为这两个选择都是最糟的
选择0时,我方永远没有得分的机会,
选择1时,对方可以选择无限趋近於1的值,造成我方得分机率无限小
选择a策略的条件是:
x > x(1-x) / [1-(1-x)^2]
-> [1-(1-x)^2] > (1-x)
-> (1-x)^2 < x
-> x^2 - 3x + 1 < 0
-> (x - 3/2)^2 < 5/4
-> -根号(5/4) < x - 3/2 < 根号(5/4)
-> 3/2 - 根号(5/4) < x < 3/2 + 根号(5/4) 後项大於1,和题目要求的范围不合
故可知当x > (3-根号5) / 2 时, 对方会选择a策略,否则会选b策略
在敌方选择b策略的区间,我方的最大期望值很单纯,就是(3-根号5) / 2 (y=x)
若在敌方选择a策略的区间有更好的结果,则
x(1-x) / [1-(1-x)^2] > (3-根号5) / 2
-> x(1-x) / (2x - x^2) > (3-根号5) / 2
-> (1-x) / (2-x) > (3-根号5) / 2
-> 2-2x > (3-根号5)(2-x)
-> 2*根号5 - 4 > (根号5-1)x
-> x < 2(根号5 - 2)/(根号5-1)
-> x < (根号5 - 2)(根号5 + 1) / 2
-> x < (3-根号5) / 2
这和前面的结果矛盾(请看前面我们得到的结论)
故我方没办法在敌方选择a策略的区间中找到更佳的策略
故得结论,若我方选择(3-根号5) / 2,则无论对方之策略,
我方的得分期望值皆可保持(3-根号5) / 2
是在这个游戏中最安全的策略
若有错误请指正
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 118.166.249.166
1F:推 isnoneval:对方若选比 (3-sqrt(5))/2 略小就会胜 02/07 11:26
2F:→ isnoneval:我们要算的是双方得分差, 不是己方得分 02/07 11:27
3F:→ isnoneval:这题的不败策略是个混合策略, 不是纯策略 :3 02/07 11:28
4F:推 isnoneval:又, 我发现我上次推的解有笔误, 应该是 02/07 11:39
5F:→ isnoneval:P(x) = 0 when x < 1/3; 1/(4x^3) otherwise 02/07 11:40
6F:→ perfectcamel:楼上误会我的想法了,当对方永远以最佳应法时,我方事 02/07 18:50
7F:→ perfectcamel:实上没有很好的策略能获得大於1/2的胜绩 02/07 18:51
8F:→ perfectcamel:另外,我提出的只是最安全的纯策略(上面也提到了,和原 02/07 18:52
9F:→ perfectcamel:题稍有出入) 02/07 18:52