作者isnoneval (天道)
看板Inference
标题Re: [讨论] 一题机率游戏中的策略设计
时间Mon Feb 8 00:39:36 2010
诚如 ddavid 所说过的,这个问题是一个很标准的赛局理论问题。
要正确理解这个问题,就要知道什麽是纯策略和混合策略。
http://en.wikipedia.org/wiki/Strategy_%28game_theory%29
http://zh.wikipedia.org/wiki/%E7%AD%96%E7%95%A5_(%E5%8D%9A%E5%BC%88%E8%AB%96)
先不要管十回合的问题,只考虑一回合,我们追求胜分的期望值就好。
(胜分 = 我方得分 - 对方得分)
首先如 ars1an 在原文的推文中所说,这题没有纯策略解, (这很好证)
而 John Nash 告诉我们平衡点一定存在,所以我们要追求的是一个混合策略。
那麽,
1.胜分是零和,所以最佳策略是 weak Nash equilibrium (顶多保证不败)。
2.最佳策略必不败於任何纯策略 (废话)。
3.若某策略不败於任何纯策略,则该策略不败於任何策略。
(因为任何策略的胜分期望值都是纯策略胜分期望值的加权平均)
4.由 2,3 两点得知,我们只要检查对所有纯策略都不败即可。
先算简单的,若我方出 x 对方出 y, x < y 则胜分期望值为:
xy + x(1-y) - y(1-x) = x - y + xy
若 x > y 则反过来:
x - y - xy
假设在最佳策略中我方出数字 x 的机率为 p(x),而对方出 y,胜分期望值为:
∫{0~y} p(t)(t-y+ty) dt + ∫{y~1} p(t)(t-y-ty) dt
= ∫{0~1} p(t)(t-y-ty) dt + 2∫{0~y} p(t)ty dt
= (1-y)∫{0~1} p(t)t dt - y∫{0~1} p(t) dt + 2y∫{0~y} p(t)t dt
= (1-y)∫{0~1} p(t)t dt - y + 2y∫{0~y} p(t)t dt
这时候当然要令 G(y) = ∫{0~y} p(t)t dt,则
= (1-y) G(1) - y + 2y G(y)
我们的目的是找到一个 p 使得上式恒不小於零。
後面的过程我忘了,有一部分可能是凑出来的:
1. G(1) >= 1/2
2. G(y) >= 1/2 - (1/2y - 1/2) G(1)
3. 假设 G(y) >= 3/4 - 1/(4y) 则可满足 2.
4. 假设 G(y) = 3/4 - 1/(4y) → p(t) = 1/(4t^3) when t > 1/3
5. ∫{1/3~1} p(t) dt = 1, 机率分布刚好用完, 剩下 0~1/3 间都是 0
----
(後来我想起来这里是怎麽算的了 XD
考虑对方使用相同策略的情况,得到
∫{0~1} p(y) [(1-y) G(1) - y + 2y G(y)] = 0
但是 p(y) >= 0, (1-y) G(1) - y + 2y G(y) >= 0
所以 p(y) = 0 or (1-y) G(1) - y + 2y G(y) = 0 almost everywhere
因为 y < 1/3 时 (1-y) G(1) - y + 2y G(y) > 0,
所以 0~1/3 间 p(y) 都是零 (a.e., 不过没差)
然後再从 1/3 往上逐步逼到 1/(4t^3) )
----
所以若 p(t) = 0, when t < 1/3
1/(4t^3), otherwise
则
1. ∫{0~1} p(t) dt = 1, p 是个机率分布
2. G(y) = 0, when y < 1/3
3/4 - 1/(4y), otherwise
3. G 满足 (1-y) G(1) - y + 2y G(y) >= 0
4. 事实上当 y >= 1/3 时 (1-y) G(1) - y + 2y G(y) = 0
而 y < 1/3 时 > 0
5. 也就是说,这个策略和出 1/3 以上任何数字的纯策略打平,
而对出低於 1/3 的任何数字的纯策略则会胜出。
6. 也就是说,这个策略和任何只用 1/3~1 之间数字混出来的策略都打平,
对其他则胜出。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.217.110.59
※ 编辑: isnoneval 来自: 61.217.110.59 (02/08 00:43)
1F:推 ddavid:推 02/08 00:43
※ 编辑: isnoneval 来自: 61.217.110.59 (02/08 08:09)
2F:推 cktyler:专业推 02/23 12:51
3F:推 brains:推! 03/01 00:28