作者perfectcamel (完美駱駝)
看板Inference
標題Re: [討論] 一題機率遊戲中的策略設計
時間Sun Feb 7 02:09:51 2010
※ 引述《brains (不認識)》之銘言:
: 甲乙兩人在玩一個機率遊戲。
: 每一回合裡:
: 甲和乙各自從[0,1]取一個實數,
: 選好後一起公開, 並把自己選的x值輸入給隨機系統作評判.
: 隨機系統有x的機率回傳"Yes", 有(1-x)的機率回傳"No".
: 若甲乙都收到"Yes", 則x值較小的一方得1分.
: 若一方收到"Yes", 另一方收到"No", 則收到"Yes"的一方得1分.
: 若甲乙都收到"No", 則大家都不得分.
: 若剛好甲乙都收到"Yes"且彼此的x值相等, 則大家各得0.5分.
: 新的回合要取新的x, 不停的比下去, 累積比分,
: 在某一定回合(如10回合)後比總分, 分數多方獲勝.
: 假設甲乙都是絕對理性,
: 請問: 他們將採取什麼樣的策略才能讓自己不敗呢?
下有令人厭煩的數學計算,不喜勿入
和原題或許稍有不同,我方考慮最安全的策略,
即尋找我方在敵方最佳策略下的最高期望值
假設取x得1分的機率為y
考慮對方的策略:
a. 對方選擇無限趨近x而小於x的另一個實數
b. 對方選擇1
先解釋一下為什麼只有這兩個選項:
若存在一數字k使對方選擇另一此數字會同時勝過a,b兩項
則若k > x,則這個選擇必比選項b差
(若要選擇大於對方的數字,選擇1最大化己方yes機率)
若k <= x,則這個選擇必比選項a差
(若要選擇小於對方的數字,選則最接近對方的數字最大化己方Yes機率)
如果上面的解釋接受的話,那我們來考慮一下在x等於多少時,
應對這兩個策略有最高的最低期望值
小弟的數學都忘得差不多了,計算方法有比較繁瑣的地方請見諒
a策略中, y = x(1-x) / [1-(1-x)(1-x)]
解釋一下,得分的情況是我方回傳yes(機率為x)而敵方回傳no(機率無限趨近1-x)
樣本空間則是雙方間有人得分的情況,也就是1-(雙方都no的機率)
y = x(1-x) / [1-(1-x)^2]
b 策略中
y = x
接下來的推論要先屏除x = 1 和 0的情況,不過這不影響,因為這兩個選擇都是最糟的
選擇0時,我方永遠沒有得分的機會,
選擇1時,對方可以選擇無限趨近於1的值,造成我方得分機率無限小
選擇a策略的條件是:
x > x(1-x) / [1-(1-x)^2]
-> [1-(1-x)^2] > (1-x)
-> (1-x)^2 < x
-> x^2 - 3x + 1 < 0
-> (x - 3/2)^2 < 5/4
-> -根號(5/4) < x - 3/2 < 根號(5/4)
-> 3/2 - 根號(5/4) < x < 3/2 + 根號(5/4) 後項大於1,和題目要求的範圍不合
故可知當x > (3-根號5) / 2 時, 對方會選擇a策略,否則會選b策略
在敵方選擇b策略的區間,我方的最大期望值很單純,就是(3-根號5) / 2 (y=x)
若在敵方選擇a策略的區間有更好的結果,則
x(1-x) / [1-(1-x)^2] > (3-根號5) / 2
-> x(1-x) / (2x - x^2) > (3-根號5) / 2
-> (1-x) / (2-x) > (3-根號5) / 2
-> 2-2x > (3-根號5)(2-x)
-> 2*根號5 - 4 > (根號5-1)x
-> x < 2(根號5 - 2)/(根號5-1)
-> x < (根號5 - 2)(根號5 + 1) / 2
-> x < (3-根號5) / 2
這和前面的結果矛盾(請看前面我們得到的結論)
故我方沒辦法在敵方選擇a策略的區間中找到更佳的策略
故得結論,若我方選擇(3-根號5) / 2,則無論對方之策略,
我方的得分期望值皆可保持(3-根號5) / 2
是在這個遊戲中最安全的策略
若有錯誤請指正
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 118.166.249.166
1F:推 isnoneval:對方若選比 (3-sqrt(5))/2 略小就會勝 02/07 11:26
2F:→ isnoneval:我們要算的是雙方得分差, 不是己方得分 02/07 11:27
3F:→ isnoneval:這題的不敗策略是個混合策略, 不是純策略 :3 02/07 11:28
4F:推 isnoneval:又, 我發現我上次推的解有筆誤, 應該是 02/07 11:39
5F:→ isnoneval:P(x) = 0 when x < 1/3; 1/(4x^3) otherwise 02/07 11:40
6F:→ perfectcamel:樓上誤會我的想法了,當對方永遠以最佳應法時,我方事 02/07 18:50
7F:→ perfectcamel:實上沒有很好的策略能獲得大於1/2的勝績 02/07 18:51
8F:→ perfectcamel:另外,我提出的只是最安全的純策略(上面也提到了,和原 02/07 18:52
9F:→ perfectcamel:題稍有出入) 02/07 18:52