作者wuyen (wuyen)
看板Sabermetrics
标题毕式理论胜率1:James, Palmer, Davenport
时间Sun Mar 19 18:03:33 2006
Bill James:
胜率=(得分^2)/(得分^2+失分^2)
也有看过指数用1.8,1.82,1.83
Pete Palmer:
Step 1. Runs Per Win(RPW)=10*sqrt(((得分+失分)/Games)/9) * sqrt:开平方根
Step 2. 预期胜场 = (得分-失分)/RPW + (胜+败)/2
Clay Davenport:
平均得失分为4分及2分 和平均得失分为10分5分
这两者在毕式定理中是一样的东西
但是平均赢两分和平均赢五分在真正的比赛中
我们可以想见赢五分的最後胜率很有可能比赢两分的高
这种「run environment」是毕式定理所忽略的
Davenport首先计算过往资料中每个球队的「needed exponent」
简单的说就是从过往资料算出每个球队的个别适用的指数
这个指数的计算公式为 log(胜/败) / log(得分/失分)
如果当得分等於失分时 分母的地方会是0
这时就假设该值为一个很大的数或无限大
计算後结果如下表:
RPG 队数 RPG(取中位数) 指数(取中位数)
------------------------------------------
>12 88 13.02 2.056
10-12 294 10.58 2.018
9-10 460 9.39 1.957
8-9 697 8.51 1.857
7-8 384 7.61 1.784
<7 109 6.77 1.625
注:RPG代表每场总分 公式为 (得分+失分)/Games
然後他把算出来的这些结果用Y=指数 X=log(RPG)去跑回归
结果得到了 指数=1.51*log(RPG)+0.44 这样的回归式
而经由这样的公式再去计算每个球队的推估胜率
发现平均误差缩小到3.991 比起前面的公式都来得好
他的结论是先以1.5*log(RPG)+0.45这样的公式算出一个球队该有的指数
再将这个指数套用到毕式定理的指数
以前面的例子而言 一支平均得失分为4分及2分的球队
其指数为 1.5*log(4+2)+0.45=1.617
经由毕式定理推得的胜率为 (4^1.617)/(4^1.617+2^1.617)=0.754
而一支平均得失分为10分及5分的球队
其指数为 1.5*log(10+5)+0.45=2.214
经由毕式定理推得的胜率为 (10^2.214)/(10^2.214+5^2.214)=0.823
如果今天指数都是只用2的话 两支球队的胜率都会是0.8
但是经由考虑到得失分 胜分较多的球队会取得较高的胜率
Davenport的公式经由实验发现比原始的毕式定理表现较佳
--
以前翻得旧文 重新整理拿出来po :P
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.224.78.135