作者Anakin (Anakin)
看板MLB
标题Re: [讨论] 初登板前三年连庄胜投王
时间Wed Sep 12 21:11:24 2007
※ 引述《building (building)》之铭言:
: 先举个简单极端的例子,
: 如果有一只强队,得分很多,假设校正的得分要打八折。
: 如果有另一只弱队,得分很少,假设校正的得分要加两成。
: (强弱只是为了描述方便,希望不要介意)
: 现在有另外两位投手,分别对上这两只队伍,
: 投手一面对强队掉十分,但是面对弱队没有失分。
: 投手二刚好反过来,对强队无失分,但是队弱队掉十分。
: 在校正之前,这两位投手的失分一样,
: 但是校正之後,投手一变成掉八分,投手二变成掉十二分。
其实我不太明白你举这个例子所代表的意义耶 @_@
为什麽面对不同的队伍,失分就要重新调整呢?
我试着用我的方法来解释,你看看我这样解释有没有道理。
首先,你的问题是:
: 为什麽校正的数值会有不小的差异呢?
: 而在上面美联东区的投手里面,
: 很巧地刚好就是 Yankees 的两位投手校正的差异最小。
你的结论是:
: 回到我们一开始说的,比较同一区的投手,
: 这个校正刚好惩罚了善於压制强队,但不善於压制弱队的投手。
: 所以,这真的是「中立」的校正吗?
: 校正之後的数据真的比较真实吗?真的比较公平吗?
以下借用casatwl列的表,而所谓的差异,我用比例来表示,四舍五入到小数点第
二位。
ERA ERA﹡ ERA*/ERA TM
Pettitte 3.78 3.50 0.93 NYY
Wang 3.69 3.45 0.93 NYY
Beckett 3.27 2.86 0.87 BOS
Matsuzaka 4.44 3.85 0.87 BOS
Halladay 3.91 3.33 0.85 TOR
Burnett 3.56 3.02 0.85 TOR
Marcum 3.74 3.23 0.86 TOR
McGowan 3.90 3.32 0.85 TOR
Bedard 3.16 2.82 0.90 BAL
Guthrie 3.65 3.27 0.90 BAL
Kazmir 3.65 3.13 0.86 TB
Shields 3.96 3.44 0.87 TB
各位有没有发现一件很神奇的事情,同一个队伍的投手,他们ERA调整的比例竟然
差不多,这一定不是什麽投手类型的问题,相同类型的刚好在同一队,这也未免太
巧了。
那麽会这样的原因是什麽呢?其实一样只要好好看一下说明就知道了。
首先,ERA = ER*9/IP
我们先看ER是怎麽修正的?首先看他给的例子:
ER = 42 * (33.67 / 38.91)
42是未修正以前的ER,33.67是修正後的RC allowed,38.91是修正前的RC allowed
,所以很明显的,他只是乘上一个数字就调整了ER,这也是我上面的表为什麽不用
差距而用比例表示的原因。
那麽他是乘上什麽样的数字呢?33.67/38.91=newRC/RC
再对照他说明如何从RC求得newRC:
newRC = RC * park * league
newRC/RC = park*league
答案已经很明显了,ER的修正只是乘上park*league
league就是先前提到的,把联盟平均每162场的得分调整到750,而因为上面几位投
手都在同一个联盟,所以这部分可以忽略不计。(如果硬要知道的话,上表的投手
中每个人这个数字都是0.94)
剩下的就是park了,也就是球场修正,於是我们很清楚为什麽同队的投手刚好都会
出现差不多的数值,因为同队伍的,这个数值是一样的。
除了ER之外,还有IP,用同样的方式去验算就可以知道结果。
其实他开宗明义就有说到,他做的调整包括了:1.调整为中性球场数据、2.调整为
162 场比赛的数据、3.投手自责分调整为失分的 90%、4.联盟平均得分调整为 750
分。
由於上表中列出来的都是今年美东投手的成绩,所以2、4两项原本就在相同条件下
了,不用考虑,3.在计算 ERA的时候也不用考虑,真正会出现差异的地方,当然只
有park factor了。
於是我得到了一个跟你不同的结论,上表所列出来的只是依照他的设定出现的结果
,由於洋基的投手相较於其他队伍的投手,在一个最偏向投手的球场投球(至少BR
的park factor 是这麽说的),所以他们的ERA被调整的幅度比其他同区球队的投手
要来的小。我认为,应该不是因为这个数据的计算本身会惩罚具有某种特性的投手
才对。
前面只是想解释一下,关於上面的问题,我所观察出来的原因,但是在我观察的过程
中,发现BR在计算 Neutralize Stat时,因为某些数据的缺乏,被迫采用一些估计值
,由於他没有说明(或者是我没有找到)这样估计的原因,而估计值和实际数值又有
不小的出入,所以我认为不要他计算出来的数字看得太认真,做为参考就好了。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.230.190.111
1F:推 waitla:我才想po说 XD 作者把环境设定为750 runs/team的意思被搞뼠 09/12 21:16
2F:→ waitla:错了 这麽做跟算投手RA没关系 它只是要消除掉投手受到队友 09/12 21:17
3F:→ waitla:火力支援多寡的因素给消除 算RA是用原本局数中的RC allowed 09/12 21:18
4F:→ waitla:去做park跟league校正 再用新的RC allowed去对RA做换算 09/12 21:19
5F:→ waitla:不过好像被误解为对手的得分能力 XD 09/12 21:21
6F:推 Anakin:实际去看一遍怎麽计算的,应该就不会误解了 @_@ 09/12 21:23
7F:推 askquestion:good ~ 本来出门前也想回差不多的东西,回来後您已回. 09/12 21:44
8F:推 myass:推 09/12 22:33
9F:推 agentsmith:推认真...但是看不懂XD 09/12 23:45
10F:推 tunababy:这堂统计课上的可真紮实啊.. 09/13 04:08