作者DANATHE (没有经济的sense..)
看板Sabermetrics
标题Re: [讨论] XR的公式推导
时间Mon Mar 27 01:28:13 2006
※ 引述《Ajax3 (prototype)》之铭言:
: 各位先进好,小弟接触sabermetrics有一段时间了,一直对XR(Extrapolated Runs)
: 的公式有所存疑,斗胆在此发问。
: http://atlyankees.blogspot.com/2005/05/7xr-vorp-and-ws.html
: nickyang的这篇大作提到XR是利用统计学中的回归分析(regression)得到公式的,
: 但是regression的使用限制之一是「自变数彼此不能有(强烈)相关」。我想batter
: 的2B、3B、HR应该会有强烈相关吧,但这三个变数都放在XR公式中的自变数里面,
: 如此一来XR公式不就有问题了?
: 另外请教一下,VORP的公式是否也跟regression有关?
: 问了很细节的问题,请各位先进不吝指教。
对不起乱入
我认为这跟共线性(你提到的自我相关)关系不大
首先当样本够大时显着性仍然会存在
再者我猜Bill James应该是将所有data作成pooling或是panel
单纯去看一支安打会对得分造成什麽要的影响 所以它不是一个分层的样本
碰碰枪和大炮是被放在一起考虑的
你做分群时 或许大炮的二安跟全垒打会有共线性的问题
但是碰碰枪的全垒打或二安应该就跟大炮的长打没啥大关系了
重点还是在於样本数够大够多 回归分析最怕样本不够
另外即便存在一些共线性也无妨
Krautmann提出过在棒球当中变数间存在一点共线性反而可以让我们
不至於overstate其中任一个变数的点估计量 我们可以得到它的lower bound
overestimation要比underestimation来的严重
XR与RC的问题还是在於他没有考量到另一面的价值(也就是它的残差项会与投手的ERA
高度相关),所以综合面向的数据 像是WIN SHARES 是现在运动经济学中(当然我指的是
棒球)衡量选手指标很重要的一项指标 没有底八格我的论文就难做了 XD
等到论文的结果跑出来 再来这边献丑与大家分享!
--
我的blog:
http://www.wretch.cc/blog/seniorpastor
很阳春,主要是讨论棒球、音乐与经济的一个blog。
欢迎您的莅临!
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.228.241.138
※ 编辑: DANATHE 来自: 61.228.241.138 (03/27 01:29)
1F:推 Debugger:这太专业了 @.@ 03/27 01:31
2F:推 Despina:这篇跟痴汉的文还有Herlin那篇相比 差好多 看不懂=.= 03/27 01:49