作者morikawablue (morikawablue)
看板MLB
标题Re: [讨论] 假设有一个这样的球员
时间Fri Aug 18 10:29:44 2006
※ 引述《tradewind (The Twins Rule)》之铭言:
: Base Runs 的算法是:
: 得分 = 跑者数目 * 得分率 + 全垒打数目
: A 是跑者的数目,这点没有问题,D 是全垒打的数目也没有问题,
: 那麽得分率如何计算?B 指的是推进成功,C 则是推进失败(出局),
: 用 B / (B + C) 这个比率来模拟得分率。
: 如果把 B 项展开,会变成
: 0.8 * 1B + 2.2 * 2B + 3.6 * 3B + 2 * HR + 0.1 * BB
: 这些系数当然是一种推估。
Focus 在 Base Runs 的基本型态,可以看成是:
Base Run = (垒上的跑者) * (垒上跑者得分的比率) + (全垒打数)
这是 fundamental 中的 fundamental,the way how the runs are collected,
我所指的 "equation" 是这个部份。
有了 equation 後,自然可以加入一堆自变数去增加 Base Runs 的自由度与准
确性。以立意而言,我觉得 Base Runs 出发点是相当好,如此而已。
: 我看不懂你上面这段的意思。
Forget it!这是先前自己没想清楚的问题,毕竟 Runs Estimator 不是用来
衡量相对价值用的东西。
: 不知道为什麽你觉得 A 项需要受到「同时最多只能有三位跑者」的限制?
: 事实上,如果连续击出四支一垒安打,应该会有两人回来得分,两人在垒,
: 并不会同时有四人在垒。实际状况得 2 分,而 Base Runs 是 4 分,
: 并不 match
我认为这只是因为 "三位跑者" 在任何一局的进攻里都是基本的限制,
同时这不只代表 "三位跑者" 是一个限制,"最多三个残垒" 也应该是
个限制,换句话说 Max. 3 runners 与 Max 3 runners left on Bases
这两个东西是等价的。
好比说在某一局的进攻里,我们有 3 个 AB 通通出局,但是有 100 个 BB
,以 Base Runs 的估计式来算,我们会得到 77.27 分,这代表的意思是:
除了 3 个出局数以外,我们会有 20 个残垒 (因为我们有 100 个 runners)
!?这绝对是不正常的行为。而造成这种因素的原因,当然还是在整个
"fundamental equation" 唯一用 "估计" 的那一项 B / (B+C)。
那我们可以把例子推大一点,即使是大样本,我相信我找得到一种情况、或
者说一种 linear combination 让 B 项使得最後的 Base Runs 在 N 局的
比赛里产生了大於 3 * N 的 LOB (残垒),以一个从 "真实角度" 出发的
Runs Estimator,我认为如果出现了上述的结果,这叫 "犯规"。
我也嚐试用控制变数去寻找 triples 的问题,因为在整个 B 项目里,
我觉得 triples 的权重似乎是太大了。我原本认为在某种极端的情况下
,我可以找到某群打者的 PA * OBP (这就是跑者数目) 会小於
Base Runs 所估计的得分的例外状况 (You cannot score more runs than
the count of runners you have.),但至今还没有发现。
: 比起 RC、XR、Linear Weights 等其他 run estimation,
: Base Runs 在极端状况下的表现更接近真实,在正常状况下也不逊色。
: http://gosu02.tripod.com/id8.html 可以参考这里的例子,还有
: RMSE 的计算结果。
我认为把 baseball 当成 "人类行为学" 的人会爱这个 Base Runs --
不像是 Pythagorean formula,Base Run 可能是少数 sabermetrics 式
子里能看出内涵的一个 estimator。
--
Your Girl Friend Loves My Team.
Morikawa Blue
http://morikawablue.blogspot.com/
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.218.109.213
※ 编辑: morikawablue 来自: 61.218.109.213 (08/18 18:23)