作者Manstein (exposure)
看板Dodgers
标题[科普]新玩具-跑垒量化/守备总量化
时间Wed Jul 19 04:27:37 2023
官方御用数据团队 Statcast 目前发表两项新型数据
可供查询研究,第一个是跑垒,过去这部分是没有,
或者很难量化的,现在一网打尽。
由於是科普文,我直接写下如何查询的步骤(而不是提
供缩连结)。
1.去 Baseball Savant 的官网 baseballsavant.mlb.com
2.右上角有所谓排行榜 Leaderboard,游标移过去。
3.左展开後下角可以看到我们这次要讲的第一项数据:
Baserunning(目前还有小标"New"表示是新的数据)
4.点进去就进入了所谓 Baserunning 数据化资料库。
我们用本季本队来作例子好了,下面 Filter 通通不要动
,仅把最後一项 Teams 改成本队道奇就好,就会显示出
本队本季的跑垒表现(注:这边的跑垒是不含盗垒在内,
盗垒已经有详细数据了)
我们先看下面可以分作三块 Panel,分别是
Runs Breakdown (进垒分总)
How often does the runner attmpt to advance
(跑者有多常尝试(额外)进垒)
How often was the runnder successful in advancing
(跑者有多常成功(额外)进垒)
第一块基本上就是总结,基本上所有数据最後我们都可以
总结成一句话:该球员比平均多拿了多少"分"? 这个计算
不容易,Statcast 表示他们综合了以下数据:
跑者跑速
外野手臂力
跑者实际位置
外野手与球和垒包的相对位置
由以上各种资料可以推出每个额外进垒的理论成功率,上
面说明方块中另有提供一篇文章描述背後的建构模型理论
(当然,是简化版的)"Distance Time"model。
有了理论成功率以及事实上球场上的成功率我们就可以算
出每个球员额外提供多少分,不过他这边没有讲说他怎麽
操作的,不太确定他是有一个平均值乘上去(计算上简单,
但是会比较不精确),还是说要带入 WPA 矩阵来计算(计算
复杂,但是精确),啊不管如何,反正就是可以把它转换
回分数就对了。
第一个球员是 Outman,第一组数据是这样的:
Runer Runs 1
Advances 2
Thrown Out 0
Holds -1
换成文句叙述是这样:「Outman 本年度到今天为止靠着跑垒
比联盟平均跑垒者替球队多赚了一分。这一分是由以下三出
象的分数综合加减而得: 额外进垒(+2)、被外野传球出局(+0)
、停在不往前推进(-1)」
注意这些数字 Statcast 都帮你四舍五入到个位数了,因此
有些球员你会发现三项加起来不等於总和,这是正常的。
中间右边两个 Panel 就提供了进阶的数据,这部分应该是
可以直接看得懂的我就不进行教学了。
现在我们来看数据本身,结论就是本季本队的跑垒可下四字
考语「平淡无奇」,打到现在都已经快一百场了,最多每个
人多贡献的也不过就是四个人各一分(然後被 Peralta 扣两
分回来),也就是说打了一百场本队比联盟平均跑垒大概就是
赚了两分,影响算是非常小的。
要看细项的话,几个狡狯(X)脚快(O)的的确在跑垒积极度上
要比联盟高一点,Betts(4%),Outman(3%)等,不过差距有限,
相对不积极的是捕手 Smith(-7%),但是考量到他的守备位置,
这是可以理解的。
看到最後面的成功率你就会发现这些职业球员真的是对於各种
状况都已经产生了职业级的直觉,基本上都要 20-40 个状况
才会一次判断失误(而且也不一定是判断失误,有时候基本上
就是个五成机会),不过那个 Peralta 是不是求好心切了点...
还是说他的策略就是要用跑的来打长打帐面上比较好看....
下一篇再介绍另一个新的,既然可以算跑垒了,那麽当然可以
算臂力值。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 47.145.213.73 (美国)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Dodgers/M.1689712060.A.981.html
1F:推 zehow: 推推 因为近年躲人一直都没在签或选腿哥的啊 XD 07/19 08:47
2F:推 mangojocker: 推 07/19 09:32
3F:推 skmonkey: 推 07/19 09:47
4F:推 Nikagnef: 推 蛮有趣的XD 07/19 21:58