作者Debugger (Win Shares 痴汉)
看板MLB
标题Bill James 的重要想法(6)
时间Sat May 20 13:05:31 2006
※ [本文转录自 Sabermetrics 看板]
作者: Debugger (Win Shares 痴汉) 看板: Sabermetrics
标题: Bill James 的重要想法(6)
时间: Sat May 20 13:00:51 2006
20. 你不知道的球场效应:
球场的规格有所不同,有对打者成绩有利的球场,有中性的球场,也有偏投手的球场。
每支球队都应该尽可能的利用主场来发挥战力。不过 Bill James 发现了一个神奇的现
象:主场是打者球场的球队,倾向於拥有较差的打者与较好的投手及守备。理由何在?
球场效应使得该队的打击成绩变得好看,使得球团认为这支球队的攻击火力已经够用了
。而投手的数据则因球场缘故而不太好看,就算他们不差,球团也会想再找投手来补强
(结果找来的投手到了这个主场之後帐面成绩也变难看了)。就因为这样,这类的球队
常陷於输球与补错人的回圈之中。不过,球团还是一年又一年的找错战犯。
21. 相似分数(Similarity Scores):
Bill James 发明这玩意儿的动机很简单:找出数据最接近的球员。在大量的样本之下,
若能了解过去一共有哪些选手跟我们现在有兴趣的球员数据类似,再看看那些选手的生
涯发展趋势,便能让我们对於现在有兴趣的球员作出更准确的预测。相似分数的定义精
神是,先把两个完全一样数据的球员的分数定成 1000,然後比较他们两人的数项成绩,
每一项依照相差的幅度来扣分,最後全部看扣掉多少。扣的愈多就是愈不相似,也就是
说,最後两人的相似分数愈接近 1000 就当成是愈相似。
Bill James 说“在棒球界的薪资仲裁,可以说有九成是在看成绩最接近的一群人作比较
,这个比例绝不夸大。“因此相似分数在这方面就很有用了。
这个方法可以用来研究某些球队或球员在特定情况下的表现。比方说,如果想知道某个
投手会不会在芬威球场投得好,就可以找出历史中跟这位投手成绩最类似的,然後去研
究那些投手在芬威球场的表现。
22. 棒球里的才能不是常态分布的:
若考虑一般大众,以量化的方式来描述某项才能,则结果画在图上会像是一个钟型,也
就是常态分布。落在平均水准附近的人数最多,愈往高或低的两端移动人数就愈少。不
过当我们考虑某项才能最顶尖的那些人时,比方说大联盟球员,所有的人才都是从上面
那个锺型的最右边少数人取出来的。因此,在这些人当中,最容易找到的等级是最底端
的那级,而不是平均水准的那级。
23. 毕达哥拉斯理论:
取这个名字只是因为公式跟毕氏定理有点像。
球队的胜率大约等於 (得分数的平方)/ (得分数的平方 + 失分数的平方)。
24. 纯长打率:
就是长打率扣掉打击率。
要衡量长打能力时,看长打率的缺点是高打击率的打者会拉高长打率,但这跟长打能力
关系不大。看平均每支安打打出几个垒包的缺点是,陈文宾会排在比彭政闵前面,但这
只是因为陈文宾的打击率低很多的关系,并不是他比较会打长打。
25. 电脑不值一提:
在学习电脑的过程中,我们最主要学到的一件事是,电脑是愚不可及的东西。当你花了
一大把时间让电脑按部就班地处理许多步骤之後,一个不小心按错键,然後完蛋了,彷
佛之前花的时间完全没有痕迹一样。就好像在努力地使用吸尘器清理房子之後,按到了
某个神秘按钮,然後神奇的吸尘器把刚刚吸进去的东西全部喷出来,帮你重新又装饰了
一次房子。你一定会想“我的妈啊,笨机器啊,你应该知道我不是这个意思啊!你以前
我之前花那麽时间是好玩的吗?“然後我们才发觉到,电脑对你想做的事情一点概念都
没有,就跟吸尘器对你想清理的地方一点概念都没有一模一样。
看到了吧?机器真的没什麽值得一提的啊。我们可能心里会想,电脑会为棒球做些什麽
呢?电脑会对棒球作出什麽改变呢?什麽都不会。电脑不能为棒球做什麽,电脑也不能
对棒球作出什麽改变,就好像你的车也不会自己从高雄开到台北去。电脑能做的只是扩
展我们的能力极限。
电脑对棒球研究者造成的改变,就好像汽车对旅行家造成的改变一样。有汽车也许会让
我们到别的地方比较方便,有了电脑让我们处理资料比较方便。不过如果你本来对出外
旅行没有什麽概念的话,就算有了汽车也不会让你变成有概念;如果你本来不晓得该怎
麽研究分析棒球的话,就算用了电脑也不会让你变成自动学会。
26. 谈守备:
当 Bill James 十五岁的时候,他从广播听一场红雀队的比赛,转播员谈到了某个不是
固定先发的一垒手,说那个一垒手一场球可以用手套帮球队省下一支安打。James 想,
一个平均每场比赛可以靠守备帮球队多省下一支安打的球员,就好像是一个平均每场比
赛可以靠打击帮球队多打出一支安打的球员。James 作了点计算,发现这相当於那个一
垒手可以打出 0.430 的打击率(如果他的守备当成是平均水准的话),那他的球队一定
是疯了。一个有着平均守备而能够打出 0.430 打击率的球员,为什麽不让他场场先发呢
?
後来到了 1982 年,Ozzie Smith 拿到了国家联盟的最有价值球员,有不少人认为 Smith
能一年帮红雀队靠手套多守下一百分。James 不以为然。他说,一百分是什麽意思呢?如
果是跟完全不用游击手,只用八个守备员,那一百分蛮合理的,可是现在是再跟另外一个
大联盟游击手相比耶。1982年红雀队一共失去了 609 分,是国家联盟的球队中失分最低
的,比联盟平均的失分数低了 53 分。如果 Smith 真的能比平均水准的游击手多省下一
百分呢?那就是说,如果红雀队换成一个普通水准的游击手,那麽整队会变成比联盟平均
的失分数高了 47 分?该年真的有另外一支球队比红雀队多丢了一百分左右,而且那个球
队的游击手的守备是低於平均水准的。这不就代表红雀队的其他防守员整体表现还不如那
支多丢一百分的球队吗?(因为把 Smith 换成平均的游击手之後两队失分差不多,但是
平均的游击手还是比另一支球队的游击手好,所以红雀队的其他防守员就要比那支球队的
其他防守员差了。)在比较了游击手以外的防守员之後,这看起来是个相当有问题的结论
。James 的估计是,Smith 那年大约其实是比平均水准省下了三十五分,远低於一百分。
当谈到要如何衡量球员的攻守整体能力来选择让谁上场时,James 表示,他不相信这个问
题可以用二分法分成想要防守或是想要攻击。更精确的说,我们应该要知道的是有多少防
守和有多少攻击。一个球员不可能完全的被归在纯防守或纯攻击的任何一边,所以问题不
在於二选一,而在於两者混合之下要如何取舍。但是决定这个问题的答案难就难在防守价
值的难以评估。
传统我们会看守备率来比较野手。而较新的参考数据则有 Range Factor、Zone Rating
等等。Range Factor 是去算平均每场球(或每九局)守备能杀掉多少个人,而 Zone
Rating 则是看落在守备区域的球有多少比例会被守到。James 认为“打击是固体,投球
是液体,而守备是气体。“打击的价值很明确,定义的很清楚,很容易被评估出来。投球
要稍微看一下所处的环境,看队友的火力支援有多少,这可能会大幅影响胜败纪录;也要
看队友的守备如何,这会影响被打出去的球是出局还是安打。就好像液体虽然体积固定,
但是形状却依装盛的容器形状而不同。至於守备呢?就像气体,没有特定形状,没有特定
体积,很难看到,也很难捕捉到。
一个球员不同球季间的守备成绩变化不太会被一般人注意到,这有可能是因为对於守备数
据的不了解以及不信赖,所以宁可相信球员的能力不会有很大的变化。另外,一般人也对
失误这项数据过度反应了。如果纪录员“觉得“某个球应该会被守到,但是守备员因为种
种可能的原因犯了错误,就会被记上失误。守备数据跟打击数据差在哪里?上场打击时,
没有意外的话,就是必然会有一个打击机会(打席数),而打击成绩就是看在这些打击机
会当中的表现内容。可是当谈到守备时,就不一定有守备机会了,而有没有守备机会又是
三大要素的混合结果:击出去的球、守备员的处理、纪录员的判定。如果守备员的能力让
他完全没有机会处理到球,那他也就不可能失误了。缺乏处理到球的能力不会在守备率反
应出来,但这却是分辨优秀守备员与平庸守备员的分水岭;优秀守备员与平庸守备员的守
备机会差异,通常远远地超过了他们帐面上失误的次数差异性。那麽,我们为什麽要特别
注意一个没那麽重要的数据,却对影响力更大的视而不见呢?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 69.162.28.246
※ 编辑: Debugger 来自: 69.162.28.246 (05/20 13:05)
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 69.162.28.246
1F:推 genie2:头推 05/20 13:09
2F:→ genie2:另推守备是气体,这个形容超传神的 05/20 13:09
3F:推 Avis:这篇真不错~~推 05/20 15:33
4F:推 JackTheRippe:面白i! 05/20 18:42
5F:推 mengju:Sabermetrics在哪个群组阿 我怎麽找不到? 05/20 22:50
6F:推 Debugger:直接选看板名字吧 就不用找了 05/21 10:28
7F:推 PublicEnemy:麻烦讲一下吧 我想加我的最爱 谢谢 05/21 15:43