作者uranusjr (←这人是超级笨蛋)
看板Sabermetrics
标题Is There Such a Thing as a Quadruple-A Player?
时间Sun Oct 1 20:58:15 2006
这篇内容比较难...很多地方我都没有把握
所以请大家帮忙抓出怪怪的地方了...感激不尽 >____<|||
=====
本系列文章除合乎法律之引用 (附上所有作者与出处) 之外, 严禁任何形式的
转录与引申. 违反者将保留任何法律追诉权.
=====
Baseball Between the Numbers 七章二节
四 A 球员存在吗?
Clay Davenport
1996 年,金莺系统内一位名叫 Mike Berry 的球员在小联盟完成了出色的球季。
他的打击率是 .361,有 44 支二垒安打、99 个保送、得到 109 分,打回 113
分打点。你听过 Mike Berry 吗?大概没有吧。由於他从来无法站稳大联盟,怀
疑论者称他为四 A 球员 - 小联盟打击优异,但在大联盟不行的人。问题在於:
这种人存在吗?
的确如此。不论何时,当你与人打交道,总是会有些无法适应变化的人,而在这
个案例上,便是从小联盟到大联盟的变化。
虽然如此,大部分被贴上四 A 标签的球员们并不具备那种价值。多数是根本不该
被期望在大联盟有好表现的球员。有些只因为他们在同样等级打了许多年,与那
些年轻五岁,甚至十岁的年轻新秀竞争,而打出好成绩。一些则在有利进攻的环
境中打出令人印象深刻的成绩 - 比起有利投手的默特尔比奇,在科罗拉多泉稀
薄空气中敲出的三十发全垒打可要逊色许多。其他则本来就没有打的很好 - 三
成打率在没有充足保送数和长打支撑的状况下毫无意义。更重要的课题是这个:
你不能直接用看大联盟数据的方法来看小联盟数据 - 至少在考虑完外在状况前
不行。
在 1980 年代的《棒球摘要》系列书中,数据派先锋 Bill James 曾经攻击过「小
联盟数据没有意义,且球员在小联盟的打击模式与大联盟成绩毫无关联」的盛行
看法。他成功展示人们认为小联盟成绩没有意义,是因为他们没有考虑外在状况。
人们尝试解读小联盟数据的方法,是和大联盟数据完全相同的方式。
James 建立了一个他称作大联盟等值数,或称 MLEs(Major League Equivalen-
cies)的东西。藉由一系列的步骤,任何人都能将一组小联盟数据转换成等值的
大联盟成绩。MLEs 考量小联盟环境中平均每场比赛的得分,以及等值大联盟环境
中的平均差距。James 用选手的母球团作为指引:红袜农场成员会得到依芬威球
场调整的 MLEs,道奇农场则以道奇球场来调整,依此类推。换句话说,他将原始
的数据依上下关联差别来修改。James 将每个数据分开修改:他用一个系数来调
整一垒安打,二垒安打则用另一个,三垒安打又一个,依此类推。
几年後,我从事了一个关於 Ty Cobb 在现代比赛中会表现如何的计画 - 他在现
代竞赛中能不能有像他宰制他二十世纪早期的同业那样的表现。若我们以今日的
角度看 Cobb,我们会看到一位打击率很高,长打力不强而盗垒能力出色,完全适
合开路先锋的球员。然而在以死球世代的状况调整後,我们会发现 Cobb 也是他
那年代最好的长打者之一。那是因为当时的长打水平如此之低 - 感谢那些只比
过熟葡萄柚弹性好不到哪里的用球 - 你必须非常仔细地,用正确的调整观察才
能发觉。
为了进一步精制 James 的作品,我采用了一种依联盟与球场调整而评估球员进攻
价值总和,称作等值率(Equivalent Average)的系统。EqA 的最终成绩看起来
很像打击率,也让结果很容易被理解作好、坏、或两者之间。在 1907 年 Honus
Wagner 打出了 .341 的 EqA。我们都知道他进攻的模式:他的价值中有百分之四
十来自一垒安打(1907 年平均水准的球员会有百分之五十三)、百分之十九来自
二垒安打(平均是百分之十二)、百分之九是三垒安打(百分之七)、百分之五
全垒打(百分之二)、百分之十三保送(百分之十九)、而百分之十五来自盗垒
(百分之七)。我接着用一系列的比率来把每个数据互相比较,以获得 Wagner
相对於联盟表现多好的评估。为了将 Wagner 的数据由 1907 年转换到 1987 年,
我以 .341 的 EqA 开始。产生 EqA 的等式可以倒推到一定的部份,让我能判断
要多少以一垒安打、长打、保送、以及盗垒所产生的总垒数才能在 1987 年拿到
.341 EqA。1907 年要 371 个垒数才能有 .341 EqA;1987 年则需要 520 个。
这部份还满容易。困难的部份在於把 1907 年 Wagner 的比率配合成 1987 年的
成绩,相当於把 1907 年福特 T 型装到 1987 野马车框里面的任务。要让所有比
率互相吻合,而最後还能得到正确的总值,这在数学上是根本不可能的事情。我
写的程式从联盟平均线开始,一次改变一个因子,例如加上一支一垒安打,接着
重新计算所有的比率。程式不断继续这个程序,直到再也无法做出任何改进。我
把最後的结果称作变换,後来被称作戴文波特变换,或者 DTs(Davenport Tran-
slations)。
过不多久我便了解,这个本来用於不同年代与环境的程序也可以在不同联盟之间
良好地发挥 - 要做的只是建立基准以转换目标 EqA。若一位球员在二 A 东方联
盟打出 .341 EqA,我们可以用处理 Honus Wagner 的同样方法跑一遍变换,只是
要改成依球员一般由二 A 升至三 A 与三 A 至大联盟数字下降的趋势,来将 EqA
向下修。在这个例子里,结果会在 .275 左右。
今日的 DT 系统基本上还是和 19 年前建立时一样,只有一些内部细节因时间有
改变。这些改变考虑了其他变数,例如球员打出目标 EqA 时的年龄。DTs 与 MLEs
之间一个很大的不同在於把所有小联盟球员放在相同尺度上,而非依他们母球团
的主场以个别的尺度个别变换。
优秀,差劲,以及两者之间
小联盟里的球员基本上有三种:明显够格上大联盟的人,明显不够格上大联盟的
人,以及一大群介於两者之间,可能够也可能不够好的人。不论用以衡量球员的
工具是数据还是球探,都不够完美,而升上大联盟所谓「够格」的定义也一样。
定义大联盟与小联盟差距的能力等级并非一条直线,而是团模糊的云,一块分离
明显位於两侧之球员的迷雾。球员本身并非表现水准永远相同的机器,而会有重
叠於云雾上的不同范围成果。
位於云雾中的球员或多或少都可被互相替换,而这些人的数量远超过大联盟的工
作机会。这就是那些除了他们能力之外,还会根据一堆其他状况而在大小联盟间
浮沈的球员们。是否有人受伤,谁状况很好 - 最细的变化可能造成所有不同。
图 7-2.1 可以让你对极多球员竞争 MLB 稀少工作机会,上大联盟机会的界线狭
窄的程度有个概念。
图 7-2.1 有机会升上大联盟球员的界线
http://www.tbns.net/uranusjr/figure7-2_1.png
http://www.wretch.cc/album/show.php?i=uranusjr&b=2&f=1461611967&p=0
(两个连结的内容是一样的)
球员在小联盟能打得好,但在大联盟不行,这种评断很少会是正确的。球员给人
这种感觉的原因通常有三种。然而,若你知道要看的关键因素,你的洞察力大概
会改观。第一因素是选样偏差的一种形式:幸运的球员。
所有职业球团把球员在等级间升降的系统,都有个普遍性问题。球员并非机器。
他们拥有基本技巧与能力的等级 - 有时他们的表现会比能力等级高(所谓「高
潮期」),有时候比较低(所谓「低潮期」)。然而,虽然大联盟球团总经理们
强烈声称他们不会在意数据,他们还是会看数字。当有意外发生,需要从三 A 拉
个人上来时,GM 有极大的可能会挑现在打击率 .330 而非 .230 的球员,即使他
们的生涯成绩同样是 .280。当时表现超水准的球员,比起正低於自身水平,或挣
扎中的人,升上去的机会要大上非常多。
这个决定的影响是,当球员高潮期结束而回到自身水平时,他会变得不能处理大
联盟等级。这个案例中这是事实;球队在认为他拥有大联盟才干的想法上错了。
他还没「准备好」,因为他本来就还不够好。
多数人并未对数据的变异性有很好的概念,即使面对的是机器。我们做了个实验,
制造一百个球员,分别给他们五百个打数。我们用电脑将这一百个人打出安打的
机会都定为百分之 27,让他们理论上都会有 .270 的打击率。接着我们让电脑随
机产生介於 0 到 1000 的数字;如果产生的随机数字小於或等於 270,我们就叫
它安打;反之就是出局。我们让程式跑一千个理论球季。
在这一千年中,每年都至少有一位球员打出至少 .302 的打击率。半数的状况里,
这个联盟都有至少一个人成绩在 .320。在最极端的状况里,有个球员打了 .362。
即使每位球员的「真实」能力都是 .270,总是会有人打出至少超过能力 .032 的
成绩,而通常有人至少超过 .050。
如果你把打数减少,范围就更广了。在 100 个打数的状况下,有一半机会这一百
个 .270 能力的球员中,会有人纯靠运气就打出 .390 的成绩。在 200 个打数後,
会有一半机会有人至少 .350。
想想看:在两百个打数 - 全职小联盟球员五月底大约会有的打数 - 之後,每
一百位小联盟球员就会有一人会打出超过他真正能力 .080 的成绩。二 A 与三 A
大约总共有 400 位经常出赛的球员,也就是说,你在六月初会有大约四位球员看
起来似乎有了大幅进步,但其实只是运气好而已。
如果球员在大联盟能有那种运气,我们称之为侥幸(fluke)球季。当然,许多侥
幸球季被归类为更罪恶的东西,像是 Brady Anderson 使用类固醇的 1996 球季,
或者 Norm Cash 使用软木填充棒的 1961 年。大联盟历史上有不少侥幸球季,而
且没有理由假设这在小联盟不会同样普遍。Mike Berry 在 1996 年的超级球季可
能就是其中之一。他在小联盟待了八年,打出 .295 的打击率(没有任何球季超
过 .314)、.385 上垒率、以及 .458 的长打率。然而他在 1996 年打出一个惊
人的球季成绩,.361/.473/.562。
现在,考虑到现实球员要比虚拟球员面对更多样的状况,你得到的状况会更混乱。
球员要与伤病奋战。他们一天晚上面对好投手,隔夜可能面对坏投手。他们会因
在无人出局二垒有人时出局而失望,可能在夜间比赛隔天於下午出赛,必须面对
不好的球场、不佳的光线或差劲的主审。所有这些成份都可能影响他们任何时候
打击的好坏。将这些可能性与随机爆发的运气结合,而很多不如表面上优秀的球
员就这样被升上了大联盟。
逻辑家 Alfred Korzybski 曾经说过一句话,地图不代表疆域。我们在这里也可
以说句相似的话,数据不代表球员。一位球员带上球场的技巧与特质是确定的,
包括他能跑多快、能把球打多远、挥棒是水平还是上击(uppercut)、多常挥棒
落空、辨认曲球或滑球的能力如何、以及他了解每位特定投手习性与下一球球种
的能力。这些是他独有的技巧。
而这些技巧如何转换成数据,就很多取决於球员本身之外了。很明显,你面对的
对手会对你的数据产生巨大影响。在业余选秀中,一位高中球员的打击率有五成、
六成甚至七成的离谱数字都不足为奇,因为他们完全超越身处的竞赛环境。同样
地,选秀中也有 ERA 低於 0.50 的投手(2005 年,小熊选进一名在高中投了 63
局而自责分零的投手)。这些投打几乎都从未在高中互相面对。但一旦他们进入
职业而能互相对到,他们的表现就会瞬间回到地球水准。
环境的运气
这就带出第二个选手看起来比实际上出色的第二个原因,完全不同的一种运气。
具体地说,小联盟球员本质上无法控制他们在哪里出赛,而之中有些够幸运的人
便在非常有利打击的环境中打球。棒球场的规格非常不具标准,而之间的差别能
对球赛的进行产生剧烈影响。大多数人首先想到的 - 外野围墙的距离 - 仅是
决定球场多有利打击的其中一个因素。例如,球场的界外区有多大呢?界外宽广
代表更多小飞球会被接杀,而非掉进看台。球场中风势有多大?灯光品质多好?
打者的背景又是如何?湿度多少?对了还有,海拔是多少?
大联盟在 1993 年扩编时把一支新球队放在丹佛,而使大家注意到稀薄空气中比
赛产生的巨大不同。不只是球在高处会飞得更远;稀薄空气在很多方面,都会影
响球与空气的交互作用。一般的球被用力以砍击方式打中时,会产生很多後旋。
在海平面处,後旋产生一股小小的升力,让球在空中会停留更久,几乎可说在空
气中将球托着等外野手。在丹佛,这股升力不会产生,最终造成球不只飞得更远
(因为阻力减少)还会更快落地(因为升力减少)。产生升力的反应,也是曲球
转弯的原因。因此曲球在库尔斯球场不会掉得那麽多,而会悬在那儿,等着被生
吞活剥。同样的力也使球产生侧旋,因此球被打到边线时不会弯得那麽厉害而留
在界内,使原本线旁的界外球变成二垒安打。(更多有关球场效应的资讯见八章
二节。)
大联盟的球场形式各异,小联盟的球场差距则更大。大联盟有三十座不同球场;
小联盟大约有两百座。库尔斯是唯一海拔高度显着的大联盟球场;在小联盟,整
个先锋联盟,以及半个名不符实的太平洋海岸联盟,都符合这个条件。棒球联盟
在许多方面可以说是球场的总和。若所有的球场都很小,或者海拔高度高,你便
得到利於进攻的先锋联盟和加州联盟,後者因西部乾燥的气候更胜一筹。整个美
国东部则更潮湿,也更接近海平面,因此常产生投手联盟,例如佛州联盟。
当你退一步思考时这似乎很明显,但大多数的人并没有退一步思考。人们一般谈
论球员成绩时并不考虑状况,因为他们对之并不了解。多数资料不会提到全联盟
的成绩,而即使如此,也没有提到球场的比例。进攻低下联盟中的投手球场与进
攻强大的打者球场相较,一场比赛的得分差距很容易大於两分。整个球季下来,
这个差距就很巨大了。在每场攻下四分的环境中打回 80 分的球员,相当於在六
分环境中打回 120 分的球员。这个等於打击率 .275 与 .325 的差距。
何谓「正常」?
麻烦的是,我们并不以相对的角度思考。我们自身对所谓「正常」有一套建立的
思维,而那不见得是由今日的棒球推得。生长在六零年代的人会认为一年投球局
数超过三百,且有低於三的 ERA 很「正常」;九零年代的孩子看过三位不同的球
员同时打超过六十支,所以不会对单季四十支垒打印象深刻。我们看到一个数字,
例如 .323 的打击率,然後我们马上想:「不错嘛。」即使其实我们对该联盟以
及该球场中,一般球员会有怎样的打击表现毫无概念。棒球是相对的;不论你得
到的分数多或少,只要比另一队多就没有差别。
在小联盟里,「正常」的范围要比大联盟广上许多。当 Mike Berry 打出他的出
色球季时,他身处的联盟(加州联盟)每场得分是 5.85,而主场(高沙漠区)则
对得分有百分之三十的加成。他基本上是在一个每场七分的环境下打球。当你用
大联盟每场约 4.5 分的标准来调整他 .361 打击率、109 分、113 RBI 的成绩,
则我们看到的会只有 70 分、73 RBI 与 .303 打击率(值得一提的是,这与他平
常在小联盟的单季成绩极为相似)。许多在小联盟似乎打得非常好的球员,只是因
为够幸运,而在能使他们数字变漂亮的球场里打球而已。
不过除了选样偏差和进攻环境的强度之外,还有其他因素会使小联盟球员打出过
份好的成绩。另有一个在衡量小联盟球员上与数据同样重要的原因:年龄。
棒球并非完全靠运动力的运动,而是运动能力与经验的结合。因此,棒球员的巅
峰并不像短跑、游泳那类「纯」体能的竞技一样落在二十出头的年纪,而是在二
十五六到接近三十岁左右。在这个阶段,球员能够学到比赛的内涵而进步,而又
不会因为年龄渐长而有体能上的衰退。
通常我们谈论小联盟球员时,会特别注意年轻球员。我们可以期待二十一岁就打
三 A 的球员还有六到八年能进步,所以明显比另一位有同样技巧但已经二十五岁
的球员有更多潜力。後者只剩下二到四年的时间可以成长,因此若进步的程度正
常则不太可能跟得上年轻球员。然而,较年长球员还有其他因素会影响数据。
一名比联盟平均年纪要大的球员拥有一定的优势。这个现象的原因仍然不明,有
可能是经验的优势,例如更能配合面对的球路,或也可能是情绪上的成熟度,让
他能在球季中有更稳定的表现。不过无论如何,这在球员升上大联盟,而需面对
与他年龄相仿的球员时似乎会完全消失。
如果你比较两位 .300 的打者,一位年龄与联盟平均相同,另一位较年长,则可
以像下面那样区分:
年轻球员:技巧 .300,经验 0
年长球员:技巧 .270,经验 .030
当他们都被升上去时,两个人的经验都会降到 0,而年轻球员最後的成绩就会超
过年长球员。在大联盟,技巧要比经验更能转换为成绩。
记得 Mike Berry 吗?他在 1996 年八月度过二十六岁生日,而即将结束自己在
高阶一 A 加州联盟的绝佳球季。加州联盟的平均年龄大约是二十二岁半。Berry
从未站上大联盟。同联盟中许多比他年轻的选手,即使成绩较他逊色,最後都被
升上去了。
2005 年小联盟打击排行榜,以 EqA 为准(至少在小联盟 200 打席)
==============================================================================
外在环境
排名 姓名 年龄 EqA 母球团 (1000 = 每比赛五分)
------------------------------------------------------------------------------
1 Ryan Howard 25 .346 费城人 975
2 Chris Snelling 23 .328 马林鱼 980
3 Marcus Thames 28 .320 老虎 927
4 Jeremy Hermida 21 .316 马林鱼 909
5 Todd Linden 25 .310 巨人 989
6 Rickie Weeks 22 .308 酿酒人 1011
7 Chris Shelton 25 .303 老虎 927
8 Ross Gload 29 .302 白袜 1015
9 Brad Eldred 24 .301 海盗 951
10 Justin Huber 22 .300 皇家 1012
11 Carlos Pena 27 .296 老虎 927
12 Matt Murton 23 .296 小熊 933
13 Marshall McDougall 26 .294 游骑兵 1102
14 Conor Jackson 23 .293 响尾蛇 1178
15 Adrian Gonzalez 23 .291 游骑兵 1102
16 Edwin Encarnacion 22 .291 红人 948
17 Brandon Jones 21 .290 勇士 903
18 Jeff Keppinger 25 .289 大都会 903
19 Matt Diaz 27 .288 皇家 1070
20 Russell Martin 22 .288 道奇 861
21 Shane Victorino 24 .288 费城人 975
22 Chris Denorfia 24 .287 红人 969
23 Curtis Granderson 24 .287 老虎 927
24 B. J. Upton 20 .286 魔鬼鱼 965
25 Chip Ambres 25 .286 皇家 1022
26 Ronny Cedeno 22 .286 小熊 1137
27 Ben Johnson 24 .285 教士 1022
28 Josh Willingham 26 .285 马林鱼 1189
29 Brandon Sing 24 .284 小熊 911
30 Chris Young 21 .284 白袜 927
31 Dan Johnson 25 .284 运动家 1030
32 Corey Hart 23 .283 酿酒人 1011
33 Howie Kendrik 21 .283 天使 1094
34 Justin Ruggiano 23 .283 道奇 947
35 Matt Watson 26 .283 运动家 1030
36 Prince Fielder 21 .283 酿酒人 1011
37 Rick Short 32 .283 国民 1008
38 Andy Phillips 28 .282 洋基 961
39 Jarrod Saltalamacchia 20 .282 勇士 959
40 Andy Marte 21 .281 勇士 1012
41 Chase Lambin 25 .281 大都会 952
42 Hunter Pence 22 .281 太空人 970
43 Kevin Kouzmanoff 23 .281 印地安人 980
44 Kevin Orie 32 .281 国民 1008
45 Ryan Mulhern 24 .281 印地安人 944
46 Jason Bartlett 25 .280 双城 1007
47 Mike Jacobs 24 .280 大都会 1008
48 Wes Bankston 21 .280 魔鬼鱼 960
49 Andy LaRoche 21 .278 道奇 934
50 Daric Barton 19 .278 运动家 1056
51 Ryan Zimmerman 20 .278 国民 951
52 Delmon Young 19 .277 魔鬼鱼 931
53 Eddy Martinez-Esteve 21 .277 巨人 1044
54 Ryan Shealy 25 .277 洛矶 1057
55 Joe Dillon 29 .276 马林鱼 1201
56 Ronny Paulino 24 .276 海盗 946
57 Brian Daubach 33 .275 大都会 903
58 Felix Pie 20 .275 小熊 911
59 Nick Markakis 21 .275 金莺 954
60 Rashad Eldridge 23 .275 游骑兵 1085
61 Ruan Spilborghs 25 .275 洛矶 1036
------------------------------------------------------------------------------
--
Les grandes et les meilleurs
tone from "Zadok the Priest"
Eine grosse stattliche Veranstaltung
by F. Handel
THE MAIN EVENT! These are the men
Sie sind die Besten
"Champions League" by Tony Britten THESE ARE THE CHAMPIONS!
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.229.174.30
1F:推 deanlin:先推.. 10/01 23:20