作者Debugger (Win Shares 痴汉)
看板Sabermetrics
标题怎麽看数字(8)─Sabermetrics (by nickyang)
时间Thu Mar 9 22:31:21 2006
本系列文章经作者 nickyang 同意後分享於这里 ︿( ̄︶ ̄)︿
nickyang 的 blog:
http://atlyankees.blogspot.com/
这篇应该是介绍这些入门数据一系列下来的最後一篇,比较浅显、实用的数据前面大致
上介绍过了,这一篇我想谈的是一个态度─面对这些数据的态度。
全世界最大的棒球迷学术团体The Society for American Baseball Research曾经为新
兴起、关注数据的这门领域,取了一个全新的英文单字─Sabermetric。 中文还没有适切
的翻译,我在网路上讨论时,常常看到有人用「数据派」来形容类似关注数据的人,听起
来好像有点贬意,不过这篇文章姑且用之。 所谓的数据派大概是指在论战时常常提出各
式各样数据作佐证的这群网友。因为台湾的棒球圈对这些「新数据」有概念的教练球员并
不太多,所以很多调度安排或者球评的言论,在这些数据的分析下表现得近乎愚蠢。有人
据数据攻击之,当然也有人护航,当中的争执不可细数。不过就我观察来看,多数的争议
是对於无法量化的影响因素有不同的看法,这些因素包括选手的身体状况、运气、或者所
谓的「霸气」。再者,数据派强调能够量化数字的重要性,常常会让人攻击「乾脆开电脑
算算就好了,也不用上场打球了」。而通常这些想法都是出自误解,误解又是出自对於Sa
bermetrics的不了解,我尝试提出四点数据派理当有的想法,或许可作为参考。
而在了解数据派之前,应该要了解数据派为什麽产生。「数据」一个很重要的目的,是
要去当作做「选择」的时候的一个工具。用经济学的理解,人无时无刻不在选择,有选择
就有成本,成本小的时候选择可以随便做,当成本大的时候选择就会变得谨慎,而这正是
现代数据会被重视的一个很大原因─选择的成本提高了─高薪的FA制度。试想,如果签不
签一个球员,关系到的是上百万上千万的美金,这个选择能不谨慎吗?因此要怎麽更精确
(至少比传统打击三样数字精确)的去衡量一个球员,就成了管理阶层的挑战。所以对这
些管理阶层而言,不可能说出「Bonds 跟一朗是不能比较的」这种话,因为他的任务是要
去评估一个球员值得多少美金,他必须要去想出办法来比较两个看似无法比较的球员─甚
至得去比较投手跟野手。
大概知道现代数据兴起的背景之後,或许比较容易理解以下几点︰
第一、数据派应该是最不崇尚结果论的
我们可以用过去预测未来,但棒球一如人生,也因为充满了意外而有趣。譬如当年红人
签下Ken Griffey Jr. ,当时没有人会知道他会打成这样,但是这个合约是不是蠢合约?
就数据派的角度看并不是的,数字的乐趣是在预测,不是在结果。甚至不用数据的例子,
奥运对义大利那一场九局丢上阳建福,不用多详细的资料都能知道阳建福是当时牛棚能拿
出来最好的投手,丢上阳建福没有任何问题,被干了逆转炮是结果,跟当初的决定是否正
确无关。所以说数据派「拿电脑算就好了」是完全不了解才会有的误会。
没有意外的棒球比赛是无趣的,对任何一派的球迷都一样。数据派并不介意预言失准,
只在意做出预测的时候有没有道理。CCLu有一个很传神的比喻,某一堆数字是40~80 ,另
一堆数字是70~120,现在要两人各抽一张比大,先抽的人应该选择哪一堆?选择第二堆的
人当然有可能输,但是除非作弊,不然任谁都会认为先选第一堆的是猪脑(CCLu的原文不
是这样,我改了例子,但是说明的创意是他的。)。简单说数据派并不否认「宇宙无常」
,但是他们并不会用「宇宙无常」当作自己没脑的挡箭牌,反而拿「宇宙无常」作为反对
数据派的理由才是相当可笑的。
第二、理性是数据派沟通的平台
在比较两个水准很接近的选手的时候,如果去除任何数据,包括传统的三样指标(别忘
了这三种指标也是数据,每个棒球迷或多或少都属於数据派),事实上几乎是无从讨论的
。一个日本人可以因为同乡所以认为松井秀喜比较棒,一个多明尼加人可以因为血缘所以
认为Manny Ramirez 比较强,这样的争论不会有结果。数字的工作就是提供一个普遍能够
接受的平台,不是让两个人各自「我认为」而没有交集。
当然如同之前每一篇文章强调的,数据在一个面向常常只能反映出部分的结果,打击已
经是现代数据可以非常准确预测的项目了,但是无法量化成数字的因素还有很多,更不要
提投球跟守备了。不过即使如此,这并不表示一场比赛的打击顺序得靠掷铜板决定,精确
的数据提供的是一个可信赖的范围,当然有这个范围以外的因素。譬如说所谓的抗压性,
或者是有一个王牌救援在阵给予对手的压力等等,这些因素的确或多或少会影响,我认为
好的数据头不应该傲慢的忽视这些因素。这些因素虽然难以量化,但是还是可以评估,譬
如就算陈金锋上场前一直告诉你他好紧张,因此让他坐板凳然後叫阙树木代打他通常不会
被接受。
我想要强调的是一个估计值的概念,就像是常有人提出霸气作为投手好不好的关键,但
是一个有霸气的陈义信,难道就会比温文儒雅的Mike Mussina来得有威力吗?当拿两个实
力差距很大的选手比较的时候,不可量化的因素影响力几乎是零。谢佳贤可能近况不好,
但是不论这个无法量化的因素多困扰他,诚泰队一样没人能取代他的地位。而当实力差距
有限的时候,不能否认很多惯用数据的人,依然傲慢的否决这些因素的影响,我认为完全
否决这些因素是没道理的,但是看到每天都在讨论谁有霸气谁缺霸气这种文章还是会倒胃
第三、好的数据头立场应该是很严谨的
很多时候「数据派」被污名化的确是因为充斥太多假数据派,好的数据头理当是很严谨
的,从统计的角度来说,唯有信度跟效度都在可容许范围的时候,数据派才有立论的基础
。举例来说,数据派很重视样本数的大小,王建民去年季末在3A投了三十多局的好球,在
多数的球探报告里面,即使他的成绩好得让人惊艳,也一定会加上一句保留的话语─他需
要更多局数证明他自己。没有足够的样本背书预测就容易失准,即使一个人打了一整季的
好球,或者有一整季不如预期的表现─就像这两年的松井秀喜。
另外是关於解释数据上的问题,所有的数据都是过去结果的累积平均,数据的功用不在
预测一个play的成功或失败,而应该是大量样本累积之後的结果。譬如说在XR的公式中一
次盗垒成功相当於0.36分,这并不是说黄甘霖盗上了二垒统一就拿了0.36分,而是一整季
累积下来的结果,当他持续不断的盗垒成功,整个效益平均下来一次盗垒的效益会接近这
个数字。所以拿大量统计的结果去否定每次play是否该触击或者盗垒是不妥当的,整个统
计说明的是一个趋势,过量的触击会伤害球队,但是每一次的触击不尽然如此。
第四、好的数据头不会只看电脑不看球赛
很多人想当然尔的认为信仰数据的人不看球赛,事实上通常不是这样。会去专研数据的
人多半对棒球有莫名的狂热,要这些人不看球简直是要他们的命。也因为数据头对於数据
的了解详细,所以对於数据预测不足的部分更是清楚。一个好的数据头去解释一个投手好
不好的时候往往不只是需要ERA 、WHIP这些数字,更会说明这个投手的stuff 究竟好不好
。如果仔细注意,以前常在Cobras板出没的「蛇板的大大」们,除了附带数据说明,对於
选手的观察往往也有深入的见解。
其实说他们是数据派实在是不妥当,就像之前讲的,数据只是一种预测的工具,而越是
了解现代数据的人就越是清楚现代数据的不足之处,因此也就越不可能完全依赖数据,称
这样的人做「数据派」其实是有点冤枉了。
或许应该这样说,如果将棒球的可预测性分成可量化及不可量化两部分,深受sabermet
rics 影响的人只是将可量化的那部份看得更重了。如果这些人过度忽略了不可量化那部
份的重要性,很显然他们也悖离了事实,这一直是「数据派」被攻击的地方。事实上这个
争论在美国也时有所闻,特别是在缺乏大量稳定数据的新秀评估上,传统派的勇士队比起
「数据派」的运动家队可是一点也不逊色。
不过若我们假定真的有所谓可量化及不可量化的比重,无疑台湾球界对於可量化的那部
份实在太肤浅。过去三十年美国球界的修正已经足够说明在Sabermetrics出现以前的棒球
,对於可量化的部分有错误的低估,而现在台湾球界的风气比起三十年前的美国好不到哪
去。因此即使网路上常常充斥对於数据的重要矫枉过正的言论,我依然相信提倡数据的重
要对於台湾棒球的确会有正面的影响。也是鉴於多数的资讯被引进的太过缓慢,语言的隔
阂常常也让现代棒球理论的扩散不容易,所以我狂妄的想要将一些入门的资料做统整性的
介绍。
感谢CobrasTalk的板友不吝辛苦帮我除错,这八篇文章如果有任何错误,请各位去找那
些答应帮我检查的CT板人算帐XD
--
Win Shares (暂译胜场贡献指数) 是由棒球统计魔人 Bill James (现任红袜队 Senior
Advisor, Baseball Operations) 所提出用来衡量棒球选手攻守整体价值的一套系统, 我
将原公式作了些许的调整与取舍, 以用来计算中华职棒史的球员排名. 相关文章放在 ptt
BBS 站 CPBL板以及台湾棒球资讯网专栏区
http://twbaseball.info/column_alist.php?editer_no=21
欢迎来信指教 ^^
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 69.162.28.246