作者tradewind (No Day but Today)
看板Sabermetrics
标题Re: [问题] 如何检验PECOTA?
时间Sat Apr 1 09:58:09 2006
※ 引述《Epsilon (我是EPS)》之铭言:
: 对於PECOTA我一直有个疑问, 那就是, 这个系统的正确性是否有经过
: 验证?
: 如果我的了解没错, PECOTA的基本精神是, 依球员各项数据随年龄变
: 化的走势, 找出历史上与之最相近的球员, 再从这些相似球员的走势,
: 来预测此球员在未来数年的表现. 当然, 此一预测是有误差区间的,
: PECOTA给的预测除了mean, median以外, 也给出一个机率分布.
: 对於这样的一个系统, 是否需要验证其正确性? 首先, PECOTA有提供
: 球员相似度指数, 指数低於20者, 表示历史上找不太到与此球员相似
: 的球员以供比对, 譬如一朗的相似度是19, King Felix与老克的相似
: 度只有1, 臂力胖子的相似度甚至是0. 对於这些球员, PECOTA已经承
: 认它的架构无法正确处理, 所以我们不就这种球员找PECOTA的麻烦.
: 但在相似度40以上的球员呢? 这些球员有足够的历史上的球员来比对,
: PECOTA是否就能提供正确的预测? 如果我们相信, 棒球的型态一直以
: 来没有太大的改变, 所以球员随年龄发展的模式也都一样, 那这个架
: 构或许可自圆其说, 而不需要外在的检视.
: 问题就在, 棒球的型式并非不变的, 20年前大家重视的是打击率, 而现
: 在有一半以上的球队在球员育成时更重视上垒率. 以前的球员年过35就
: 开始大走下坡, 现在的球员因医疗训练的发达, 以及程度不明的禁药影
: 响, 40一条龙并不罕见.
所以?20年前看重打击率并不表示当时就没有选球很好的球员,
只是以前没有得到应有的评价罢了。
况且如果20年前的球员真的和现在的球员不同,
那PECOTA在做比较时,当然就不会说这两批球员是近似的。
同样的,如果球员的career path真的随年代不同而改变,
那PECOTA也不会说这些球员是近似的。
PECOTA的预测可以被挑战,但我不认为是肇因於你所举的这两类情形。
: 更有甚者, 就算我们相信棒球的面貌数十年间并没改变, PECOTA是否真
: 的挑中了关键数据? 举个离谱的例子, 要是某系统用BABIP来预测投手能力,
: 这应该会被很多人笑吧, 因为BABIP并不是一个反映投手能力的好指标.
这些是 PECOTA 比较的项目:
http://baseballprospectus.com/glossary/index.php?mode=viewstat&stat=38
: 所以, PECOTA还是需要被检验的, 一是检验历史是否真的可以用来预
: 测未来, 二是检验PECOTA是否用对了关键数据.
: 有人做过这样的检验吗? PECOTA系统内建了检验机制吗?
就我看 BPro 的文章,PECOTA 是每年都有变得更聪明的,
可以注意到更多的细节。至於这是设计者所做的改变,
或是系统多了一年资料後发生的改变,我就不知道了。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 203.67.105.23