作者Epsilon (我是EPS)
看板Sabermetrics
标题[问题] 如何检验PECOTA?
时间Sat Apr 1 09:13:49 2006
对於PECOTA我一直有个疑问, 那就是, 这个系统的正确性是否有经过
验证?
如果我的了解没错, PECOTA的基本精神是, 依球员各项数据随年龄变
化的走势, 找出历史上与之最相近的球员, 再从这些相似球员的走势,
来预测此球员在未来数年的表现. 当然, 此一预测是有误差区间的,
PECOTA给的预测除了mean, median以外, 也给出一个机率分布.
对於这样的一个系统, 是否需要验证其正确性? 首先, PECOTA有提供
球员相似度指数, 指数低於20者, 表示历史上找不太到与此球员相似
的球员以供比对, 譬如一朗的相似度是19, King Felix与老克的相似
度只有1, 臂力胖子的相似度甚至是0. 对於这些球员, PECOTA已经承
认它的架构无法正确处理, 所以我们不就这种球员找PECOTA的麻烦.
但在相似度40以上的球员呢? 这些球员有足够的历史上的球员来比对,
PECOTA是否就能提供正确的预测? 如果我们相信, 棒球的型态一直以
来没有太大的改变, 所以球员随年龄发展的模式也都一样, 那这个架
构或许可自圆其说, 而不需要外在的检视.
问题就在, 棒球的型式并非不变的, 20年前大家重视的是打击率, 而现
在有一半以上的球队在球员育成时更重视上垒率. 以前的球员年过35就
开始大走下坡, 现在的球员因医疗训练的发达, 以及程度不明的禁药影
响, 40一条龙并不罕见. 更有甚者, 就算我们相信棒球的面貌数十年间
并没改变, PECOTA是否真的挑中了关键数据? 举个离谱的例子, 要是某
系统用BABIP来预测投手能力, 这应该会被很多人笑吧, 因为BABIP并不
是一个反映投手能力的好指标.
所以, PECOTA还是需要被检验的, 一是检验历史是否真的可以用来预
测未来, 二是检验PECOTA是否用对了关键数据.
有人做过这样的检验吗? PECOTA系统内建了检验机制吗?
--
用星光作画的男孩 他的夜晚比白天灿烂
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 128.171.160.7