作者Debugger (Win Shares 狂魔)
看板CPBL
标题Win Shares 之台湾大联盟篇
时间Tue Jun 29 08:59:39 2004
要将中华职棒与台湾大联盟的 Win Shares 合在一起来帮选手排名, 主要有两个问题, 一是两联盟的水准差距, 二是台湾大联盟每年比赛场数相差甚多.
先来看第二个问题, 因为即使不合并排名, 光是用 Win Shares 来看台湾大联盟的选手排名, 这个问题也仍旧存在. TML 历年各队比赛场数依序为 96, 108, 84, 84, 60, 72. 如果不作调整, 那麽很明显地, 在前两年出赛的球员很容易就拿到较多的 Win Shares, 只因为出赛场数比较多, 而 Win Shares 总数等於联盟总比赛场数的三倍. 也就是说, 如果有两个球员表现差不多, 但球员A在前四年出赛, 球员B在後四年出赛, 那麽球员A的Win Shares就会远多於球员B, 这是非常不合理的.
为了解决这个问题, 最简单的方法就是把历年每个人的 Win Shares 数乘以 84/该年比赛场数, 让每年的总 Win Shares 数一样. 这里我选择 84 是因为这六年平均起来, 正好每年打了 84 场. 不过这样做又会产生另一个问题, 那就是在替选手排名的时候, 有一项指数是年平均, 这个年平均是用出赛场数算出来的. 两个 Win Shares 总数相同的野手, 出赛数较多的那个年平均就比较低. 若以之前的方法来调整, 则之前提到的选手A, B两人经调整後虽然 Win Shares 总数会差不多, 但是选手A出赛场数多很多(假设两人都是固定先发), 所以在算年平均的时候就吃亏了.
这样看来, 用原始 Win Shares 算会对A不利, 而调整过後却对B不利了. 经验告诉我, Win Shares 数影响排名的程度, 比出赛场数影响的程度要大上一截. 所以我采取了一个折衷的办法: 历年场数不用84来调整, 而是用 84*0.75+原始场数*0.25. 换句话说, 就是以 84 为原点, 然後场数比 84 每多四场就加一, 每少四场就减一.
原始场数是 96, 108, 84, 84, 60, 72, 分别比 84 多了 12, 24, 0, 0, -24, -12 场, 所以在调整历年 Win Shares 时, 使用的场数就是 87, 90, 84, 84, 78, 81. 比如说黄钦智2002年的 Win Shares 是 15.99, 那麽在排名时就用 15.95*81/72 来代替, 四舍五入後, 该年黄钦智 WS=18, 但是在排名时用的出赛场数仍然是原始场数.
这样就解决了场数的问题. 接下来回到第一个问题, 如何适当地合并两联盟的Win Shares,
以作出合理的排名. 台湾大联盟水准比中华职棒要低上一些, 所以直接合并 Win Shares
不甚合理. 事实上, 前一个步骤中已经把 TML 的水准视为较低一些了, 因为中职每一年出
赛场数都在90场以上, 所以若有两个球员分别在两联盟中成绩数据类似, 则在中职出赛的
那个球员 Win Shares 应该会略高一些. 不过我认为这还不够表现出两联盟的差距. 我的
看法是, 在台湾大联盟有机会争夺MVP的球员, 到了中职会变成 all-star级, 原来是 all-
star 级的到了中职会是普通的固定先发, 普通的固定先发会变成替补球员或是不怎麽样的先发, 而替补球员或是不怎麽样的先发到了中职应该会找不到工作. 利用这个原则, 再观察一些球员换联盟之後的成绩变化之後, 我决定将台湾大联盟历年调整过後的 Win Shares 再减掉四, 然後跟原来中职的排名合并一起看.
--
Win Shares (暂译为胜利贡献指数) 是由专门研究棒球统计分析的 Bill James 所提
出用来衡量棒球选手整体价值的一套系统, 用来估算选手的攻守整体价值以及历史排
名. 我将原公式作了些许的调整与取舍, 以用来计算中华职棒史的球员排名.
相关文章放在
http://winshares.blogspot.com 以及 ptt BBS 站 CPBL板
欢迎来信指教 ^^
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 69.162.3.5
※ 编辑: Debugger 来自: 69.162.3.5 (06/29 09:08)