作者Muscovy (三分熟的闹钟)
站内CMWang
标题[讨论] 投手的比较
时间Fri Sep 29 00:43:07 2006
今年的 AL Cy Young Award 恐怕是 Santana 当之无愧,不过
第二名以後的问题就很多了。
◎第二领先群
NYY 王建民, 19W 6L, ERA 3.63, IP 218.0
DET K.Rogers, 17W 6L, ERA 3.63, IP 198.1
DET J.Verlander, 17W 9L, ERA 3.63, IP 186.0
TOR R.Halladay, 16W 5L, ERA 3.19, IP 220.0
◎第三领先群
OAK B.Zito, 16W 9L, ERA 3.89, IP 215.0
BAL E.Bedard, 15W 10L, ERA 3.67, IP 191.1
BOS C.Schilling, 15W 7L, ERA 3.97, IP 204.0
NYY M.Mussina, 14W 7L, ERA 3.57, IP 191.1
CLE C.Sabathia, 12W 11L, ERA 3.22, IP 192.2
很显然地,第二领先群一下子看不出哪个比较猛──与其说各有
各的理由,不如说各有各的信仰。第三领先群之後更是大混战。有
的胜场多,有的败场少,有的失分低,有的局数长。
所以今天来问一个问题:怎麽比较两个投手的成绩?
一样的假设:Poisson Distribution。等季赛结束我再找个地方
整理之前那些有趣的资料,到时候一起交代为什麽用这个假设。
──────────────────────────────
我们先拿 Santana 这个最没有争议的王牌做例子。
美联今年投手总共投了 19659.1 局,失 10798 分(含非责失)。
Santana 投了 233.2 局,失 79 分(一样,含非责失)。
这是一个什麽样的表现?
──────────────────────────────
套套公式之後,我们发现整季的比赛里,要投得比 Santana 好,
只有 0.000001878 的机率,大约是百万分之二不到的机率。这里稍
微解释一下百万分之二的意义,不要误解成一百万个投手里取两个,
大联盟再打一万年看看能不能凑足一百万个投手。
百万分之二的意思:在今年赛事 19659.1 局当中任取 233.2 局,
只有百万分之二不到的组合可以胜过 Santana。有兴趣的可以拿实际
资料用电脑验证看看。提醒一下,19659.1 局当中任取 233.2 局的
组合数,是一个天文数字。
所以说 Santana 的成绩处於最前面的 1.878ppm。不过我们对所谓
的「百万分之二」或者 1.878ppm 都没什麽概念,所以拿另一个来替
代……
◎如果 Santana 只投 200.0 局,他的失分应该在 65~66 之间,这样
子也会产生一个百万分之二的赛扬名投。
◎那麽其他人呢?
队伍 投手 稀有程度 预计两百局失分
1. MIN J.Santana 1.878 PPM 65 ~ 66
2. TOR R.Halladay 0.011 % 73 ~ 74
3. NYY 王建民 0.497 % 84 ~ 85
4. DET J.Verlander 0.767 % 85 ~ 86
5. CLE C.Sabathia 1.264 % 87 ~ 88
6. BOS C.Schilling 1.829 % 89 ~ 90
7. DET K.Rogers 2.232 % 89 ~ 90
8. OAK B.Zito 3.284 % 91 ~ 92
9. NYY M.Mussina 4.000 % 92 ~ 93
10. BAL E.Bedard 4.975 % 93 ~ 94
结论是:Halladay 拥有万中取一的战绩,他跟 Santana 可能是今
年美联最好的两名投手。而且领先得相当明显。
小王是千分之五,或许离巅峰还有一点点差距,不过我觉得这样的
表现已经很了不起了。
季赛十九胜。世界大赛加油!
--
新诗练习:新鲜。踩破初春里的狗大便;不经意的沧桑,满溢着嫩黄的喜悦。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 59.125.101.95
1F:推 KyoDragon:数学离我好远了.. 09/29 00:45
2F:推 LIONDODO:李列外星人有可惜到... 09/29 00:45
3F:推 donicf3:这篇的算法真有趣 推! 09/29 00:46
4F:推 kentlight:推… 09/29 00:47
5F:推 scientist:J.Santana 稀有程度 1.878 PPM XDDD 09/29 00:48
6F:推 arthuraya:PUSH 09/29 00:49
7F:推 dalireal:GOOD 09/29 00:51
8F:推 alubaggyy:比谁长的比较帅~ 09/29 00:54
9F:推 lwei781:可以转转蓝鸟版吗??? 09/29 00:54
10F:推 LIYENNEKO:原PO是学统计的吧 ><" 09/29 00:56
11F:推 Idiopathic:只有计算责失分而已? 09/29 00:56
12F:推 jakevin:稀疏程度XDDDD 09/29 00:57
13F:推 lwei781:BTW Pape 和Liri 的能算一下吗 ?? 09/29 00:58
14F:推 semaj136:看到繁杂的计算因素就头昏..不过Santana的确是万中无一的 09/29 01:00
15F:→ semaj136:武林奇才... 09/29 01:01
16F:推 hoseea:没学过统计,但我很想知道你怎麽定义r.v.成功次数?? 09/29 00:59
17F:→ Muscovy:呃, Papelpon & Liriano 的样本数有点偏低. 09/29 01:01
18F:→ Muscovy:不过算出来他们也都是 PPM 等级的. :P 09/29 01:02
19F:推 lwei781:一样算机律啊... RP 用50IP 就好.. Hoffy, MoㄝRyan 也来 09/29 01:03
20F:→ lwei781:Liri, Matt Cain 这种的用120IP 好了.. 09/29 01:04
21F:推 holymars:拿RA/IP从低到高排也会是这个顺序吧.. 09/29 01:08
22F:推 OObaga:好乐迪 QQ 09/29 01:08
23F:→ holymars:不用用到Poisson Distribution也排得出来不是吗@_@ 09/29 01:09
24F:推 realmd:二支都是稀有精英怪 09/29 01:09
25F:推 lwei781:顺序跟RA 一定是一样.. 不过用不同的measure 来看多稀有 09/29 01:09
26F:→ Muscovy:哦, 我是说误差啦... 跟 IP 没关系. :> 09/29 01:09
27F:→ lwei781:应该做不是每个人都调到一样局的 看机率 09/29 01:10
28F:推 mightymouse:能不能解读为:一个实力为联盟平均的投手靠运气达到这 09/29 01:14
29F:→ mightymouse:种成绩的机率 09/29 01:15
30F:→ Muscovy:嗯, 其实跟 R/9 排序的结果不太一样. 只有前几名一样. 09/29 01:16
31F:→ Muscovy:closer 跟 starter, 相同的 R/9, 排出来的名次会差很多.:) 09/29 01:20
32F:推 kjkent:其实没差,没人会记住谁是CY的第二名 09/29 01:22
33F:推 lwei781:SP 跟RP 当然差很多.... 09/29 01:31
34F:→ lwei781:不过对IP 差不多多的就跟RA 一样啊.. 09/29 01:32
35F:→ lwei781:BTW Hoffy, Mo, BJ Ryan 是??? 09/29 01:33
36F:推 kenyun:CY第二名大概明年会常常拿出来提 不过只有讲半季的价值 09/29 01:43
37F:推 Eric0605:用心好文推 09/29 01:52
38F:推 ahchie:推推推~ 09/29 02:14
39F:推 alssla:K.Rogers炸掉了,要修改一下了 XD 09/29 02:16
40F:推 LaneRR: 推一下 算法有点怪 但讲不出逻辑上的错误... 09/29 03:21
41F:推 DK2s:好分析推 09/29 03:46
42F:推 cuteship:厉害 09/29 04:04
43F:推 kaijajan:推一下,很有趣的算式~~ XD 09/29 05:54
44F:推 Boyzone:看阿sa骨骼惊奇 是万中选一的奇才 09/29 07:58
45F:推 realG:开张六给他 让他赢庄家一百块 09/29 08:06
46F:推 agoodjob:很认真 但这样看投手是错的 09/29 09:08
47F:推 lkw:算法有趣,但犯了逻辑上的错误,假设就已经错了 09/29 10:27
48F:推 Hall:有趣 但是其实在一局当中投手在失一分情况下丢掉一分的机率 09/29 11:31
49F:→ Hall:应该不等於在目前没失分情况下丢掉一分的机率 (投手心理因素) 09/29 11:33
50F:→ Hall:因此 Poisson的memoryless的特性似乎跟棒球场上的投手失分 09/29 11:34
51F:→ Hall:不太合 是否可以用Markov的transition Prob. 来描述? 09/29 11:35
52F:推 yero:不可能会有完全合的啦。这都只是好玩。基本上机率 != 统计 09/29 21:06