作者Muscovy (三分熟的鬧鐘)
站內CMWang
標題[討論] 投手的比較
時間Fri Sep 29 00:43:07 2006
今年的 AL Cy Young Award 恐怕是 Santana 當之無愧,不過
第二名以後的問題就很多了。
◎第二領先群
NYY 王建民, 19W 6L, ERA 3.63, IP 218.0
DET K.Rogers, 17W 6L, ERA 3.63, IP 198.1
DET J.Verlander, 17W 9L, ERA 3.63, IP 186.0
TOR R.Halladay, 16W 5L, ERA 3.19, IP 220.0
◎第三領先群
OAK B.Zito, 16W 9L, ERA 3.89, IP 215.0
BAL E.Bedard, 15W 10L, ERA 3.67, IP 191.1
BOS C.Schilling, 15W 7L, ERA 3.97, IP 204.0
NYY M.Mussina, 14W 7L, ERA 3.57, IP 191.1
CLE C.Sabathia, 12W 11L, ERA 3.22, IP 192.2
很顯然地,第二領先群一下子看不出哪個比較猛──與其說各有
各的理由,不如說各有各的信仰。第三領先群之後更是大混戰。有
的勝場多,有的敗場少,有的失分低,有的局數長。
所以今天來問一個問題:怎麼比較兩個投手的成績?
一樣的假設:Poisson Distribution。等季賽結束我再找個地方
整理之前那些有趣的資料,到時候一起交代為什麼用這個假設。
──────────────────────────────
我們先拿 Santana 這個最沒有爭議的王牌做例子。
美聯今年投手總共投了 19659.1 局,失 10798 分(含非責失)。
Santana 投了 233.2 局,失 79 分(一樣,含非責失)。
這是一個什麼樣的表現?
──────────────────────────────
套套公式之後,我們發現整季的比賽裡,要投得比 Santana 好,
只有 0.000001878 的機率,大約是百萬分之二不到的機率。這裡稍
微解釋一下百萬分之二的意義,不要誤解成一百萬個投手裡取兩個,
大聯盟再打一萬年看看能不能湊足一百萬個投手。
百萬分之二的意思:在今年賽事 19659.1 局當中任取 233.2 局,
只有百萬分之二不到的組合可以勝過 Santana。有興趣的可以拿實際
資料用電腦驗證看看。提醒一下,19659.1 局當中任取 233.2 局的
組合數,是一個天文數字。
所以說 Santana 的成績處於最前面的 1.878ppm。不過我們對所謂
的「百萬分之二」或者 1.878ppm 都沒什麼概念,所以拿另一個來替
代……
◎如果 Santana 只投 200.0 局,他的失分應該在 65~66 之間,這樣
子也會產生一個百萬分之二的賽揚名投。
◎那麼其他人呢?
隊伍 投手 稀有程度 預計兩百局失分
1. MIN J.Santana 1.878 PPM 65 ~ 66
2. TOR R.Halladay 0.011 % 73 ~ 74
3. NYY 王建民 0.497 % 84 ~ 85
4. DET J.Verlander 0.767 % 85 ~ 86
5. CLE C.Sabathia 1.264 % 87 ~ 88
6. BOS C.Schilling 1.829 % 89 ~ 90
7. DET K.Rogers 2.232 % 89 ~ 90
8. OAK B.Zito 3.284 % 91 ~ 92
9. NYY M.Mussina 4.000 % 92 ~ 93
10. BAL E.Bedard 4.975 % 93 ~ 94
結論是:Halladay 擁有萬中取一的戰績,他跟 Santana 可能是今
年美聯最好的兩名投手。而且領先得相當明顯。
小王是千分之五,或許離巔峰還有一點點差距,不過我覺得這樣的
表現已經很了不起了。
季賽十九勝。世界大賽加油!
--
新詩練習:新鮮。踩破初春裡的狗大便;不經意的滄桑,滿溢著嫩黃的喜悅。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 59.125.101.95
1F:推 KyoDragon:數學離我好遠了.. 09/29 00:45
2F:推 LIONDODO:李列外星人有可惜到... 09/29 00:45
3F:推 donicf3:這篇的算法真有趣 推! 09/29 00:46
4F:推 kentlight:推… 09/29 00:47
5F:推 scientist:J.Santana 稀有程度 1.878 PPM XDDD 09/29 00:48
6F:推 arthuraya:PUSH 09/29 00:49
7F:推 dalireal:GOOD 09/29 00:51
8F:推 alubaggyy:比誰長的比較帥~ 09/29 00:54
9F:推 lwei781:可以轉轉藍鳥版嗎??? 09/29 00:54
10F:推 LIYENNEKO:原PO是學統計的吧 ><" 09/29 00:56
11F:推 Idiopathic:只有計算責失分而已? 09/29 00:56
12F:推 jakevin:稀疏程度XDDDD 09/29 00:57
13F:推 lwei781:BTW Pape 和Liri 的能算一下嗎 ?? 09/29 00:58
14F:推 semaj136:看到繁雜的計算因素就頭昏..不過Santana的確是萬中無一的 09/29 01:00
15F:→ semaj136:武林奇才... 09/29 01:01
16F:推 hoseea:沒學過統計,但我很想知道你怎麼定義r.v.成功次數?? 09/29 00:59
17F:→ Muscovy:呃, Papelpon & Liriano 的樣本數有點偏低. 09/29 01:01
18F:→ Muscovy:不過算出來他們也都是 PPM 等級的. :P 09/29 01:02
19F:推 lwei781:一樣算機律啊... RP 用50IP 就好.. Hoffy, MoㄝRyan 也來 09/29 01:03
20F:→ lwei781:Liri, Matt Cain 這種的用120IP 好了.. 09/29 01:04
21F:推 holymars:拿RA/IP從低到高排也會是這個順序吧.. 09/29 01:08
22F:推 OObaga:好樂迪 QQ 09/29 01:08
23F:→ holymars:不用用到Poisson Distribution也排得出來不是嗎@_@ 09/29 01:09
24F:推 realmd:二支都是稀有精英怪 09/29 01:09
25F:推 lwei781:順序跟RA 一定是一樣.. 不過用不同的measure 來看多稀有 09/29 01:09
26F:→ Muscovy:哦, 我是說誤差啦... 跟 IP 沒關係. :> 09/29 01:09
27F:→ lwei781:應該做不是每個人都調到一樣局的 看機率 09/29 01:10
28F:推 mightymouse:能不能解讀為:一個實力為聯盟平均的投手靠運氣達到這 09/29 01:14
29F:→ mightymouse:種成績的機率 09/29 01:15
30F:→ Muscovy:嗯, 其實跟 R/9 排序的結果不太一樣. 只有前幾名一樣. 09/29 01:16
31F:→ Muscovy:closer 跟 starter, 相同的 R/9, 排出來的名次會差很多.:) 09/29 01:20
32F:推 kjkent:其實沒差,沒人會記住誰是CY的第二名 09/29 01:22
33F:推 lwei781:SP 跟RP 當然差很多.... 09/29 01:31
34F:→ lwei781:不過對IP 差不多多的就跟RA 一樣啊.. 09/29 01:32
35F:→ lwei781:BTW Hoffy, Mo, BJ Ryan 是??? 09/29 01:33
36F:推 kenyun:CY第二名大概明年會常常拿出來提 不過只有講半季的價值 09/29 01:43
37F:推 Eric0605:用心好文推 09/29 01:52
38F:推 ahchie:推推推~ 09/29 02:14
39F:推 alssla:K.Rogers炸掉了,要修改一下了 XD 09/29 02:16
40F:推 LaneRR: 推一下 算法有點怪 但講不出邏輯上的錯誤... 09/29 03:21
41F:推 DK2s:好分析推 09/29 03:46
42F:推 cuteship:厲害 09/29 04:04
43F:推 kaijajan:推一下,很有趣的算式~~ XD 09/29 05:54
44F:推 Boyzone:看阿sa骨骼驚奇 是萬中選一的奇才 09/29 07:58
45F:推 realG:開張六給他 讓他贏莊家一百塊 09/29 08:06
46F:推 agoodjob:很認真 但這樣看投手是錯的 09/29 09:08
47F:推 lkw:算法有趣,但犯了邏輯上的錯誤,假設就已經錯了 09/29 10:27
48F:推 Hall:有趣 但是其實在一局當中投手在失一分情況下丟掉一分的機率 09/29 11:31
49F:→ Hall:應該不等於在目前沒失分情況下丟掉一分的機率 (投手心理因素) 09/29 11:33
50F:→ Hall:因此 Poisson的memoryless的特性似乎跟棒球場上的投手失分 09/29 11:34
51F:→ Hall:不太合 是否可以用Markov的transition Prob. 來描述? 09/29 11:35
52F:推 yero:不可能會有完全合的啦。這都只是好玩。基本上機率 != 統計 09/29 21:06