MLB 板


LINE

看板 MLB  RSS
※ 引述《demintree (Mirabelli's back in tow)》之銘言: : ※ 引述《jacky77437 (遺憾~)》之銘言: : : 一棒 上壘率>速度>長打率 : : 中心打者 長打率>上壘率>速度 : http://www.beyondtheboxscore.com/story/2006/2/12/133645/296 : A point of OBP is worth about .003 runs per game from the leadoff man (a .021 : increase in the leadoff OBP would be about .063 runs more per game or 10 for : a whole season, which usually means about 1 win) : 由上面的圖表歸納可以猜測 : 對於第一棒來說OBP比SLG重要三倍 : 而對於中心打者的話 : #3 2.141/0.933 : #4 1.670/1.504 : #5 2.254/1.146 這篇文章的論調有很大的問題。 首先,SLG 的範圍是 0 ~ 4,OBP 是 0 ~ 1,也就是說,如果用 pure 的數字 去做 regression model fitting 的話,你怎麼算 OBP 的重要性都會大過 SLG。 講明白點,各位覺得 OBP 增加 0.1 和 SLG 增加 0.1,何者較為簡單?答案 應該很明顯。 如果 OBP 與 SLG 加一個相同的量的難度是不同的話,那麼用這兩個數值去 fit 一個 model,然後用 model 的 coefficients (or say, slopes) 去評估所 謂的 "重要性",這會不會有一點可笑? 第二點,這個作者用 retrosheet 的資料外加 18 個變數 (9 個 OBP + 9 個 SLG) 去跑一個 regression model,然後做出了那個表格當做結論,請問這是統計嗎? 為什麼這麼問?因為這個 regression model 的資料 base on 多年的各隊 lineup 資料,看起來這並沒有什麼 sample size 的問題,但我們必須思考的是:比方說 這裡頭做出的結論告訴你第一棒的 OBP 比較重要,第四棒的 SLG 比較重要,於 是你照著他的方法去安排你的棒次會得到什麼結果? 很簡單:新的棒次排列方式根本就不在原先這個 regression model 的規範之 內,這就像是我們統計東方人的身高與體重的關係,fit 出一個 regression model,然後找一個西方人的身高代入這個 regression model 去求這個西方人 的體重,各位覺得這合理嗎? 統計學不是這樣的!這位先生的結論犯了一個很大的錯誤,他的 model 所做出 的結論應該只有這樣: 1988 年到 2002 年的 ML "曾經做過的棒次安排" 顯示一棒的 OBP 較重要、四棒 的 SLG 較重要....and so on。 以上翻譯成白話文就是:那篇文章的 model 沒有預測能力,只是一項 "普查" 結 果,所以這不僅不是一個好的 model,更不能說是一個正確的結論! 提到棒次,我們第一個該想到的是:每一個打者的上場打擊都在所難免的和前一位 打者的結果多少有一點關係 (say, context...) 。那麼我所想到的 approach 不 是 regression,而是一個 n-state 的 Markov Chain!至於 n 要訂多少?這我 就不曉得了。 前一陣子那本叫 "The Book" 的書也有提到棒次的安排,他也是用 Markov Chain, 只是他們所用的方法是 9 個完全相同的打者在 Markov Chain 的 simulation 下 分別求出 outs、single、double、GIDP、HR....etc 等等打擊結果的 Expected Runs 然後看看這些 Expected Runs 在各個 batting order 下的表現,而 "The Book" 最後的結論是你的 1、2、4 棒要放上最好的打者;3、5 棒要放次好的 打者、剩下的依水準將較好的打者擺在較前面的位置...etc。 基於 "The Book" 的結果是用 9 個相同的打者去做打擊結果的 Expected Runs 來 當做安排棒次的依據,這本書聲稱 Bill James 所謂的棒次不重要論是對的,但 在最佳化的結果下最多可以擠出 50 分來,你相信嗎? 事實上,"The Book" 仍然犯了同樣錯誤的結論,這是因為如果我們照著他的建議 去安排棒次的話,那就已經改變了整個 lineup 的 context,這時候,這些打擊結 果的 expected runs 還會像他們書上寫的那樣嗎?我不認為會。 我認為正確的做法是:如果我們找得到一個合理的 n-state Markov Chain,然後我 們再利用 18 個不同的變數 (9 個 OBP 與 9 個 SLG) 去找出 9! = 362880 種的 棒次安排方式下究竟何種在 "合理的" simulation 下會得到最多的分數,這才 會是我們討論棒次安排問題應有的 approach,BP 的 James Click 所用的方法就比 較類似是這樣,他的結論我提過了:OBP descending order 比 OBP ascending order 一季也不過多出 20 分,然後我們又得到一個無頭公案:以 VORP 的結論,這 20 分 代表兩勝;以 Win Expectancy 的結論來看,這 20 分搞不好有可能代表 20 勝。 Sabermetric 的研究裡搞笑的文章是很多的,必須提醒的是:數字不會騙人,騙人的 是拿對自己有利或錯誤的數字做出結論的人;被騙的則是不懂數字的人。 然而,BP 的 Dayn Perry 在他的 Winners 一書中提到,利用 1871 到 2003 年各隊 的 AVG、OBP、SLG 與 IsoP 去計算與球隊總得分的 CR (相關係數),得到的結論是 AVG:.828 OBP:.866 SLG:.890 ISO:.762 而 Clay Davenport 在他的 Create EqA 過程中也提到與 Perry 相同的結果,甚 至,Davenport 在他的 raw EqA (OPS 的修正量) 式子裡隱藏了一個訊息:raw EqA 的分子其實是一種 "wild runs" 的估計,而 Hit、BB 與 Extra base 的價值相比 則是 2 : 1.5 : 1。 Billy Beane 不斷的強調 OBP 的重要性是絕對沒錯的,但他的 moneyball team 在失去 Giambi 與 Tejada 兩位較顯著的 sluggers 之後,他們的 2nd-half rally 的效果似乎一年比一年降低,這如果只說是巧合,恐怕站不住腳吧? 總之:當壘上無人的時候,BB 與 Hit 的價值是相同的,但壘上有人時,一支 Hit 的效果是每一個角度都比 BB 要好的,這應該是直觀到不能再直觀的事實。 瞭解統計學家們的想法是好事,但相信這些作者的結論,則必須要有選擇性。 --



※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 59.104.233.251
1F:推 jshuang:之前有篇 closer 該不該在九局上的研究也有您提到的問題 06/11 03:23
2F:→ nedbob:打序的重要性 可能要MLB全部的隊伍 把1-9棒 做排列 06/11 03:30
3F:→ nedbob:然後去比較看看是不是得到的分數差不多可以忽略 06/11 03:30
4F:→ nedbob:又如果有差異 那個隊伍的打者是什麼類型的組合 06/11 03:31
5F:→ nedbob:又如果分數相差不大 是不是因為9位打者能力差不多 06/11 03:32
6F:→ nedbob:這樣才有辦法 去探討打序是不是很重要 06/11 03:32
7F:→ nedbob:9位打者 N個隊伍 打幾季共幾場比賽為M 9!*N*M 06/11 03:34
8F:→ nedbob:隊伍打者組合類型又要不同 要計算 9!*M*N 06/11 03:37
9F:→ nedbob:這樣才能夠真正去探討打序的問題 06/11 03:38
10F:→ nedbob:如果要更精細 M跟N就要夠大....... 06/11 03:51
※ 編輯: morikawablue 來自: 59.104.233.251 (06/11 10:17)
11F:→ morikawablue:又打錯...wild runs 指的是 raw EqA 的分子... 06/11 10:19







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Soft_Job站內搜尋

TOP