作者tradewind (The Twins Rule)
看板MLB
標題Re: [討論] 假設有一個這樣的球員
時間Wed Aug 16 14:03:59 2006
※ 引述《morikawablue (morikawablue)》之銘言:
: : Base Runs 基本公式:Runs = A*B/(B+C)+D
: : A = H + BB - HR
: : B = [1.4*TB -.6*H -3*HR +.1*BB] *1.02
: : C = AB - H
: : D = HR
: 坦白說我從來沒有真實去算過,不過以一個 run estimation 來看可以在如此
: 微小的事件裡做到 perfectly matched 讓我有點訝異,在這個例子裡,也許這
: 個 Base Runs 或許應該叫 "run equation" 而不只是 estimation 而已。
Base Runs 的算法是:
得分 = 跑者數目 * 得分率 + 全壘打數目
A 是跑者的數目,這點沒有問題,D 是全壘打的數目也沒有問題,
那麼得分率如何計算?B 指的是推進成功,C 則是推進失敗(出局),
用 B / (B + C) 這個比率來模擬得分率。
如果把 B 項展開,會變成 0.8 * 1B + 2.2 * 2B + 3.6 * 3B + 2 * HR + 0.1 * BB
這些係數當然是一種推估。
: 另一點,可能因為是 expected runs 的觀念影響,我一向認為除了 solo homer
: 是結結實實的 1 分 以外,其餘像 2-run、3-run homer 或是 grand slam 都
: 不應該是帳面上的分數,有的時候 homer 可能成為 "rally-killer",也就是
: 帳面分數的 "價值" 其實有被高估的可能,這個差異會否因為 Base Runs 所翻
: 譯的只是一個真實的現象而不是一種 regress to mean 的結果?也就是說我不該
: 拿 Base Runs 與 expected value 的觀念一起看?
我看不懂你上面這段的意思。
: 還有一件事就是 Base Run 的使用時機在 A 的部份會否應該做些限制?
: 好比說我們討論一個 4 consecutive singles 的事件時,用 Base Run 會得到
: 很奇妙的結果 ( Base Run = 4 !? ),但其實這裡忽略的事就是:
: 以 A 當成 Baserunners 的數量的話,4 consectuive singles 的小事件在
: Base Run 的式子裡就 out of reach 了,因為在棒球的事件裡不可能有 4 個
: baserunners。
不知道為什麼你覺得 A 項需要受到「同時最多只能有三位跑者」的限制?
事實上,如果連續擊出四支一壘安打,應該會有兩人回來得分,兩人在壘,
並不會同時有四人在壘。實際狀況得 2 分,而 Base Runs 是 4 分,並不 match,
但各種 run estimation 本來的用處就不是在推估這些微小狀況下的得分。
Base Runs 的好處是他的公式真正模擬了分數是怎麼得的
(上壘然後推進,外加一定把自己打回來的全壘打)
比起 RC、XR、Linear Weights 等其他 run estimation,
Base Runs 在極端狀況下的表現更接近真實,在正常狀況下也不遜色。
http://gosu02.tripod.com/id8.html 可以參考這裡的例子,還有 RMSE 的計算結果。
: 這種看法不曉得是不是也表示 sample size 對於 Base Run 的重要性?Or
: I do miss something?
連續四支一壘安打的狀況,BsR = 4,而實際得分 = 2,感覺差很多,
但如果連續 100 支一壘安打呢?BsR = 100,實際得分 = 98,其實是差不多的。
要在微小狀況下正好 match 很難,先前那個一支安打加一支全壘打的例子是恰好。
補充一點,在我之前的回應中,直接套 Base Runs 去計算這位打擊率一成,
上壘率兩成的假想打者的貢獻,其實是不恰當的作法,
因為上場打擊的並不是九個相同的打者,而是這位假想的打者加上八位隊友,
所以在 apply 到個人身上時,應該用 Marginal Lineup Value 的方式,
或者要像新版的 RC 那樣,做必要的改變。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.231.144.76
1F:推 ucanwore:這篇很讚阿! 08/17 00:30
2F:推 phcebus:推:) 08/17 02:28