作者waitla (おなら体操~!オォーッ!)
看板MLB
标题Re: [讨论] 初登板前三年连庄胜投王
时间Wed Sep 12 02:57:51 2007
: 事实上以今年的实际投球状况
: 小王的十八胜就算被下修 也不至於修到剩下十一胜
: 在小王拿胜投的这十八场
: 总共投了132局 平均每场超过七局
: ER 30 ERA只有2.05
: 败或无关胜败九场投48.2局 失44分 ERA是恐怖的8.13
: 从这里看的出来 洋基的後援投手今年比较少搞砸他的胜投
: 事实上洋基对他的火力支援也有差距
: 拿胜投时 132局给了115分 (RS/9 = 7.84)
: 败投或无关胜败 48.2局 27分 (RS/9 = 4.44)
把胜败分开来比较,得出这样的结果只能说是「理所当然」
,而这是一个很危险的做法。
除了一些特殊例子外,一般投手拿到胜投时的表现一定都优
於败投相当多。另一方面,相同的,要拿胜投球队一定要得
较多的分数,而输球,很简单的原因,就是得分比人家少嘛
。
举个例子 -- Edwin Jackson 138局 4胜14败 ERA6.00
4场胜投时投27局 责失只有3分 ERA1.00
另外24场总共责失89分 ERA高达7.22
拿胜投时 27局 RS共18分-->RS/9 = 6
其他 89局 RS共45分-->RS/9 = 4.55
举另一个例子 -- Chris Young 149局 9胜7败 ERA2.72
胜投时共投61.2局 责失6分 ERA0.88
其余场次共投87.1局 责失39分 ERA4.01 (单看败投时高达7.59)
拿胜投时 61.2局 RS共38分-->RS/9 = 5.55
其他 87.1局 RS共29分-->RS/9 = 2.99
很明显,这可以说适用於所有投手,要赢球就是投手丢分比
对方投手少,或是球队得分比对方多,王和洋基之间并没有
啥与众不同的地方。
另外,单看胜场是如何能看出後援投手的支援?赢球当然没
搞砸,搞砸了就不会出现胜场数,不是吗?
: 众所皆知 洋基的火力很旺 旺到每场可以得到5.88分
: 可是他的火力并不是平均的分散在各局
: 今年得分最多的是出现在第六局
: 143 game 123分 其次是第二局的114分
: 如果一个洋基的投手每场只能投五局 偶而才能投到第六局
: 那他所损失的就是每场将近一分的支援
每局得到分数不同或许有点影响,但我们已经有个东西叫RS了
。只计算投手下场前队友打下的分数不管你第六局下场还是第
二局下场,所以再去计较因六局下场少了一分的支援有点吹毛
求疵,既然都下场了,後来的分数本来就不该属於你。
: 不知道的人还以为Kazmir人缘不好 没获得什麽支援
: 事实上他的RS是5.41 在两个联盟还排在34名
: 不是顶好 但你说没获得很多的火力支援也说不过去吧
: 摊开他今年的成绩
: 总共先发了31场
: 失分在0或1分投满六局以上的场次有八场 获得五胜零败
: 一场被BS 一场因为只投六局 结果小鱼第七局才得分超前 所以他拿不到胜投
: 另一场是投手战还打到延长 当然也没办法拿胜投
这後面几句怎麽好像是在说Kazmir人缘不好阿? XD
: 事实上在31场先发 Kazmir只有10场投满了七局
: 而小王则是在27次先发中 13场投满七局
: 投不满六局的场次 Kazmir是9场
: 而小王仅仅只有2场
: 所以结论是 要评论一个球员 别只看那些统计数据
: 无论他有多麽的能够反应实际情形
: 摊开成绩逐场逐场的看
逐场逐场看也是看球的一种方式,但好像除了下面有拿Santana
的单场成绩来看外(其实也没真的每场看),好像都是只用胜败投
时成绩在评断投手阿。所以repeat回第一段。
而且,统计的数据也是逐场逐场去累加或计算得出来的,甚至很
多都精细到play-by-play。
: 拿神之子来看吧
: 大家都知道他今年对印地安人吃瘪
: 对战六场就输了五场
: 六场的局数 R ER分别是
: 7 4 4
: 7 2 2
: 7 2 2
: 6 5 3
: 6 4 4
: 6 4 4
: 事实上 他今年失分在四分以上的场次也有10场
: 小王则是在27场先发之中的八场掉了超过四分
: 神之子在赢的十五场共投了103局 丢22分的责失 ERA是1.93 比小王略好
: 输或无关胜败十五场 98 47 4.31 更是远远比小王好
: 神之子主投的30场 Twins是17-13 小王主投的27场 NY是20-7
双城今年衰退的打击可以说明一切。(ps.Santana的RS/9是5.05)
: 在神之子输或无关胜败的场次之中
: IP-R-ER
: 6-3-3
: 6-2-2
: 7-2-2
: 6-4-3
: 7-3-2
: 7-2-2
: 8-3-3
: 7-2-2
: 7-3-3
: 这九场是比较具有贡献性的 如果在洋基 搞不好这九场就变成了七胜二败了
这边举Santana这些数据的用意是?好像没有一个结论在。如果
是说明他没得到队友火力支援,那其实直接看RS就可以知道这件
事实了。
: 提供了那麽多的资讯
: 最主要的是想要说下面的结论
: 棒球统计虽然是很重要的一项工作
: 但是对於大部分的球迷而言并不是最重要的
: 我不会因为神之子今年只有十五胜十一败
: 就说神之子比小王烂
: 不仅仅只是因为我比较了两位投手的防御率、WHIP
: 更重要的是我会逐场逐场的来看
: 至於Baseball-reference的那个Neutralize Stat还是看看就好吧
: 王跟神之子两位投手这两位投手的成绩绝没有15-7跟11-9这样夸张的差距
: 最後的最後还要说
: 并不是每个棒球统计学家发展出来的统计方法都具有参考价值的
: 正如研究生做论文一样 -_-
正如你所说,棒球统计对大部分球迷来说一点都不重要,但有一点我觉
得你搞错了。做校正是为了把不同环境、不同时空的所有球员能放在同
一个天平上比较,因为这是一般传统数据(ex.ERA、AVG、RBI等)所做不
到的,它并不是要来批判任何一位球员。
举BBTN提到的来说,1968年美联打击王Yaz竟然只有0.301打击率,联盟
平均更低到只有0.230,Yaz的0.301拿到1930年甚至比全国联的平均打击
率还低(0.303)。原因在於1930年环境相当有利於打击,而1968年的美联
因为好球带变大、投手丘增高、新球场造型等因素造成打击环境相当艰
难。而那些公式就能帮我们了解到,在尽量去除变数而转换出来的成绩
,Yaz还是一个比1930年的Pinky Whitney(AVG0.342)更为优秀的球员。
Neutralize Stat所做的也是一样的事情,而他校正後的胜败场数只是代
表以现在的成绩(所有投球数据)放到那个环境下会得到怎样的成绩而已。
好比BP用的E(w)和E(l),Santana的E(w)/E(l)是13.4/8.2,而Wang是
12.5/8.6,相对於实际胜败15/11和18/6,中间是如何会产生这样的差距
才是让人感兴趣的,这可以产生很多讨论的空间,而不是看到数据往下
修就立刻出来把这个东西批评的一无是处。
不过的确不是每种统计数据都是完美无暇,所以要不要选择使用它就看个
人罗,但我想应该这是在真正了解後才能做出的结论吧。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 218.162.122.84
1F:推 bram:我比较支持这种说法 推推推 09/12 03:08
2F:推 menan:推 09/12 03:09
3F:推 niceta:睡前最後一推 09/12 03:16
4F:推 oralboralb:这一串文章引出了一堆高手@@ 09/12 03:16
5F:推 ayenn0302:推 正如研究生做论文一样 你是比较有贡献的少数 09/12 03:22
6F:推 larusa:实在很想在发一篇继续讨论下去 可是实在是爱困啊 09/12 03:39
7F:→ larusa:简单回应一下 您似乎只看到我把胜败投分出 有注意到比例吗똠 09/12 03:40
8F:→ larusa:或许我没特别点出来 不过我自己是会这样看 09/12 03:42
9F:→ larusa:一个SP要对球队有贡献 在他主投的比赛能投出多少场次有品 09/12 03:43
10F:→ waitla:这我是真的没有看到有谈到比例 XD 09/12 03:43
11F:→ waitla:QS场次事实上这也不需要逐场看 因为统计有忙加总出来了 09/12 03:44
12F:→ waitla:而如果单看QS...那您提到的那9场 实际上也是没有任何贡献的 09/12 03:45
13F:推 cplinn:l 网友没说错 第一段不是「理所当然」 重点在於你能提供 09/12 03:45
14F:→ larusa:质的比赛的比率也是个重要因素 Neutralize Stat最大的问题 09/12 03:43
15F:→ waitla:因为都没拿到胜利...而这就牵扯到RS的多寡 09/12 03:46
16F:→ cplinn:的优质先发的场次在你实际出场的比例 09/12 03:46
17F:→ larusa:在於他很复杂的计算了很多东西 结果只为了算出新的RA 09/12 03:47
18F:→ waitla:但QS是评量投手稳定度 但要拿胜投QS只是其中一个方法 09/12 03:47
19F:→ waitla:那个就是他的目的阿 把所有人放到公平环境下看他的变化 09/12 03:48
20F:→ larusa:然後将胜率直接用一个只跟他所假设的公式来计算出来 09/12 03:48
21F:→ waitla:不算出新的RA 要怎麽和其他人做比较? 09/12 03:49
22F:→ larusa:这公式只牵涉到他所假设162场得750分以及所算出投手的RA 09/12 03:51
23F:→ waitla:就跟EQA做的事一样 所有人都是经过相同的校正 NRA也是 09/12 03:51
24F:→ larusa:前半段在作成绩调整 这很公平 但是投手的胜败绝对没办法 09/12 03:52
25F:→ larusa:只靠RA就算出来 因为棒球比赛的比数又不能累加 事实上 09/12 03:52
26F:推 cplinn:我想重点在於「稳定度」「胜投」「投手能力」是相关又不同 09/12 03:53
27F:→ waitla:@@... 事实上你把他想成一支球队就好了阿...而且就我个人而 09/12 03:54
28F:→ cplinn:的内容 我觉得 l 网友在提的比较接近稳定度 09/12 03:54
29F:→ waitla:言 他算出来的胜败场并不代表啥 他中间的差距才是重点 我会 09/12 03:55
30F:→ larusa:胜败是一场一场决定的 结果用一个平均值来决定胜败 09/12 03:55
31F:→ larusa:这本身就是一件很吊诡的事 09/12 03:56
32F:→ waitla:选择从校正後的看回实际 找看是不是PF、攻击能力等改变造成 09/12 03:56
33F:→ cplinn:「校正」後胜率比较接近投手能力的评估 两者有点差别 09/12 03:56
34F:→ larusa:另外你有看到Neutralize Stat以9 adjusted IP 当1 decision 09/12 03:56
35F:→ waitla:能不能用毕式胜率来决定胜败我不能回答你 但他算球队成绩还 09/12 03:57
36F:→ waitla:是蛮准的 毕竟他不光是用RA 也用到 RS 09/12 03:59
37F:→ larusa:吗? 这对一个吃长局数和一个5-IP SP的投手的差别有多大 09/12 03:58
38F:→ waitla:那只是一个预测值 但实际还是会产生误差 但他的过程已经在 09/12 04:00
39F:→ waitla:尽量消除变因了 09/12 04:01
40F:→ larusa:你知道吗? 我不喜欢这个公式远远超过其他统计数据的原因 09/12 04:00
41F:→ larusa:因为他用了太多的假设 假设本身就可能是巨大的误差 09/12 04:01
42F:→ larusa:去B-R把整个Neutralize Stat如何作用看完 只有一个想法 09/12 04:02
43F:→ waitla:没吧@@ 许多比较都是在假设的情形下才能成立阿 09/12 04:02
44F:→ larusa:感觉就像是男人连番抽插後 在女生快要达到高潮前泄了 09/12 04:03
45F:→ waitla:就像要看Honus Wagner如果在现在会有怎样的打击表现 也是 09/12 04:04
46F:→ larusa: 虎头蛇尾 09/12 04:04
47F:→ waitla:透过假设 经由联盟难度校正和EQA计算後得出他在现在的成绩 09/12 04:04
48F:推 Fumertue:Neutralize Stat 假设有缺限 +1 09/12 04:05
49F:→ waitla:我只是觉得校正後的11胜9败有那麽无法接受吗? 这和BP的E(W) 09/12 04:05
50F:→ waitla:算出来其实也差不了多少 09/12 04:06
51F:推 larusa:成绩有分两种啊 一种是打或投出来的 一翻两瞪眼 09/12 04:06
52F:推 Fumertue:胜投用一个公式就能算出来? 胜投被後有相当巨大的原因 09/12 04:07
53F:→ larusa:另一种是由比赛结果来决定的 个人倾向不由平均成绩来推估 09/12 04:08
54F:→ waitla:我是觉得他单单假设把人放到同样某个环境 并没问题 09/12 04:08
55F:→ larusa:一场一场拆开来看 真的很累 不过如果你看腻了统计数据 09/12 04:09
56F:推 Fumertue:没有同样的环境 ~ 9 adjusted IP 就是很大的问题 09/12 04:10
57F:→ larusa:不妨看看吧 09/12 04:10
58F:→ waitla:那只是一样的东西 别人一场一场看完後统计出来 方便评估用 09/12 04:10
59F:→ waitla:尤其是看单场容易产生特例 09/12 04:12
60F:推 Fumertue:这就是了 ... 特例不能忽略 所以才要单场看 09/12 04:12
61F:→ Fumertue:要样本数够多才能忽略特例 09/12 04:13
62F:→ Fumertue:为了统计评估方便 不就是一种问题吗 09/12 04:13
63F:→ waitla:特例是极少数的存在阿 @@ 09/12 04:14
64F:→ waitla:好像我的文章的重点被扭曲了 重说一次好了 我对Neutralize 09/12 04:21
65F:→ waitla:Stat没有任何好恶 他只是许多工具中的一个而已 他提供一个 09/12 04:22
66F:→ waitla:方法让我们可以去比较不同的选手 至於里面他使用的方法或 09/12 04:22
67F:→ waitla:许有让人不解 但他运作都是公平的 09/12 04:24
68F:→ waitla:而我认为把胜败分开是无法显示啥稳定性的 举个例好了 Wandy 09/12 04:26
69F:→ waitla:Rodriguez 09/12 04:27
70F:→ waitla:我认为那个adjusted 9IP没有问题 他一开始就说没有校正 09/12 04:39
71F:→ waitla:changing role of bullpens 而且他拿来计算的IP也是他原本 09/12 04:40
72F:→ waitla:所吃的IP 这和原本能投5局或7局没关系 他就是看你在那些局밠 09/12 04:40
73F:→ waitla:数中以RA和RS来预估你能拿下的胜败场 09/12 04:43
74F:推 adam323:这种文章比吵谁神化A-Rod的好多了 推阿! 09/12 06:28
75F:推 ToHiman:推荐这篇 感觉是博班生在指正硕班生盲点的文章 XD 09/12 09:16
76F:推 k8543:其实上一篇只是说投的越长就越能得到更多的rs支援 09/12 09:27
77F:推 kee32:高手讨论真是好看 09/12 10:08
※ Debugger:转录至看板 Sabermetrics 09/12 10:47
78F:推 tsming:套公式当然是公平的,但是公式本身可能有问题啊:P 09/13 02:42