作者dreamkid (dreamkid)
看板CMWang
标题[数据] 王建民出赛气温与胜负相关性
时间Fri Sep 29 18:34:55 2006
从季初以来,关於小王出赛时气温对他的投球表现影响就偶尔会被提及
到底两者有没有相关,我稍微整理计算了一下,请不吝指教
为了方便统计上的计算,胜、负、无关胜败各给定一个量值
W=1 L=-1 No Decision=0 (换句话说,即W-L)
忽略SV那场的数据後,得出[气温]和[胜负]的相关系数是0.172
也就是说,以全部场次的数据来看,两者间的相关性是相当低的
(注:相关系数介於-1到1之间,其绝对值愈高,相关性愈高,正负号则代表其相关倾向)
不过呢,若将所有场次依气温的高低重新排序後,相当有趣的现象出现了 ⊙.⊙+
(气温我已换算成大家熟悉的摄氏℃)
DATE ℃ W-L QS | DATE ℃ W-L QS
05/01 7.8 0 |
09/22 22.2 1 #
04/26 10.0 0 # |
08/08 22.8 0
04/21 11.7 -1 |
06/03 25.0 0 SV
04/05 14.4 0 |
08/13 25.0 -1
05/12 16.7 1 # |
09/16 25.0 -1
05/22 17.2 -1 |
06/01 25.6 0
04/11 18.9 0 |
07/03 25.6 -1
09/27 18.9 1 |
06/23 26.1 1
06/06 19.4 1 # |
07/28 26.1 1 #
08/23 19.4 1 # |
05/27 26.7 1
07/22 20.0 1 |
08/18 26.7 1 #
05/17 20.6 1 # |
06/13 27.2 1 #
04/16 21.1 1 # |
09/09 27.2 1 #
09/04 21.1 0 |
06/28 28.3 0 #
08/30 21.7 1 # |
06/18 31.7 -1 #
05/07 22.2 1 # |
07/17 33.9 1 #
07/08 22.2 1 # |
08/02 36.1 1 #
当气温在18.9以下,以及22.8~25.6之间(其实几乎都是25 @@!),小王几乎都没赢过
但在18.9~22.2之间,以及26.1以上,小王几乎没输过
也就是输赢状况很明显的分出四个区块
前面的相关系数会被拉低,也许就是因为胜败呈现"低高低高"波浪曲线区块的缘故
再看看不符合区块输赢状况的四场比赛...
6/28 vs ATL ==> 8IP, 7H, 2ER ==>依然是相当不错的QS,这场延长到12局,NYY胜4:3
6/18...嗯...莫再提 =.="
以上两场还是跟第四区块满合群的
另外两场倒是很明显的例外
5/12 vs OAK ==> 8IP, 3H, 0ER ==>没话讲
9/04 vs @KC ==> 5.2IP, 7H, 3ER ==>很接近QS,但该场控球不佳,NYY第8局拿10分逆转胜
气温的资料是来自各场的Wrapup,其他的气候状况(例如:湿度)当然也是可能有影响
更别说气候以外的因素了,我只先把数据列出,其他的...就留给有兴趣的人讨论罗 :)
Well...那季後赛首场先发的气温是......???
若比赛是在10/3晚上(ET)开打,根据weather.com的预测(资料时间9/29 AM3:08 ET)
气温将会是64℉,约17.8℃
嗯...我希望数据不准!以上供参考!小王加油!
--
数据呈现的是历史,提供给我们茶余饭後的话题...
如果数据能够完全预测未来,棒球~~~就不会是棒球了~~~
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 59.112.43.83
1F:推 dadabo:好专业 请小王季後赛贴暖暖包 真的会很有效 不会冷 09/29 18:37
2F:推 wildsky:我觉得王建民会需要暖暖包...XD...给他牛棚空调好了.. 09/29 18:40
3F:推 ky284074:连这个都被你发现了... 09/29 18:44
4F:推 Makubex82:好神啊 贴到洋基官网论坛好了 09/29 18:56
5F:推 poetics:推 09/29 19:03
6F:推 pttbest:大推 大推 09/29 19:04
7F:推 godispower:不推不行.~ 09/29 19:34
8F:推 windcar:大大推 09/29 19:51
9F:推 toshi:使用相关系数的解释通常都要特别小心 09/29 20:32
10F:→ toshi:因为很容易就变成垃圾相关(Garbage in Garbage out) 09/29 20:33
11F:推 sky99:用类神经去求吧~o.0~ 09/29 21:26
12F:推 seeback:我觉得先作一下样本代表性偏误再来推论会比较好 09/29 21:37
13F:推 autoexecbat:这篇不肖女支者一定会抄!赶快加注着作权字样! 09/29 21:51
14F:推 rockbird:会不会都是恰巧遇到状况差而败投所导致的呢? 09/29 22:31
15F:推 xearo311:只能说,您真内行啊~~推一下 09/29 22:40
16F:推 backslash:女支者一定会抄... 09/29 22:42
17F:推 aoishingo:小心女支者 09/29 22:59
18F:推 poson:请教一下原po是用哪一个相关系数阿 相关系数种类有很多 分别 09/29 23:04
19F:→ poson:适用不同情形 09/29 23:05
20F:推 dreamkid:我不是念统计的啦...只单纯用excel里的CORREL去跑... 09/29 23:07
21F:→ dreamkid:也希望有高手用更适合的统计工具来分析!!! :) 09/29 23:11
22F:推 Wolfken:样本太少,至少要打个五年再来统计比较有价值 09/29 23:31
23F:推 walkingshit:即使证明高度相关 也无法说气温低就改先发 so… >_< 09/29 23:39
24F:推 e0101010:应该比较湿度一下,因为湿度也会影响球的变化 09/30 01:13
※ 编辑: dreamkid 来自: 59.112.43.83 (09/30 03:07)
25F:→ dreamkid:最新预测气温降到62℉,湿度73%......囧> 09/30 03:16