作者Debugger (Win Shares 痴汉)
看板Bears
标题球队之连胜连败以及稳定性之探讨
时间Mon Jul 18 23:32:42 2005
※ 引述《Debugger (Win Shares 痴汉)》之铭言:
: ※ 引述《Debugger (Win Shares 痴汉)》之铭言:
: : 说到熊队连胜之後就是连败 稳定性不足
: : hmm... 稳定性是啥
: : 连胜之後就是连败就代表稳定性不足吗?
: : 熊队上半16W32L
: : 一支稳定性百分百的铜板 如果正面出现机率固定为1/3
: : 也会偶尔连续几个正面连续几个反面耶
: : 那是熊队的"稳定性"比较好? 还是铜板的稳定性比较好呢?
: : 更一般的问题: 六支球队都看 各用一枚正面机率出现代表该队上半季胜率的铜板来模拟
: : 请猜! 哪一队的"稳定性"最好? 最接近稳定性百分百的铜板?
: : 等等给解答:b
: 让我的题目更精确一点
: 因为这个想法的动机是"熊队连胜之後就是连败 稳定性不足"这句话
: 我要衡量的是 出现连胜的连续场数 以及出现连败的连续场数
: 跟丢铜板相比
: 会不会有streak平均偏长的迹象?
前几天阅读 Hit 杂志时, 在谈到熊队的部份看到这两句话:
即使是初阶球迷, 也看得出来 La New 熊是一支典型的年轻球队, 当然, 最欠缺的也就是
稳定. (page 73)
连胜之後又是连败, La New 熊队的稳定性还要加强. (page 94)
"稳定性"是啥? 这并不是个新鲜名词, 不管是看报章杂志还是教练或球员被访问时所说的
话, 都常常把稳定性拿出来用, 好像稳定性好就会战绩好, 稳定性差就容易会战绩差. 由
於这三个字的意义模糊, 不加以明确定义的话自然是无法用数据来探讨的. 依我之经验,
一般人讲到稳定性时, 通常有三种可能的意义:
1. 球队之胜败纪录. 常常连续好几胜然後连续好几败是为不稳定. 前文所引用之 page
94 页那句话可代表之.
2. 球队之得失分纪录. 常常连续好几局不得(失)分然後又一下子得(失)一堆分数视为不
稳定.
3. 个别球员之攻守纪录. 以打者为例, 常常一场打个三四安打然後又好几场打不出来是
为不稳定.
由於这三者意义相差甚多, 在本文中将先探讨第一种意义: 胜败纪录.
首先我们必须知道, 会连胜然後连败然後又连胜如此循环的球队跟稳定性不足未必有关.
如果连续丢一枚正反面出线机率都是五成的铜板二十次, 结果可能是:
正正反反反反正正反反反正正正反正正反反反 (乱数模拟结果)
如果把正面当成胜, 反面当成败, 那麽这枚铜板一样也会出现连胜与连败
但这枚铜板的"稳定性"如何?
如果"稳定性"是指球队整体获胜的能力, 也就可以大略用铜板出现正面的机率来代表
(当然, 现实生活中, 这还跟对手的铜板长怎样有关, 也就是比较像是在玩西八辣,
所以这个模型已被简化了很多. 不过概念是不变的, 较复杂的模型一样可以藉由模拟
来比较.)
那麽铜板的稳定性当然是最好的, 不管是第几次丢, 都是五成五成机会.
那麽实际上的球队又是如何呢?
以熊队上半季为例, 胜败纪录依序是: (这里忽略和局以便处理)
L, L, W, W, L, L, L, L, W, L, W, W, L, L, L, L, L, W, L, W, L, L, L, L,
L, W, L, L, W, L, L, W, L, L, L, W, W, W, W, W, W, L, L, L, L, L, L, L
共16W32L
既然要观察连胜连败, 我们将连续的 W 还有连续的 L 改写成以下的格式
L2, W2, L4, W1, L1, W2, L5, W1, L1, W1, L5, W1, L2, W1, L2, W1, L3, W6, L7
意义就是先连败两场, 然後连胜两场, 然後连败四场, 以此类推
所以在这 48 场比赛中, 熊队一共有 19 个连胜或连败,
而平均每个连胜或连败的长度是 (2+2+4+1+...+3+6+7)/19 = 2.53
另一方面, 假设现在另有一支球队, 获胜机率与熊队上半季的胜率完全相同, 每场都是
1/3 的机会赢, 我们用一个正面出现机率 1/3 的铜板来模拟, 连丢 48 次, 代表 48
场比赛, 然後纪录下来连胜连败的次数以及平均长度.
以丢铜板的观点来说, 如果熊队稳定性不足, 倾向於持续连胜连败的话, 那麽熊队的平
均连胜或连败长度就会比铜板的连续正面或连续反面长度要来得更长; 相对的, 熊队的
连胜或连败次数就会比铜板的连续正面或连续反面次数要来得更少.
当然, 只拿铜板连丢个 48 次然後来跟熊队战绩做比较变数太大, 只模拟一次在统计上
的意义不大, 所以我模拟了 1000 个半季, 也就是 1000 次 48 场比赛, 分别记录下次
数以及长度, 最後加以平均. 除了考虑熊队, 也对其他队作相同的处理, 每支队伍对应
到一个正面机率等於该球队上半季胜率的铜板, 然後各模拟 1000 个半季. 结果是:
Str=Streaks=连胜或连败的次数
StL=Streak Lengths=连胜或连败的平均长度
real life coins simulation
Games Wins Str StL Wins Str StL
兄弟 48 25 25 1.92 25.07 24.54 2.00
统一 50 24 26 1.92 23.99 25.80 2.02
兴农 48 28 23 2.09 27.95 24.07 2.04
中信 48 24 24 2.00 23.94 24.42 2.01
诚泰 48 28 21 2.29 28.01 23.91 2.06
辣妞 48 16 19 2.53 15.95 21.86 2.26
由於模拟的球季数相当多, 每支球队实际的胜场数跟模拟出来 1000 个球季的平均胜场
数几乎一样, 这没啥新鲜的. 重点来了, 我们观察每支球队的实际与模拟的连胜连败次
数及长度可以发现:
兄弟, 统一, 兴农, 中信四支队伍几乎没差. 次数跟长度误差顶多就只有 5% 上下.
诚泰与辣妞明显地有较少以及更长的连胜连败, 似乎符合了 Hit 杂志中的那句话.
不过, 这两支队伍的情况大不相同. 诚泰之球季初期受中本以及两名日投的影响, 战绩
低迷不振, 而在林恩宇入队以及启用马力欧之後焕然一新. 用 48 场比赛都是固定正面
机率的铜板来模拟诚泰队会得到相当大的误差.
至於辣妞, 我找不到什麽好理由了. 所以 Hit 杂志中的那两句话的确有些道理.
而稳定性跟会不会夺冠军有啥关系? 兴农跟统一在这方面的"稳定性"没啥差别. 诚泰
和 La New 也没啥差别.
别把一支球队的强弱跟稳定性弄混了.
--
Win Shares (暂译胜场贡献指数) 是由棒球统计魔人 Bill James (现任红袜队 Senior
Advisor, Baseball Operations) 所提出用来衡量棒球选手攻守整体价值的一套系统, 我
将原公式作了些许的调整与取舍, 以用来计算中华职棒史的球员排名. 相关文章放在 ptt
BBS 站 CPBL板以及台湾棒球资讯网专栏区
http://twbaseball.info/column_alist.php?editer_no=21
欢迎来信指教 ^^
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.114.34.57
1F:推 Debugger:sorry请重新推 @@ 140.114.34.57 07/18
2F:推 gingling:期待续集~~ m(_ _)m218.184.107.157 07/19
3F:推 AtpRyan:这个好夸张喔,太猛了,不愧是痴汉。 61.220.216.209 07/19
4F:推 Debugger:哪里夸张? @@ 这比 Win Shares 容易算多了 140.114.34.57 07/19
5F:→ Debugger:喔 稳定性写了三个意义 就是打算写三篇的:b 140.114.34.57 07/19
6F:推 AtpRyan:那你要多多写一点喔,收入文摘了。 61.220.216.209 07/19
7F:推 greengreen42:你竟然真的打算三个都算...218.162.199.101 07/19
8F:推 lamento:这个话题真好玩。底八格竟然会想讨论这个...^^ 222.156.7.19 07/19
※ 编辑: Debugger 来自: 140.114.34.57 (07/19 10:03)
9F:推 hsuanwei555:好文 推一个 59.116.73.103 07/19