作者reversy (billychen)
看板Hornets
标题[打屁] 霍林格先生的power ranking
时间Mon Jan 24 19:22:52 2011
分数差rocks?
霍先生认为得分与让对手得分比战绩更能反映出球队的品质。
乍听之下可能不合理,但过去研究指出分数差比球队的胜负战绩更
能预测球队未来成功与否,因此分数差(scoring margin)对於球队
品质来说是蛮精准的sign。这解释为何马刺四年前胜场少小牛九场
但Power Ranking仍领先小牛─因为马刺的分数差比较优。
最後证明分数差是有预测力的,因为小牛第一轮就挂点,马刺则获得总冠军。
赛程强度
赛程强度亦影响NBA。虽然此不如大学篮球般影响巨大,但它仍然影
响球队的战绩。赛程强度一开季就对各球队不公平,但到球季结束时
还是不公平的,因为球队的对手有所不同,特别是当一个conference
比另一个conference强出许多时。
近来表现
另一项公式中的重要指标是近来表现,霍先生归纳出两项:第一,越接近
的表现越能预测出球队的状况。
第二,给分方式主要根据Marc Stein的"human"power ranking(每周一公布)。
为了完成这些,他用三分之二球队整季的结果与三分之一球队近况来衡量球队
rating状况。(利用加权来计算)
近况指的是?
如果已经比四十场比赛,那麽就是近十场。
若球季比赛数是(40场),那麽近25%
的场数(10场)结果对於40场比赛後的排名有40%解释力。
主客场
最後一个变项是主客场,每场比赛拉斯维加斯分数差调整3.5分。此项列入考量是因为
Circus/rodeo的球队如公牛与马刺每球季至少多打一场客场(因为他们主场要举办活动)。
警告
因为是自动计算,所以会有偏误。
例如:伤兵问题(injuries)、主力球员挂点、交易、争议吹判通通没有纳入考量。
这排名完全是靠分数算出的,所以大家请带着欢乐的心情看待它。
霍林格Power Ranking公式:
Raring=(((对手胜率-.5)/.037)*.067+(((对手近十场胜率-.5)/.037*.33)+100+0.67*(分数差
+(((客场数-主场数)*3.5/(比赛数)))+(0.33*(近十场分数差+(((近十场客场数-近十场主
场数)*3.5/(10)))))
解释霍林格Power Ranking:
http://0rz.tw/FNas9
因此,本日的Power Ranking排名如下:
1.魔术(107.328)
2.湖人(106.620)
3.热火(106.156)
4.黄蜂(105.787)
5.马刺(105.643)
6.超赛(105.407)
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.122.47.201
※ 编辑: reversy 来自: 140.122.47.201 (01/24 19:27)
1F:推 CW4:感谢r大分享 不过我非常不喜欢霍林格的东西 01/24 19:45
2F:→ CW4:他实在很爱拿现行的数据做一些数学处理就丢一个新的 中间很多 01/24 19:47
3F:→ CW4:加权系数没什麽道理可以全联盟用一个标准.. 01/24 19:49
4F:推 Nike56:我反而喜欢这样的数学处理的东西 01/24 19:50
5F:→ Nike56:可是重点就像CW4大说的 加权系数 没有一个标准 01/24 19:51
6F:→ Nike56:所以对於每个人的接受度就有差别 01/24 19:51
7F:→ CW4:82games跟mysynergysports很多设计 我认为都有想让篮球数据走 01/24 19:51
8F:→ Nike56:数学处理的东西 就是 套入方程式 算出其数据 01/24 19:52
9F:→ CW4:出它的系统的目的 用新的观察方式去采样新的数据是比较合理的 01/24 19:53
10F:→ Nike56:这种比赛的东西 太多变异系数 所以也都参考用啦 01/24 19:53
11F:→ CW4:他的TS%我就觉得是蛮垃圾的东西 原因之前有在总版讨论过 Shaq 01/24 19:53
12F:→ CW4:被骇客跟Nash罚技术犯规跟防守违例 两个人明明没持球还会站上 01/24 19:54
13F:→ Nike56:可是加减可以看出 哪些是领先集团 是归类在分差的原因 01/24 19:54
14F:→ CW4:罚球线的理由根本南辕北辙 这种东西统计出来还叫True Shot%.. 01/24 19:54
15F:→ CW4:PER也是 专吃垃圾时间教练不敢放上场的人 可以跟正常轮值里的 01/24 19:56
16F:→ Nike56:恩 所以如果是我做统计 就会把这类的东西 归类在变异系数 01/24 19:57
17F:→ CW4:差不多 我就不知道参考性何在了 eFG%和EFF这种比他的系统单纯 01/24 19:57
18F:→ Nike56:可是现实面来说 这种东西 太多了 很难掌握 01/24 19:57
19F:→ CW4:的数据通常反而真的直觉表达出定义的意思 01/24 19:58
20F:→ Nike56:所以 数学统计的东西 到最後决定的时候 很多都是参考用的 01/24 19:58
21F:→ CW4:我说了 他的问题就是做那些多出来的数字运算不如去做新的采样 01/24 19:59
22F:→ Nike56:我大概懂你的意思 01/24 20:00
23F:→ CW4:而且我很不喜欢PER跟Power Ranking这种东西 他自己说明页都会 01/24 20:01
24F:→ CW4:像r大翻的有讲到遗漏的factors 结果他自己专栏又用很爽... 01/24 20:02
25F:→ CW4:以前刚接触数据我也很迷信这些东西 後来看久会觉得那些说他在 01/24 20:02
26F:→ CW4:自high的不是完全没有根据 PER最好是可以算交易後的胜负差.. 01/24 20:03
27F:→ reversy:哈 我倒是想将会影响的变项都找出来 我觉得赌盘开出来让分 01/24 20:03
28F:推 Nike56:我大学的时候 就是读这种的 我们也都把它当参考用 01/24 20:03
29F:→ reversy:也很值得参考 霍先生没有交代很多统计的问题 不过他有提到 01/24 20:03
30F:→ Nike56:不然就是 创立新的方程式来 自圆其说 证明自己是正确的 01/24 20:04
31F:→ CW4:职业赌盘的让分倒是真的蛮准的 01/24 20:04
32F:→ reversy:近况对於排名的影响力......我觉得Vegas开赌盘分数的那边 01/24 20:05
33F:→ reversy:统计资料应该是非常多 01/24 20:05
34F:→ Nike56:前几天篮网受让2.5忘记对上哪队伍 就觉得很迷 NET会独赢 01/24 20:05
35F:→ Nike56:结果 NET 果真独赢 01/24 20:06
36F:→ reversy:每次看到赌盘很怪我也会注意一下 去年买到一场 买小分 01/24 20:06
37F:→ Nike56:那场 我看很多 数据统计 就感觉没道理会这样开盘 01/24 20:07
38F:→ reversy:最後一分钟已经胜负已分 但裁判一直乱吹哨 吹到变大分 01/24 20:07
39F:→ Nike56:通常这样的比赛 还不少呢 .. 01/24 20:07
40F:→ reversy:之後我就不买运彩了 我觉得人为操控因素蛮大的 01/24 20:07
41F:→ reversy:所以赌盘反而是很值得参考的一项 01/24 20:08
42F:→ reversy:以後有空再用SEM跑跑看NBA 01/24 20:09
43F:→ Nike56:有钱能使鬼拖磨 01/24 20:09
44F:推 CW4:NBA 我已经打定主意季赛看的比季後赛认真了LOL 01/24 20:10
45F:→ CW4:越到关键时刻胜负中的篮球纯度会越低的操作法 真的是见鬼... 01/24 20:11
46F:推 CW4:mysynergysports每个play去算的统计挺有参考性的 我一直在想如 01/24 20:24
47F:→ CW4:果自己有以前那种热情会去付费吧 那在我网路上习惯的消费水平 01/24 20:24
48F:→ CW4:来说还可以接受 只是现在没以前愿意为NBA花钱了.. 01/24 20:25
49F:→ reversy:C大说的网站我没去看过 听起来蛮有趣的 有空再去看看 01/24 20:26
51F:推 Nike56:CW4大 那你对剪辑软体懂吗 .. After Effect 01/24 20:33
52F:→ Nike56:我在做商品的CF 看NBA的剪辑 有人说都是用AE做的 01/24 20:34
53F:推 CW4:不太熟耶 怎麽会认为我懂这个呢XDD 01/24 20:42
54F:推 moleman126:我之前也在想说 能不能直接藉由职业赌盘开的让分 来玩 01/24 20:50
55F:→ moleman126:胜分差XDDD 实际买下去的有5场 中2场 但样本数还太少|| 01/24 20:52
56F:→ moleman126:而且资本少的人 通常要靠串场 所以该怎麽串也很重要 01/24 20:55
57F:→ reversy:楼上 我觉得赌盘让分只是变项之一 我想专业的算法应该是 01/24 21:06
58F:→ reversy:连裁判那些都当作变项去跑的 01/24 21:06
59F:→ reversy:我如果自己论文作完 又有空闲的话再来研究 看看哪些因素 01/24 21:07
60F:→ reversy:影响胜负最大 01/24 21:07
61F:推 CW4:其实像这个数据 得分差代表比赛质量我就觉得有疑义了 超过15分 01/24 21:08
62F:→ CW4:分差的比赛 最後几分钟会持平拉开还是维持在保险分7-8分 还挺 01/24 21:09
63F:→ reversy:国内我有看过针对NBA喊暂停时机做的论文 还蛮有趣的 希望 01/24 21:10
64F:→ reversy:以後多一些相关的研究 01/24 21:10
65F:→ CW4:看球员心情的 而有时候分差在1-3分的比赛反而是精采到不得了 01/24 21:11
66F:→ reversy:分数接近感觉大家都很认真 有些球员不会一直都绷紧神经 01/24 21:13
67F:推 MOJS:数据预测这种东西..如果你的方法很好,或许你猜中的机率比较 01/25 08:15
68F:→ MOJS:高,也意味着不是"百分之百"准确所以参考就好.. 01/25 08:15
69F:→ MOJS:联盟第一遇上垫底被翻盘的例子也不少.. 01/25 08:16
70F:推 CW4:我看大部分的数据喔 为什麽不信赖Hollinger已经举例解释过了 01/25 08:45
71F:→ CW4:不会有人去要求数据百分之百准确预测的 至少我不会^^ 01/25 08:47
72F:→ MOJS:CW4大我没有针对你啦@@ 我没看你们的推文 只打出自己的想法 01/25 09:05
73F:→ MOJS:我也不是说数据不好,只是用来参考不错,尽信就多了 01/25 09:06
74F:→ CW4:没有啦 因为这部分很容易产生误会 我只是澄清一下自己会去关心 01/25 09:08
75F:→ CW4:这些数字 只是完全不去了解它就批评/或过度信任它这两种极端看 01/25 09:12
76F:→ CW4:多了 就会忍不住强调是特别挑Hollinger的毛病 01/25 09:13
78F:→ reversy:看了C大上面网站很多评论 骂他的人骂得还蛮难听的 01/25 10:19
79F:→ reversy:但我有兴趣的是他说近况对於排名的解释力有40% 01/25 10:20
80F:→ reversy:对我来说他是作了我想要做的事 只不过方法用得比较浅 01/25 10:21
81F:→ reversy:如果他有更多佐证自己公式的的数据会好一点 01/25 10:22
82F:推 CW4:骂他的通常在讲差不多的事啦 他设计跟自己使用那些数据的方式 01/25 10:24
83F:→ CW4:有点走火入魔 尤其是他的专栏... 01/25 10:26