作者Paraguay (巴拉圭)
看板LeBronJames
标题[转录] Kobe vs LeBron (徵求有心人士)
时间Fri Oct 8 11:45:36 2010
※ [本文转录自 NBA 看板 #1CheET4m ]
作者: arkod (阿扣) 看板: NBA
标题: Re: [数据] Kobe vs LeBron (徵求有心人士)
时间: Fri Oct 8 10:36:09 2010
自己回自己的文章 :P
这篇想从公式推导上来探讨这网站的数据资料是否具有公平性。
(感觉好像在做 meeting 报告的投影片 =___=)
首先先看到这个数据
http://ppt.cc/HYgY
先研究一下 PPP 这个数据是怎麽来的:
PPP – Points Per Play. A “Play” is always ended with a shot attempt,
turnover or getting to the free throw line.
PPP is the player’s total
points, excluding technical free throws, divided by their total plays.
Rank – This is where a player or team’s PPP ranks amongst their league
peers. A player must have
at least 25 plays for a given category in order to
qualify for a league ranking.
其实後来跟 bri 和 poning 两位ㄉㄉ讨论过後,这个 Rank 排名的实际意义并不大,
因为排名较前面的其实整季下来的 play 数都很少,如果以
单季至少要超过 1000 个
play 数来说的话,LeBron James 的 PPP 没意外应该是第一名没错,而 Kobe 大概
可以排到二十几名左右。
(原本 LeBron 的 PPP 总排名是 20,而 Kobe 是第 141 名。)
但是 PPP 也是有它的价值在,
它显示了一个球员的出手选择的优劣,这个数据无关
这个球员是外线打法或是硬打内线,如果你的 PPP 比人家低的话,就是代表你的出
手选择或得分效益就是比较差。
既然 PPP 的数学意义是
『每次 play 可以得到的平均分数』,那我们就来试着手算
看看板上最红的 Kobe,他的 PPP 到底怎麽得来的:
首先,Kobe 本季例行赛总得分是 1970 分,网站上面记录的总 play 数是 2692次,
试算出来的 PPP 为
1970 / 2692 = 0.73 与 网站上面记录的 0.96 不符合。
再来,把 Kobe 的季後赛数据跟例行赛数据加总:
( 1970 + 671 ) / 2692 = 0.981 --> 约略大於网站计算数字 0.96
详细去比较实际数据上 Field Goal Maded(FGM) 的加总跟网站上面所记录的 FGM:
716 + 234 = 950 --> 网站上面是 940,少了十个 FGM。
再来看看 3PTM 的比较:
99 + 49 = 148 --> 网站上面是 145,少了三个 3PTM。
所以扣掉这些分数後,
( 1970 + 671 - 23 ) / 2692 = 0.973
若要符合网站上的 PPP = 0.96 的比例,还要再扣掉约 34~35 分。
而这 34~35 分有可能是技术犯规的罚球,本来想查看看是不是有这方面的数据,
可是能查到的数据只有今年季後赛的。
http://statsbynumbers.com/ Kobe 今年季後赛罚了 16球 TECH Free Throws
(结果之前的数据都失效查不到了,上面 16球是记忆中看到的,
有兴趣的人可以统计一下,来纠正一下这个数字上的缺失。)
这边可以讨论一下为什麽这数据网站会扣掉一些 FGM or 3PTM 掉。
他在 FAQ 上面并没有特别去解释,这边的猜想是说,网站可能会扣掉各节结束或
进攻时间快到的
『乱丢』的 play,就是所谓
非完整动作的 play 数。
其实这边只是猜想而已,但就几个 FGM 在统计上并不会影响太大,顶多就是 1% 左右
而已,且其他球员也是一样有被缩水个几球。
至於多算了季後赛的数据是否具有公平性?个人认为是 OK 的,可能有人会说季後赛
强度不同,但是以
取平均的概念上来说,数据上已经尽力做到大家都在同一基准点之
上了。
而网站上面也还有几个数据像
%SF – Percent Shooting Foul. This is the percentages of plays
where the player or team
drew a shooting foul.
制造出手犯规的机率,像 Kobe 每次 play 可以有 8.8% 可以制造犯规,而 LBJ
则有 11.9 % 的数据。
%TO – Percent Turnover. This is the pecentage of plays where the player
or team turns the ball over.
每次 play 失误的机率,Kobe 是 11.6%,而 LBJ 是 11.9%。
%Score – Percent score. This is the percentage of plays where the player
or team
scores at least 1 point, including any resulting free throws.
每次 play 得分的机率, Kobe 有 46.1%,而 LBJ 是 51.6% 左右。
大概是对这网站再做一个数学上的解释,基本上如果想要探讨一场比赛,或是
一个系列赛中,某个球员的得分数据,这样的统计数据会是十分精准的!!!
这个网站最大的贡献度就在於他记录的每个球员不同的得分方式,连有几个 play
是这样打的都有纪录,这个其实就很屌了 ...
--
更不用说这网站还可以看比赛重播
(目前我看上季的每场比赛都可以 XD),而且画质
还蛮好的,只是家里的网路流量水管要够大 ... |||
--
9无08林哲瑄 ☆★☆ 中华队 All Star☆★☆
8晴08罗国辉 6雨08张建铭 晴10林英杰 阴03林岳平 阴01谢承勳
1无10王胜伟 ◆
5雨06陈镛基 阴08阳建福 牛
雨10沈钰杰 雨84郭进兴
2晴06张泰山 ◆ ◆
3晴08彭政闵 雨06郭泓志 棚
雪92黄文柏 雪10叶咏捷
◆
晴03王建民 晴01陈扬凯 晴08郑凯文
7晴10林泓育 DH
4晴03陈金锋 雪01张志家 雨01郭李建夫
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.116.163.218
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 58.114.81.143
※ 编辑: Paraguay 来自: 58.114.81.143 (10/08 11:46)
1F:嘘 legenthume:季後赛的分数加上去PLAY却没有加 这什麽鬼 10/08 12:34
2F:推 cofficmike:补回来,虽然很长有点不想看XDDD 10/08 13:23