作者ldkrsi (衰神)
看板Sabermetrics
标题[讨论] 中职一二军间数据转换 #打击
时间Fri Jun 20 21:49:15 2014
这是我个人发明的算法
和Major League Equivalencies的算法完全不同
写出来给大家讨论看看
===
守先要先找出几位在一二军都有不少打席的球员
拿2013年来说
我取了 洪臣宇 陈雁风 林政亿 谢炫任 郭修延 叶竹轩 陈威儒 黄恩赐 刘育辰 郭岱琦
方克伟 李家驹 苏建荣 林宗男 共14人
这几位球员(同年度一二军都有60pa以上)
然後算出他们一军和二军的
1B/(H-HR) 2B/(H-HR) 3B/(H-HR) HR/AB SO/AB SAC/PA BB/PA IBB/PA SF/(AB-SO-H+SF)
然後取平均後一二军相除 为方便说明 除出来的结果命名为
1B% 2B% 3B% HR% SO% SAC% BB% IBB% SF%
再来取得一二军的全联盟平均的BABIP
以目标球员的二军总安打-全垒打数为基准*一军BABIP/二军BABIP
算出估计的非全垒打安打数X
估计1B=1B*X/(1B%*1B+2B%*2B+3B%*3B)
估计2B=2B*X/(1B%*1B+2B%*2B+3B%*3B)
估计3B=3B*X/(1B%*1B+2B%*2B+3B%*3B)
然後用到二军中击到场内的球(也就是BABIP的分母)
估计SF=[(AB-SO-HR+SF)-估计(1B+2B+3B)]*SF%
*换算到一军後AB-SO-HR+SF的值是不变的
然後回推估计用的AB
估计AB=[二军(AB-SO-HR+SF)-估计SF]/(1-SO%-HR%)
算出估计用的AB後即可算出打击率 长打率
再来是求出估计用的PA
估计PA=估计(AB+SF)/(1-BB%-SAC%-IBB%-一军HBP%)
算出估计用PA後即可推出BB IBB HBP然後就可以估计上垒率
以这个公式套回去给当作转换资料用的14名球员结果和误为如下(已照误差排序
球员 打席 打数 打击率 上垒率 长打率 BB/K OPS
林政亿 106.0 89.3 0.246 0.319 0.281 0.33 0.600
-0.024 -0.024 0.021 0.127 -0.003
球员 打席 打数 打击率 上垒率 长打率 BB/K OPS
郭修延 131.8 118.9 0.277 0.322 0.383 0.35 0.705
0.037 0.021 -0.016 0.049 0.005
球员 打席 打数 打击率 上垒率 长打率 BB/K OPS
刘育辰 82.7 74.4 0.255 0.330 0.311 0.48 0.640
0.000 -0.005 0.021 -0.027 0.015
球员 打席 打数 打击率 上垒率 长打率 BB/K OPS
苏建荣 65.1 56.3 0.213 0.308 0.248 0.46 0.556
-0.023 -0.001 -0.048 0.838 -0.048
球员 打席 打数 打击率 上垒率 长打率 BB/K OPS
郭岱琦 148.4 128.0 0.312 0.402 0.381 0.81 0.784
-0.067 -0.040 -0.013 -0.045 -0.053
球员 打席 打数 打击率 上垒率 长打率 BB/K OPS
方克伟 89.1 81.8 0.317 0.373 0.413 0.56 0.786
-0.024 0.004 -0.071 0.107 -0.068
球员 打席 打数 打击率 上垒率 长打率 BB/K OPS
李家驹 73.2 66.3 0.226 0.293 0.255 0.31 0.548
0.050 0.040 0.067 -0.009 0.107
球员 打席 打数 打击率 上垒率 长打率 BB/K OPS
谢炫任 80.4 70.6 0.227 0.301 0.271 0.43 0.572
0.074 0.075 0.063 0.237 0.138
球员 打席 打数 打击率 上垒率 长打率 BB/K OPS
黄恩赐 72.5 66.0 0.318 0.379 0.422 0.57 0.801
-0.082 -0.084 -0.108 -0.239 -0.193
球员 打席 打数 打击率 上垒率 长打率 BB/K OPS
叶竹轩 88.4 76.4 0.183 0.265 0.211 0.49 0.476
0.090 0.084 0.139 -0.173 0.223
球员 打席 打数 打击率 上垒率 长打率 BB/K OPS
林宗男 75.0 68.4 0.219 0.271 0.235 0.34 0.506
0.101 0.107 0.167 0.370 0.274
球员 打席 打数 打击率 上垒率 长打率 BB/K OPS
陈雁风 126.5 110.4 0.298 0.336 0.400 0.33 0.736
-0.111 -0.136 -0.166 -0.329 -0.302
球员 打席 打数 打击率 上垒率 长打率 BB/K OPS
洪臣宇 173.9 157.4 0.285 0.334 0.349 0.72 0.683
-0.127 -0.121 -0.191 -0.149 -0.312
球员 打席 打数 打击率 上垒率 长打率 BB/K OPS
陈威儒 128.3 116.8 0.300 0.354 0.396 0.32 0.750
-0.167 -0.182 -0.227 -0.130 -0.409
从OPS看2/14的误差在0.01内
6/14的误差在0.1内
以上
中心想法是以两个联盟间BABIP的差异和球员表现差异
从非全垒打安打下手进一步推得打击三围
哪的算法的观念有错 麻烦各位指正我了<(_ _)>
--
中华职棒投打进阶数据 ~2013
http://cpbl-record.appspot.com/
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.113.242.111
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/Sabermetrics/M.1403272159.A.DA0.html
※ 编辑: ldkrsi (140.113.242.111), 06/20/2014 22:40:56
1F:推 Danielly:推 一直很想做一二军数据的转换 06/21 01:09
好像用那些球员的一二军BABIP来弄会比较准
※ 编辑: ldkrsi (140.113.242.111), 06/21/2014 01:30:18
※ 编辑: ldkrsi (140.113.242.111), 06/21/2014 01:31:09