作者s90720eric (SkySI)
看板car
标题[讨论] 用基础统计看 01金卡纳测试
时间Wed May 22 02:26:01 2019
因为找不到测试本文
就用板友提供的图片当作样本资料
首先用R的KNN机器学习 填补遗失值
命名成RE
这次的试验由於是实验设计 适用ANOVA分析
*contrast利用helmert编成
*使用type3 SS
检定结果
Pr(>F)
(Intercept) < 2.2e-16 ***
re$车手 2.034e-12 ***
re$厂牌 6.764e-06 ***
re$车手:re$厂牌 0.004231 ***
车手 跟 厂牌皆显着对於实验时间有影响(车再好也会被人剧烈影响)
车手跟厂牌之间也不独立(厂牌情节?)
https://i.imgur.com/JPtKUAx.jpg
TukeyHSD 看有兴趣的厂牌部分
upr p adj
2-1 -1.7530629 0.0000074
3-1 -0.9668515 0.0005248
4-1 -1.0598039 0.0003219
3-2 2.3459652 0.5367120
4-2 2.2530128 0.6357714
4-3 1.4668015 0.9985240
每家皆对於一号厂 有显着差异
其余三家差异不大
品牌
2 3 4 1
-------
--
--------------------------------------------------------
首先测试 该整体样本是否符合常态分配
https://i.imgur.com/mMbOual.jpg
恩...显着不符合
(因每配方测试重复两次 故无法使用配方shapiro test)
那弄个BOX PLOT 看看
https://i.imgur.com/l9ctfLV.jpg
https://i.imgur.com/RxfESY9.jpg
挖...这每组变异性非常大
不符合同值变异性的基本假设
看到这基本上可以判断该次测试(实验)是"失败的"
基本上结果不具参考性
解决方法----> 增加实验次数 减少测试人员数量 增加单人测试数量 轮胎控制等等
就是为了 降低误差 让资料符合检定的基本条件
这种实验是很多民调(抽样) 试验 没有统计人员会出现的事情
那...如果遮住眼睛 做了检定我们会得到甚麽结果?(所以上面看看就好)
-----------------------------------------------------------
KNN填补後资料
车手 厂牌 时间
1 1 49.43
1 1 43.77
1 2 37.95
1 2 37.42
1 3 38.82
1 3 39.63
1 4 41.42
1 4 38.73
2 1 45.47
2 1 48.96
2 2 47.85
2 2 41.68
2 3 47.12
2 3 45.79
2 4 51.55
2 4 49.07
3 1 46.29
3 1 45.72
3 2 45.99
3 2 45.27
3 3 53.76
3 3 45.68043068
3 4 41
3 4 43.02
4 1 45.8
4 1 45.06
4 2 44.30366532
4 2 44.17
4 3 44.05
4 3 42.68
4 4 43.53
4 4 42.3
5 1 50.9
5 1 51.64
5 2 45.57
5 2 46.71
5 3 44.10406845
5 3 46.89
5 4 47.8
5 4 47.92
6 1 42.62
6 1 41.28
6 2 39.53
6 2 39.69
6 3 40.05
6 3 40.03
6 4 39.83
6 4 41.2
7 1 42.25
7 1 41.83
7 2 41.2
7 2 39.05
7 3 42.3
7 3 40.92
7 4 41.15
7 4 39
8 1 44.88
8 1 42.67
8 2 43.43
8 2 39.1
8 3 38.33
8 3 37.09
8 4 37.86
8 4 37.02
9 1 45.79
9 1 43.3
9 2 39
9 2 39.26
9 3 41.5
9 3 42.18
9 4 40.10442261
9 4 40.10442261
10 1 41.99
10 1 41.52
10 2 39.17
10 2 38.57
10 3 39.52
10 3 40.19339335
10 4 46.25
10 4 39.92
--
Sent from my Windows
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.133.138.191
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/car/M.1558463163.A.26E.html
1F:推 eulbos: 快推 不然人家以为我看不懂05/22 02:46
2F:推 sm981512: 原来是这样啊 跟我想的一样05/22 02:51
3F:推 Lowpapa: 果然没错05/22 02:59
4F:推 tyrande: 这干嘛 写论文喔05/22 03:07
5F:→ Howard1984: 这就几个网友下去跑出来的数值,差异性太大了啦05/22 03:10
6F:推 jiern: 车辆是交由人类驾驶 相对会有快慢 也有很快很慢的数据 这05/22 03:16
7F:→ jiern: 种人的因素无可避免 应设定上下界限把极端值先去掉 再来看05/22 03:16
8F:→ jiern: 数据合理性统计结果 你不把极端值去掉 最好能算出漂亮的统05/22 03:16
9F:→ jiern: 计数据 你的统计学 学的真棒05/22 03:16
10F:嘘 s75830: 还在崩溃05/22 03:25
11F:推 jiern: 感觉还在崩溃 算变异数把极端值也列入 当然变异数会大 你05/22 03:27
12F:→ jiern: 统计学学成这样 还好意思来说嘴这次金卡纳测试方法不对05/22 03:27
13F:推 BMW220i: 恩 跟我想的差不多05/22 04:55
14F:推 SUZUKI5566: 统计学都还给老师了05/22 05:36
15F:→ wjw1128: 蛮无聊的05/22 07:00
17F:→ m996360: 趣味性质比较高XDDD05/22 07:08
18F:→ sai1268: 不知道为什麽写一堆数据但觉得没有很厉害?05/22 07:08
19F:推 BlackCoal: 样本数过少,无解05/22 07:11
各组处理的变异性 不同
这应该是可以控制的
20F:→ BlackCoal: 我统计被老师当掉时,我也曾经去找他抗议:「你怎麽可05/22 07:14
21F:→ BlackCoal: 以只靠单一次取样就判断我不符合及格标准?」05/22 07:14
你统计真的该被当
22F:嘘 alienslesh: 依你这样分析的话所有的赛道成绩都是个屁05/22 07:25
如果你要验证某牌比较慢
这些都是基本要达到的条件
23F:→ sammy98: 变异值大 叫做失败的话 统计学看来你也要重修了05/22 07:30
24F:→ sammy98: 你可以叫一个百米世界纪录的人 跑个20-50次 然後告诉他05/22 07:32
25F:→ sammy98: 你的世界纪录 「没有监别度」 ~05/22 07:32
看不懂你想表达什麽
建议你重修
26F:推 torosome: 以後也不用比赛赛车 直接数据打一打就好05/22 07:36
看不懂你想表达什麽
※ 编辑: s90720eric (220.133.138.191), 05/22/2019 07:46:42
※ 编辑: s90720eric (220.133.138.191), 05/22/2019 07:54:06
27F:推 HeartBreaker: 实验设计还是要讨论一下成本跟时间啦 况且01的测试 05/22 07:53
28F:→ HeartBreaker: 根本没从实验设计的角度去设计啊-.- 05/22 07:53
对
当然
只是这样就无法真正比较是不是车款影响
29F:→ sammy98: 我也不懂你想表达什麽05/22 07:54
来
你的世界冠军跑步秒数的变异数
是不是跟别其他组 差距过大
整体跑步成绩是否接近常态
因子个数几个? 固定?随机?
残差分布如何
试验的前提
30F:推 lucky945: 风向不对 如果今天神A跑最慢 说实验失败就会被推爆了 05/22 07:54
31F:→ KAOGUY0617: 我4真的看不懂 我也觉得那只贼应该第一 赞赞赞 05/22 07:57
我也很讨厌台湾保时捷ZZ
※ 编辑: s90720eric (220.133.138.191), 05/22/2019 08:05:19
32F:→ sammy98: 请用统计资料 水在-100~200温度下的物理现象说明 只会达05/22 08:05
33F:→ sammy98: 到P值大於0.05 难道你要告诉大家「水是假的」? 05/22 08:05
你的样本资料?
你真的懂这p-vaule代表什麽吗?
不要乱用 拜托去读点书再来
※ 编辑: s90720eric (220.133.138.191), 05/22/2019 08:12:08
34F:推 chinya51: 跟我想得差不多,给推 05/22 08:35
35F:→ showingstar: 无效是「不足成为模型参数」? 然而相对参考参考性是05/22 08:46
36F:→ showingstar: 有的05/22 08:46
不是 是进行检定的前提就不符合了
如果不是常态分配 是奇怪某分配
那麽进行检定就没有意义
这次
Normality assumption 是在於 conditional distribution of y given 车辆
这是必须的
当然可以单纯看高低 只是很难下说 他跟其他组是有所不同的结论
※ 编辑: s90720eric (114.136.57.191), 05/22/2019 09:11:45
37F:推 powercold: 推,这实验的人为因素变动太大,秒数差异太多,应该由 05/22 09:07
38F:→ powercold: 专业车手来开,让人为因素降低再来评断 05/22 09:08
人为可以有变动
但应该要每个人的变动幅度差不多这样
39F:推 pirateboris: 推05/22 09:09
40F:推 playone1: 在用anova前,可以先用k-w检定变异数是否同质喔05/22 09:13
41F:→ playone1: 也许不能用anova 05/22 09:13
你没拉到下面XD
我用Bartlett test
※ 编辑: s90720eric (114.136.57.191), 05/22/2019 09:16:21
42F:推 playone1: 说错,是anova和k-w检定取其一 05/22 09:15
43F:→ playone1: Leven test 才是检定变异数 05/22 09:16
44F:→ m996360: 你把驾驶者的测试成绩依照驾驶顺序排列,然後剔除S5,就 05/22 09:35
45F:→ m996360: 会发现几乎全部驾驶者的成绩每趟都在缩短,这说明多数网 05/22 09:36
46F:→ m996360: 友还在适应场地跟车子,测试其实还未收敛 05/22 09:36
48F:→ m996360: 大概会像这样,这测试方法比较像评人而不是评车 05/22 09:44
49F:→ OrzOGC: 乡民又在浪费才能了... 05/22 09:58
50F:推 joson4921: 01今天早上有发另一篇金卡那测试,是後来补测的那场, 05/22 10:13
51F:→ joson4921: 里面有教练跟01编辑的成绩 05/22 10:13
52F:推 applesck: 可惜补评测没ES 05/22 10:15
53F:推 kokunmai: 推m996360 05/22 10:16
54F:推 eson031545: 样本数过少用拔靴法看看 05/22 10:20
55F:推 Madao0149: 最佳解不就是四个人随机开来取样吗? 05/22 10:29
56F:嘘 Scape: 你只是为了统计分析而分析,一开始结论就说人家的测试失败 05/22 11:12
57F:→ Scape: 你要说人家测试失败也该是把以前跑过同样金卡纳测试的成绩 05/22 11:12
58F:→ Scape: 列入,比较过後说这次成绩偏差太多才能说这次测试结果失败 05/22 11:13
59F:→ xdctjh: 说中文? 05/22 11:14
60F:推 Number9527: 这简单 我早就知道了 05/22 11:55
61F:推 Cach252: 这分析 可以! 有要找後面的原因吗? 05/22 14:33
62F:推 TaiwanNeko: 车就是给人开的啊... 05/22 20:27
63F:→ TaiwanNeko: 今天如果是全自动驾驶,再来排除人为因素吧... 05/22 20:27