作者s90720eric (SkySI)
看板car
標題[討論] 用基礎統計看 01金卡納測試
時間Wed May 22 02:26:01 2019
因為找不到測試本文
就用板友提供的圖片當作樣本資料
首先用R的KNN機器學習 填補遺失值
命名成RE
這次的試驗由於是實驗設計 適用ANOVA分析
*contrast利用helmert編成
*使用type3 SS
檢定結果
Pr(>F)
(Intercept) < 2.2e-16 ***
re$車手 2.034e-12 ***
re$廠牌 6.764e-06 ***
re$車手:re$廠牌 0.004231 ***
車手 跟 廠牌皆顯著對於實驗時間有影響(車再好也會被人劇烈影響)
車手跟廠牌之間也不獨立(廠牌情節?)
https://i.imgur.com/JPtKUAx.jpg
TukeyHSD 看有興趣的廠牌部分
upr p adj
2-1 -1.7530629 0.0000074
3-1 -0.9668515 0.0005248
4-1 -1.0598039 0.0003219
3-2 2.3459652 0.5367120
4-2 2.2530128 0.6357714
4-3 1.4668015 0.9985240
每家皆對於一號廠 有顯著差異
其餘三家差異不大
品牌
2 3 4 1
-------
--
--------------------------------------------------------
首先測試 該整體樣本是否符合常態分配
https://i.imgur.com/mMbOual.jpg
恩...顯著不符合
(因每配方測試重複兩次 故無法使用配方shapiro test)
那弄個BOX PLOT 看看
https://i.imgur.com/l9ctfLV.jpg
https://i.imgur.com/RxfESY9.jpg
挖...這每組變異性非常大
不符合同值變異性的基本假設
看到這基本上可以判斷該次測試(實驗)是"失敗的"
基本上結果不具參考性
解決方法----> 增加實驗次數 減少測試人員數量 增加單人測試數量 輪胎控制等等
就是為了 降低誤差 讓資料符合檢定的基本條件
這種實驗是很多民調(抽樣) 試驗 沒有統計人員會出現的事情
那...如果遮住眼睛 做了檢定我們會得到甚麼結果?(所以上面看看就好)
-----------------------------------------------------------
KNN填補後資料
車手 廠牌 時間
1 1 49.43
1 1 43.77
1 2 37.95
1 2 37.42
1 3 38.82
1 3 39.63
1 4 41.42
1 4 38.73
2 1 45.47
2 1 48.96
2 2 47.85
2 2 41.68
2 3 47.12
2 3 45.79
2 4 51.55
2 4 49.07
3 1 46.29
3 1 45.72
3 2 45.99
3 2 45.27
3 3 53.76
3 3 45.68043068
3 4 41
3 4 43.02
4 1 45.8
4 1 45.06
4 2 44.30366532
4 2 44.17
4 3 44.05
4 3 42.68
4 4 43.53
4 4 42.3
5 1 50.9
5 1 51.64
5 2 45.57
5 2 46.71
5 3 44.10406845
5 3 46.89
5 4 47.8
5 4 47.92
6 1 42.62
6 1 41.28
6 2 39.53
6 2 39.69
6 3 40.05
6 3 40.03
6 4 39.83
6 4 41.2
7 1 42.25
7 1 41.83
7 2 41.2
7 2 39.05
7 3 42.3
7 3 40.92
7 4 41.15
7 4 39
8 1 44.88
8 1 42.67
8 2 43.43
8 2 39.1
8 3 38.33
8 3 37.09
8 4 37.86
8 4 37.02
9 1 45.79
9 1 43.3
9 2 39
9 2 39.26
9 3 41.5
9 3 42.18
9 4 40.10442261
9 4 40.10442261
10 1 41.99
10 1 41.52
10 2 39.17
10 2 38.57
10 3 39.52
10 3 40.19339335
10 4 46.25
10 4 39.92
--
Sent from my Windows
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.133.138.191
※ 文章網址: https://webptt.com/m.aspx?n=bbs/car/M.1558463163.A.26E.html
1F:推 eulbos: 快推 不然人家以為我看不懂05/22 02:46
2F:推 sm981512: 原來是這樣啊 跟我想的一樣05/22 02:51
3F:推 Lowpapa: 果然沒錯05/22 02:59
4F:推 tyrande: 這幹嘛 寫論文喔05/22 03:07
5F:→ Howard1984: 這就幾個網友下去跑出來的數值,差異性太大了啦05/22 03:10
6F:推 jiern: 車輛是交由人類駕駛 相對會有快慢 也有很快很慢的數據 這05/22 03:16
7F:→ jiern: 種人的因素無可避免 應設定上下界限把極端值先去掉 再來看05/22 03:16
8F:→ jiern: 數據合理性統計結果 你不把極端值去掉 最好能算出漂亮的統05/22 03:16
9F:→ jiern: 計數據 你的統計學 學的真棒05/22 03:16
10F:噓 s75830: 還在崩潰05/22 03:25
11F:推 jiern: 感覺還在崩潰 算變異數把極端值也列入 當然變異數會大 你05/22 03:27
12F:→ jiern: 統計學學成這樣 還好意思來說嘴這次金卡納測試方法不對05/22 03:27
13F:推 BMW220i: 恩 跟我想的差不多05/22 04:55
14F:推 SUZUKI5566: 統計學都還給老師了05/22 05:36
15F:→ wjw1128: 蠻無聊的05/22 07:00
17F:→ m996360: 趣味性質比較高XDDD05/22 07:08
18F:→ sai1268: 不知道為什麼寫一堆數據但覺得沒有很厲害?05/22 07:08
19F:推 BlackCoal: 樣本數過少,無解05/22 07:11
各組處理的變異性 不同
這應該是可以控制的
20F:→ BlackCoal: 我統計被老師當掉時,我也曾經去找他抗議:「你怎麼可05/22 07:14
21F:→ BlackCoal: 以只靠單一次取樣就判斷我不符合及格標準?」05/22 07:14
你統計真的該被當
22F:噓 alienslesh: 依你這樣分析的話所有的賽道成績都是個屁05/22 07:25
如果你要驗證某牌比較慢
這些都是基本要達到的條件
23F:→ sammy98: 變異值大 叫做失敗的話 統計學看來你也要重修了05/22 07:30
24F:→ sammy98: 你可以叫一個百米世界紀錄的人 跑個20-50次 然後告訴他05/22 07:32
25F:→ sammy98: 你的世界紀錄 「沒有鑑別度」 ~05/22 07:32
看不懂你想表達什麼
建議你重修
26F:推 torosome: 以後也不用比賽賽車 直接數據打一打就好05/22 07:36
看不懂你想表達什麼
※ 編輯: s90720eric (220.133.138.191), 05/22/2019 07:46:42
※ 編輯: s90720eric (220.133.138.191), 05/22/2019 07:54:06
27F:推 HeartBreaker: 實驗設計還是要討論一下成本跟時間啦 況且01的測試 05/22 07:53
28F:→ HeartBreaker: 根本沒從實驗設計的角度去設計啊-.- 05/22 07:53
對
當然
只是這樣就無法真正比較是不是車款影響
29F:→ sammy98: 我也不懂你想表達什麼05/22 07:54
來
你的世界冠軍跑步秒數的變異數
是不是跟別其他組 差距過大
整體跑步成績是否接近常態
因子個數幾個? 固定?隨機?
殘差分佈如何
試驗的前提
30F:推 lucky945: 風向不對 如果今天神A跑最慢 說實驗失敗就會被推爆了 05/22 07:54
31F:→ KAOGUY0617: 我4真的看不懂 我也覺得那隻賊應該第一 讚讚讚 05/22 07:57
我也很討厭台灣保時捷ZZ
※ 編輯: s90720eric (220.133.138.191), 05/22/2019 08:05:19
32F:→ sammy98: 請用統計資料 水在-100~200溫度下的物理現象說明 只會達05/22 08:05
33F:→ sammy98: 到P值大於0.05 難道你要告訴大家「水是假的」? 05/22 08:05
你的樣本資料?
你真的懂這p-vaule代表什麼嗎?
不要亂用 拜託去讀點書再來
※ 編輯: s90720eric (220.133.138.191), 05/22/2019 08:12:08
34F:推 chinya51: 跟我想得差不多,給推 05/22 08:35
35F:→ showingstar: 無效是「不足成為模型參數」? 然而相對參考參考性是05/22 08:46
36F:→ showingstar: 有的05/22 08:46
不是 是進行檢定的前提就不符合了
如果不是常態分配 是奇怪某分配
那麼進行檢定就沒有意義
這次
Normality assumption 是在於 conditional distribution of y given 車輛
這是必須的
當然可以單純看高低 只是很難下說 他跟其他組是有所不同的結論
※ 編輯: s90720eric (114.136.57.191), 05/22/2019 09:11:45
37F:推 powercold: 推,這實驗的人為因素變動太大,秒數差異太多,應該由 05/22 09:07
38F:→ powercold: 專業車手來開,讓人為因素降低再來評斷 05/22 09:08
人為可以有變動
但應該要每個人的變動幅度差不多這樣
39F:推 pirateboris: 推05/22 09:09
40F:推 playone1: 在用anova前,可以先用k-w檢定變異數是否同質喔05/22 09:13
41F:→ playone1: 也許不能用anova 05/22 09:13
你沒拉到下面XD
我用Bartlett test
※ 編輯: s90720eric (114.136.57.191), 05/22/2019 09:16:21
42F:推 playone1: 說錯,是anova和k-w檢定取其一 05/22 09:15
43F:→ playone1: Leven test 才是檢定變異數 05/22 09:16
44F:→ m996360: 你把駕駛者的測試成績依照駕駛順序排列,然後剔除S5,就 05/22 09:35
45F:→ m996360: 會發現幾乎全部駕駛者的成績每趟都在縮短,這說明多數網 05/22 09:36
46F:→ m996360: 友還在適應場地跟車子,測試其實還未收斂 05/22 09:36
48F:→ m996360: 大概會像這樣,這測試方法比較像評人而不是評車 05/22 09:44
49F:→ OrzOGC: 鄉民又在浪費才能了... 05/22 09:58
50F:推 joson4921: 01今天早上有發另一篇金卡那測試,是後來補測的那場, 05/22 10:13
51F:→ joson4921: 裡面有教練跟01編輯的成績 05/22 10:13
52F:推 applesck: 可惜補評測沒ES 05/22 10:15
53F:推 kokunmai: 推m996360 05/22 10:16
54F:推 eson031545: 樣本數過少用拔靴法看看 05/22 10:20
55F:推 Madao0149: 最佳解不就是四個人隨機開來取樣嗎? 05/22 10:29
56F:噓 Scape: 你只是為了統計分析而分析,一開始結論就說人家的測試失敗 05/22 11:12
57F:→ Scape: 你要說人家測試失敗也該是把以前跑過同樣金卡納測試的成績 05/22 11:12
58F:→ Scape: 列入,比較過後說這次成績偏差太多才能說這次測試結果失敗 05/22 11:13
59F:→ xdctjh: 說中文? 05/22 11:14
60F:推 Number9527: 這簡單 我早就知道了 05/22 11:55
61F:推 Cach252: 這分析 可以! 有要找後面的原因嗎? 05/22 14:33
62F:推 TaiwanNeko: 車就是給人開的啊... 05/22 20:27
63F:→ TaiwanNeko: 今天如果是全自動駕駛,再來排除人為因素吧... 05/22 20:27