作者milk0925 (牛奶刺蝟)
看板Statistics
標題[問題] 大樣本但常態檢定達顯著,T檢定適用嗎?
時間Thu Dec 10 12:09:26 2015
這位版上的統計先進大家好,
由於我最近幫老闆執行研究時對某一部份的統計分析方式產生疑惑,
因此想來版上尋求各位的幫忙。
是這樣的,
我目前幫我老闆執行統計分析的這項研究總共回收到約1100份左右的有效問卷,
但是由於老闆在他的科技部研究計畫中寫到會用T檢定,
但T檢定的前提假設之一是「資料結構」必須要符合常態分配,
於是我就遇到了以下的問題:
1.當我先對所收集來的樣本進行常態檢定時,發現樣本非常態,
也就是我的樣本在次數分配上是有顯著偏態的,
但是通常母數統計法有假定當樣本很大的時候,
通常所抽取到的樣本在分配上會接近常態(依據中央極限定理),
但就目前的樣本數應該算是大的了,
但資料結構依舊非常態,
所以我在想所謂的常態分配假定是基於抽取到的樣本檢定後發現樣本為常態,
然後可以依此推到其母群的資料結構應該也是呈常態分配,
因而允許使用母數統計法嗎?
還是只要樣本數大不管是否呈常態分配都可以假定母群為常態?
2.而當發現樣本非常態,
照理說這時我換成無母數統計中的Mann-Whitney可能會比較適切,
但是如果目前的樣本狀況都符合所有使用母數統計法的前提假定,
那麼就我綜合了在書本上以及網路上的資料資後,
我得到的結論是,大樣本的時候相較於T檢定,Z檢定更為適切,
但由於樣本數大於30時,T分配與Z分配十分接近,
因此使用T檢定其實已經涵蓋了Z檢定的應用,
請為我這樣的觀念是正確的嗎?
先謝謝大家幫我解惑!
如果有任何在解答上尚缺乏的資訊經反映後我會盡快再補上來。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.171.60.233
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1449720570.A.BE8.html
1F:→ sean50301: n大於30不一定大樣本, t分配自由度趨近無窮其實會收斂 12/10 13:08
2F:→ sean50301: 到z分配 12/10 13:08
3F:→ sean50301: 母體分配不一定是常態,任意分配都可以,會漸近常態是 12/10 13:14
4F:→ sean50301: 根據中央極限定理 12/10 13:14
5F:推 Pieteacher: 要考量 收斂速度吧 12/10 14:31
6F:→ milk0925: 所以意思是實際上我們在採用母數統計的方法時,我們都只 12/10 16:45
7F:→ milk0925: 是「假定」母群體為常態嗎? 12/10 16:46
8F:→ milk0925: 所以我的樣本目前檢定出來非常態是因為樣本還不夠大嗎? 12/10 16:47
9F:→ milk0925: 還是表示我的母群體可能實際上並不是常態分配?(←我個 12/10 16:48
10F:→ milk0925: 人就考量老闆這項研究計畫的性質和研究設計等等的因素, 12/10 16:49
11F:→ milk0925: 我覺得母群體可能真的並非常態分配,那如果真是這樣的話 12/10 16:50
12F:→ milk0925: 請問我應該怎麼做會比較適切?) 12/10 16:51
13F:推 sean50301: 檢定出來不是常態硬是假設常態感覺不太好… 某些統計軟 12/10 17:21
14F:→ sean50301: 體好像有distribution fitting的功能XD 12/10 17:21
15F:→ celestialgod: 常態檢定的Power........ 12/10 17:33
16F:推 Chsieh: CLT有一些假設存在的,不然你去觀察死亡率樣本再大都不會 12/10 19:10
17F:→ Chsieh: 是常態分配..。 12/10 19:10
18F:→ milk0925: 所以這樣的情況還是會建議使用無母數法比較好嗎? 12/10 21:13
19F:→ milk0925: 因為當初我雖然知道T-test在無母數的替代方式,但是老闆 12/10 21:15
20F:→ milk0925: 會在計畫上寫使用T-test我想也有他的期待... 12/10 21:16
21F:→ milk0925: 我現在改用無母數感覺就是推翻了他... 12/10 21:17
22F:→ allen1985: 也許可以先對資料做一些轉換 讓資料像常態一點 12/11 11:15
23F:→ allen1985: 另外去了解一下 資料會偏的原因在哪 例如 很多0 12/11 11:16
24F:→ allen1985: 這時候就可以思考 這些0怎麼產生的 12/11 11:16
25F:→ andrew43: 因為計畫書寫A方法但最後改用較合理的B方法怎麼會想成 12/11 19:15
26F:→ andrew43: 打老闆臉呢?你多慮了。 12/11 19:15
27F:→ andrew43: 另外,母體常態和大樣本的樣本平均是不是常態是二回事。 12/11 19:17
28F:→ yhliu: 關於非常態群體時 t 檢定的適用性, 與 t 自由度 30 以上時 12/11 19:49
29F:→ yhliu: 接近 z 並無關係. 究竟是否適用 t 檢定, 關鍵是能否引用中 12/11 19:50
30F:→ yhliu: 央極限定理. 對於一般隨機抽樣調查, 樣本數不是很小, 除非 12/11 19:51
31F:→ yhliu: 群體很特殊, 例如非常偏斜, 否則 t 檢定通常是可用的. 12/11 19:52
32F:→ yhliu: 可參考 telnet://bs2.to:443 之 Statistics 版 12/11 19:54
33F:→ yhliu: 4 --> 10 --> 18 關於 t 推論的 "rule of thumb" 12/11 19:55
34F:推 excimo: 反過來說我是不是可以不管常態檢定 全部都用Mann Whitney? 12/11 20:51
35F:推 goshfju: 推yhliu 12/12 00:50
36F:→ milk0925: 謝謝版上的大家這麼熱心替我解惑,不過為了確認我的理解 12/12 16:39
37F:→ milk0925: 是否是正確的,請容許我用我的話說出我的理解 12/12 16:40
38F:→ milk0925: 所以中央極限定理指的常態分佈其實是「樣本」(母群子集 12/12 16:42
39F:→ milk0925: 合)在達到30的時候,從這30個樣本所求得的整體平均數會 12/12 16:43
40F:→ milk0925: 呈常態分配,而不是只我們隨機取樣30的受試者或30筆資料 12/12 16:44
41F:→ milk0925: 其數值分配通常就會呈常態。不曉得我這樣的理解是否是對 12/12 16:45
42F:→ milk0925: 的? 12/12 16:45
43F:→ milk0925: 不好意思,因為我對圖形的理解會比抽樣概念好,所以剛剛 12/12 16:47
44F:→ milk0925: 我在網路上google到一張圖時瞬間理解中央極限定理的概念 12/12 16:49
45F:→ milk0925: 雖然我覺得那張圖真的呈現的很好,很想放上來跟大家分享 12/12 16:50
46F:→ milk0925: 但是要送出訊息時,網址被判定為可能違反規定,所以作罷 12/12 16:51
47F:→ milk0925: 另外還想請問yhliu大,所以您的意思是因為我的樣本數已 12/12 17:25
48F:→ milk0925: 達到roughly n≧40,所以即便我現在用SPSS的 analyze→ 12/12 17:27
49F:→ milk0925: descriptive statistics → explore → Normality plots 12/12 17:28
50F:→ milk0925: with tests結果達顯著,我依舊可以使用t-test嗎? 12/12 17:28
51F:→ milk0925: 補充:老闆的研究確實算是一般抽樣調查,只是我有點擔心 12/12 18:22
52F:→ milk0925: 在臺灣文化脈絡底下接受研究中所設定的議題調查,可能 12/12 18:22
53F:→ milk0925: 原本就存在分布偏態。 12/12 18:22
54F:→ andrew43: 樣本數30的平均就可引用CLT,從來就沒這回事。 12/13 03:19
55F:→ andrew43: 如果資料很偏,那n=500可能都不夠。 12/13 03:20
56F:→ andrew43: 如果樣本真的很大,t-test可以用,無論原本資料是否常態 12/13 03:23
57F:→ andrew43: 這是基於CLT沒錯,但不是n=30就成立。 12/13 03:24
58F:→ milk0925: 原來從以前我就一直誤會這樣的概念,現在才學會... 12/13 11:38
59F:→ milk0925: 所以看來依照我目前有的樣本數和樣本資料結構的常態檢定 12/13 11:38
60F:→ milk0925: 結果,我還是援用無母數統計方法比較保險囉? 12/13 11:40