作者laura123 (朵兒)
看板Statistics
標題[問題] ANOVA變異數不同質的處理
時間Mon Aug 28 19:30:13 2023
各位版友大家好~
想請教一個有關ANOVA變異數不同質的處理方式
我有先在網路上檢索,也查閱過相關書籍
相關的處理作法有2種:
一、Brown-Forsythe + Games-Howell事後比較
再跑一次ANOVA,但在SPSS的﹝Options﹞中勾選Brown-Forsythe或Welch統計量,
來檢定平均數(Robust Tests of Equality of Means)。
二者都服從F分配,且不需變異數同質性假設。
當顯著時,再以Games-Howell進行事後比較(Post hoc)。
-->結果:Brown-Forsythe檢定結果為.039達到顯著,
但變異數分析P值未達顯著,奇怪的是,事後檢定也有數個彼組別此間有差異。
二、做資料轉換
書中講的轉換方式是對原始資料開根號
我按照書中轉換完成重新跑出來的分析結果
Levene 統計量為.53未達顯著
-->結果:進一步看ANOVA發現P值是.89未達顯著,事後比較各組別也未達顯著。
#我的疑惑:
(一)用兩種方式跑出來的結果不一致,不知道該用哪一種才正確?
(二)如果寫第二種資料轉換,我發現它的平均值因為開根號的關係也被開根號了,
我在論文呈現時應該寫開根號後的平均值嗎?
(三)第一種方式Brown-Forsythe達到顯著,但變異數分析那個表又未達顯著,
事後檢定又是有好幾組之間有差異,這是正常的嗎?在論文中我又應該如何呈現呢?
以上幾個問題還請版上的前輩及大師們協助解惑了,感謝大家~~
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.122.53.37 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1693222215.A.5FC.html
1F:→ yhliu: (1) 不一致很正常,但你的結果並未不一致,兩種方法的多群 08/29 08:24
2F:→ yhliu: 體平均數間總體檢定都是不顯著,不是嗎? 08/29 08:25
3F:→ yhliu: (2) "事後比較" 是總體平均數間差異顯著時才進一步檢查哪些 08/29 08:29
4F:→ yhliu: 平均數之間的差異具顯著性,Games Howell 是變異數不等 08/29 08:31
5F:→ yhliu: 時把本來不是 t 分布的兩獨立樣本平均數差之標準化量強 08/29 08:32
6F:→ yhliu: 以 t 分布近似,相當於變異數相等時的最小顯著差法,本 08/29 08:34
7F:→ yhliu: 質上是忽略多群體間比較的性質,不像 Scheffe 或 Tuky 08/29 08:35
8F:→ yhliu: 法本身已考慮到多群體間比較(因此不需總體檢定顯著可用 08/29 08:37
9F:→ yhliu: 變數轉換法本質上是假設變異數和平均數是相關的,但如果變 08/29 08:41
10F:→ yhliu: 異數之不同並非因平均數之不同,則經變數轉換後可能扭曲 08/29 08:42
11F:→ yhliu: 資料。故以你的結果來說,群體間變異數的不同並非因平均 08/29 08:46
12F:→ yhliu: 數不同所致,而平均數間差異總體而言並不顯著;若懷疑是 08/29 08:48
13F:→ yhliu: 否其實某些群體之間仍是有差異,需考慮類似 Scheffe 或 08/29 08:49
14F:→ yhliu: Tukey 法這類本身就考慮到多群體比較的方法。不過,如 08/29 08:52
15F:→ yhliu: Scheffe 法是把總體比較的平方和集中在成對平均數間比較 08/29 08:53
16F:→ yhliu: 上,所以若總體(ANOVA))檢定不顯著,任一對平均數間之 08/29 08:55
17F:→ yhliu: Scheffe 檢定也應不顯著。 08/29 08:55
18F:推 tmtm39: 藉題請教,當資料非呈常態及不滿足變異數同質性時,可以 08/30 22:49
19F:→ tmtm39: 改用Kruskal-Wallis或Moods檢定中位數,也看過一個說法是 08/30 22:49
20F:→ tmtm39: 當資料量足夠時,即使不滿足常態跟變異數同質性,繼續用AN 08/30 22:49
21F:→ tmtm39: OVA也仍然有足夠的檢定功效,請教實務上應用的判斷邏輯跟 08/30 22:50
22F:→ tmtm39: 使用時機? 08/30 22:50
23F:→ yhliu: ANOVA 的平均數間 F 檢定只是兩組平均數間 t 檢定擴充至多 08/31 08:25
24F:→ yhliu: 組平均數的結果,記得 t^2 = F, 也就是 t 變量的平方即是分 08/31 08:27
25F:→ yhliu: 子自由度是 1 的 F 變量。由於 t 檢定對群體常態性的穩健性 08/31 08:28
26F:→ yhliu: 只要群體分布不是乖離常態性太嚴重(如偏態嚴重或峰度太高) 08/31 08:30
27F:→ yhliu: 各組樣本不是太小,各組群體變異數相等,t 檢定以及ANOVA 08/31 08:32
28F:→ yhliu: 的 F 檢定仍是可用的。至於各群體變異數不等的問題,在 t 08/31 08:33
29F:→ yhliu: 檢定是用所謂 Welch t 檢定,實際上也就是分母用正確的樣本 08/31 08:35
30F:→ yhliu: 平均數差的標準誤,而自由度就是把樣本平均數差的變異數估 08/31 08:37
31F:→ yhliu: 計式近似一個 scaled chi-square; 在 ANOVA 的 F 檢定也有 08/31 08:40
32F:→ yhliu: 類似方法,細節我不記得了,不知仍用原來的誤差平方和或有 08/31 08:42
33F:→ yhliu: 修改。不管如何,此時處理平方和和誤差平方和都不是卡方變 08/31 08:44
34F:→ yhliu: 量,用 Satterthwaite 近似一個 scaled chi-square,而後可 08/31 08:45
35F:→ yhliu: 以把ANOVA檢定統計量近似 F 分布。Satterthwaite-Welch 方 08/31 08:51
36F:→ yhliu: 法只是一個近似方法,只是被認為 "還不錯", 也可能有其他不 08/31 08:52
37F:→ yhliu: 做資料轉換也非 Welch 的方法。不過,在變異數似乎依平均數 08/31 08:54
38F:→ yhliu: 而變時採用變異數穩定性轉換,在群體非常態(兼變異數不等) 08/31 08:56
39F:→ yhliu: 時採用 Box-Cox 類常態化變換,可能是最常用的方法?至於 08/31 08:57
40F:→ yhliu: 改用無母數方法,主耍是適用於非常態群體,至於分散度異質 08/31 08:59
41F:→ yhliu: 性問題,在無母數中方法中可能仍然是個問題,使用時仍需看 08/31 09:00
42F:→ yhliu: 看該方法有什麼假設條件,你的資料是否符合。 08/31 09:02