單因子變異數分析(One Way ANOVA)
我們經常使用統計來檢定兩個母體的平均數是否相同,但是若同時要比較多個母體,擇必
須兩兩比較,如此非常的耗時且過程複雜。ANOVA 是Analysis Of Variances的縮寫,是
由R. A. Fisher所提出的統計方法,可解決同時檢定兩個或兩個以上樣本平均數的顯著性
。變異數分析可運用的領域非常的廣泛,同樣以官方學習R不錯的電子書-SimpleR Using
R for Introductory Statistics (作者John Verzani),第89頁(資料在90頁)的例子來用
Rcmdr做分析吧!!
一樣先建立我們所要的資料(資料輸入方法),資料是一個學校所聘請來的評審,要對於某
樣東西進行評分,而要確保這些評審所給的分數標準是一樣的,才不至於造成不公平的現
象,因此必須必較多個評審所做的評分是否有所差異,確認其所給的分數是同樣的評分標
準。作者沒有使用全部的資料,是節錄了3個評審各7個資料,輸入一下吧(圖1)!!
圖1、資料輸入(SimpleR Using R for Introductory Statistics:90頁)
一開始所鍵入資料,在Rcmdr中建立的資料是分開的三筆(三個物件),現在我們要將各
筆資料集中在scores的物件下,這樣我們才可以同時進行三個評審的變異數分析檢定,到
命令列->資料->動作資料->stack variables in active data set(圖2),會出現圖3的對
話框,將集成的資料集命名(Name for stacked data set)為scores,變數名稱(Name
for Variable)依照90頁取名為values,因子(Name for factor)則叫做ind,這些動作完
成後我們就可以進行單因子變異數分析囉!!
圖2、將各筆資料集中成一個物件,到命令列->資料->動作資料->stack variables in
active data set。
圖3、集成的資料集對話框。
在進行變異數分析前,我們要先將資料進行模式配適(圖4、亦即統計建模),模式配適
,命令列->統計->模式配適->直線模式。變異數分析用以比較兩個或兩個以上的樣本平均
數差異,如果使用T檢定的方式兩兩比較,可能會徒增一型(Type I error)與二型(
Type II error)誤差的可能性,因此必須用以嚴苛的條件限制,才能避免誤差在進行分
析時無謂的增加。直線配適的對話框中,模式(Formula)中用滑鼠左鍵雙擊選取values ~
ind(圖5),接著按下OK鍵,模式配適的工作就完成啦。這次主題的主角,變異數分析
(One Way ANOVA),命令列->模式分析->假說檢定->變異數分析(ANOVA table)(圖6)。接
著在輸出視窗中,就可以看到變異數分析的結果,來解讀一下吧!! ANOVA table顯示ind
與殘差的Sum sq.分別為1.75與16.25,變異數檢定的F直為1.1308,P值為0.3417>顯著性
水準(α=0.05) (圖7),因此接受虛無假設,三組資料是擁有相同的平均值,亦即評審所
給的分數標準是一樣的。
圖4、模式配適,命令列->統計->模式配適->直線模式。
圖5、直線模式配適視窗,建立values ~ ind模式。
圖6、命令列->模式分析->假說檢定->變異數分析(ANOVA table)。
圖7、ANOVA table。
Yearend
--
plurk
http://www.plurk.com/dasea2030
face book
0963593047,0984262714
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.58.22.74
※ 編輯: dasea2008 (210.66.169.48 臺灣), 07/07/2022 04:23:21
※ 編輯: dasea2008 (210.66.169.48 臺灣), 04/25/2023 18:28:50