单因子变异数分析(One Way ANOVA)
我们经常使用统计来检定两个母体的平均数是否相同,但是若同时要比较多个母体,择必
须两两比较,如此非常的耗时且过程复杂。ANOVA 是Analysis Of Variances的缩写,是
由R. A. Fisher所提出的统计方法,可解决同时检定两个或两个以上样本平均数的显着性
。变异数分析可运用的领域非常的广泛,同样以官方学习R不错的电子书-SimpleR Using
R for Introductory Statistics (作者John Verzani),第89页(资料在90页)的例子来用
Rcmdr做分析吧!!
一样先建立我们所要的资料(资料输入方法),资料是一个学校所聘请来的评审,要对於某
样东西进行评分,而要确保这些评审所给的分数标准是一样的,才不至於造成不公平的现
象,因此必须必较多个评审所做的评分是否有所差异,确认其所给的分数是同样的评分标
准。作者没有使用全部的资料,是节录了3个评审各7个资料,输入一下吧(图1)!!
图1、资料输入(SimpleR Using R for Introductory Statistics:90页)
一开始所键入资料,在Rcmdr中建立的资料是分开的三笔(三个物件),现在我们要将各
笔资料集中在scores的物件下,这样我们才可以同时进行三个评审的变异数分析检定,到
命令列->资料->动作资料->stack variables in active data set(图2),会出现图3的对
话框,将集成的资料集命名(Name for stacked data set)为scores,变数名称(Name
for Variable)依照90页取名为values,因子(Name for factor)则叫做ind,这些动作完
成後我们就可以进行单因子变异数分析罗!!
图2、将各笔资料集中成一个物件,到命令列->资料->动作资料->stack variables in
active data set。
图3、集成的资料集对话框。
在进行变异数分析前,我们要先将资料进行模式配适(图4、亦即统计建模),模式配适
,命令列->统计->模式配适->直线模式。变异数分析用以比较两个或两个以上的样本平均
数差异,如果使用T检定的方式两两比较,可能会徒增一型(Type I error)与二型(
Type II error)误差的可能性,因此必须用以严苛的条件限制,才能避免误差在进行分
析时无谓的增加。直线配适的对话框中,模式(Formula)中用滑鼠左键双击选取values ~
ind(图5),接着按下OK键,模式配适的工作就完成啦。这次主题的主角,变异数分析
(One Way ANOVA),命令列->模式分析->假说检定->变异数分析(ANOVA table)(图6)。接
着在输出视窗中,就可以看到变异数分析的结果,来解读一下吧!! ANOVA table显示ind
与残差的Sum sq.分别为1.75与16.25,变异数检定的F直为1.1308,P值为0.3417>显着性
水准(α=0.05) (图7),因此接受虚无假设,三组资料是拥有相同的平均值,亦即评审所
给的分数标准是一样的。
图4、模式配适,命令列->统计->模式配适->直线模式。
图5、直线模式配适视窗,建立values ~ ind模式。
图6、命令列->模式分析->假说检定->变异数分析(ANOVA table)。
图7、ANOVA table。
Yearend
--
plurk
http://www.plurk.com/dasea2030
face book
0963593047,0984262714
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.58.22.74
※ 编辑: dasea2008 (210.66.169.48 台湾), 07/07/2022 04:23:21
※ 编辑: dasea2008 (210.66.169.48 台湾), 04/25/2023 18:28:50