重复量测变异数分析
重复量测变异数分析的概念 | 资料键入格式 | proc GLM univariate test |
其他 proc NLIN 相关的统计: |
本练习题将学习
将 SAS 资料档 (*.sas7bdat) 输出至 output 视窗
输出版面的各参数的设定
--------------------------------------------------------------------------------
重复量测变异数分析的概念
使用状况
如果在不同时间点 (different times) 或同时间点不同状况 (different conditions),
量测同一个事件或物体,且其对应值是连续 (continuous),则采用重复量测变异数分析
。因两两量测间具有非独立事件 (dependent) 的特性,会相互影响,故不可以使用变异
数分析 (ANOVA)。 例如: 练习一的不同方向前伸研究,对同一受试者而言,有四个不同
前伸方向的最大前伸距离,若要分析四个方向的最大前伸距离是否具有差异,则采用重复
量测变异数分析。
检测假说 (Hypothesis testing)
重复量测变异数分析检测假说在於比较受试者间差异与受试者内差异。
受试者间效应 (between-subject effects) 指得是对同一受试者而言不会改变的变数,
如身高、性别等。
受试者内效应 (within-subject effects) 则是指同一受试者的不同量测时间或状况下所
产生的差异,如不同前伸方向或治疗前後时间。
有时候也会比较二者间的交互作用 (within-subject-by-between-subject-interaction
effect),如性别′时间。
前提假设
检测受试者内效应 (within-subject effect) 的变数须符合 Type H covariance
structure
Sphericity test:测试数据资料是否符合 Type H covariance structure。若是受试者
内效应只有二级,则不需要进行 Sphericity test。
若资料不符合 Type H covariance structure 的前提假设,则显着水准的自由度
(degree of freedom) 须以 Box's e 做调整。Greenhouse and Geisser 最早提出
Box's e 的最大可能估计值是 Greenhouse-Geisser e。在 SAS 的结果即参考
adjusted G-G 的数值。
但 Huynh and Feldt (1976) 则认为在小样本数的研究时,Greenhouse-Geisser
Epsilon 较易低估显着水准,故提出 Huynh-Feldt e。在 SAS 的结果即参考 adjusted
H-F 的数值。
统计模型 (Statistical model)
相依变数 = 常数 + (受试者间差异的变数) + (受试者内差异的变数) + 交互作用
y = a0 + a1x1 + a2x2 + ...+ anxn
共变数结构 (Covariance Structure)
由於不同时间或不同状况下获得的两个量测间具有相关性 (correlation),重复量测变异
数分析必须考量此相关性的影响。因此受试者间的 covariance structure 必须选择正确
,以确保其对平均值的影响是有效的。常用的有三种:
compound symmetric: 不管量测间的时间有多长,同一受试者的任二量测皆有相同的
covariance,且每一量测的 variance 是相同的
first-order autoregressive: 随着时间变长,两个量测间的相关性呈等比级数的下降
(decreases exponentially)
unstructured: 两两量测间的 covariance 是不同的
可比较二个相同固定效应但不同共变数结构的统计模型之 Akaike's Information
Criteria (AIC) 与 Schwarz's Bayesian Criterion (SBC),以具有较高值的统计模型为
较适当的统计模型。
相关资讯
SAS 的非线性回归分析报告通常不含 R2,其记算方式如下:
R2 = SSreg / SStotal_corrected = 1- (SSres / SStotal_corrected)
相当於 SPSS 之 NLR procedure
back to top
--------------------------------------------------------------------------------
资料键入格式
由於重复量测变异数分析的依变项间是存在相关,故资料键入时,应视为不同的变项;不
可以视为单一变项的不同状况资料。如范例一的 4 个前伸方向的最大前伸距离,须当作
4 个变项来键入资料,亦即每一列均含有同一受试者的 4 组方向的资料。
重复量测变异数分析的资料键入基本格式及 SAS 语法如下(详细语法请参考下一节):
SAS 程式 说明
data lib名称.sas7bdat档名;
input id y1 y2 ... yn ;
title '';
id 为不同受试者之代码
y1 ...... yn为重复量测的变项,下标表示不同时间或状况的量测
proc glm data=lib名称.sas7bdat档名;
model y1-yn = / nouni;
repeated y;
y1-yn 为重复量测的变项,下标表示不同时间或状况的量测
nouni 参数将使结果输出时不会呈现 y1 ... yn 的个别变异数分析表
repeated y 则表示重复量测的变项合称为 y,一共有 n 级
back to top
--------------------------------------------------------------------------------
Proc GLM Univariate Test
语法:
SAS 程式 范例一
proc sort data=lib名称.SD2档名;
by 分组变数 ;
proc glm data=libary名.SD2档名;
class 分组变数;
model y1-yn = x1/ nouni;
repeated y 重复次数/ summary printe;
proc sort data=ok.reach;
by gender;
proc glm data=ok.reach;
class gender;
model hfrd1-hfrd4=gender/nouni;
repeated direction 4/ summary printe;
proc sort data=lib名称.SD2档名; by 分组变数; 先以分组变数来加以排序。
nouni 指不会列出每一相依变数 y 的个别变异数分析表。
printe 表示进行 Sphericity test。
结果: 范例一所呈现之结果如下:
分组状况:
受试者间分组 (between-subject measures) 为 gender,一共有两级: female 与 male
受试者内分组 (within-subject repeated measures) 为 direction,一共有四级: 1
= hfrd1
2 = hfrd2
3 = hfrd3
4 = hfrd4
受试者一共是 14 名,但有一名含遗漏值,故仅有 13 名进入分析。
受试者间差异:
由於 gender 之 F1,11 = 1.78, p > 0.05,故再不考量前伸方向下,受试者在不同性别
间 的最大前伸距离并无统计学上显着的差异,亦即无论男性或女性,其能达到的最大前
伸距离很相近。
受试者内差异:
由於 direction′gender 之 F3,33 = 1.78, p > 0.05,故二变项不存在交互作用,亦即
无论男性或女性,其能达到的最大前伸距离在各方向之表现很一致。
由於 direction 之 F3,33 = 16.43, p < 0.0001,故同一受试者在不同方向的最大前伸
距离具统计学上显着的差异,亦即 同一受试者在不同方向所能达到的最大前伸距离明显
的不同。
Spericity Test:
由於 direction′gender 之 F3,33 = 1.78, p > 0.05,故二变项不存在交互作用,亦即
无论男性或女性,其能达到的最大前伸距离在各方向之表现很一致。
由於 direction 之 F3,33 = 16.43, p < 0.0001,故同一受试者在不同方向的最大前伸
距离具统计学上显着的差异,亦即 同一受试者在不同方向所能达到的最大前伸距离明显
的不同。
back to top
--------------------------------------------------------------------------------
Proc GLM Univariate Test
语法:
SAS 程式 范例一
proc sort data=lib名称.SD2档名;
by 分组变数 ;
proc glm data=libary名.SD2档名;
class 分组变数;
model y1-yn = x1/ nouni;
repeated y 重复次数 contrast(1)/ short summary;
repeated y 重复次数 contrast(2)/ short summary;
....
repeated y 重复次数 contrast(n)/ short summary;
proc sort data=ok.reach;
by gender;
proc glm data=ok.reach;
class gender;
model hfrd1-hfrd4=gender/nouni;
repeated direction 4 contrast (1)/ short summary;
proc sort data=lib名称.SD2档名; by 分组变数; 先以分组变数来加以排序。
nouni 指不会列出每一相依变数 y 的个别变异数分析表。
结果: 范例一所呈现之结果如下:
分组状况:
受试者间分组 (between-subject measures) 为 gender,一共有两级: female 与 male
受试者内分组 (within-subject repeated measures) 为 direction,一共有四级: 1
= hfrd1
2 = hfrd2
3 = hfrd3
4 = hfrd4
受试者一共是 14 名,但有一名含遗漏值,故仅有 13 名进入分析。
受试者间差异:
由於 gender 之 F1,11 = 1.78, p > 0.05,故再不考量前伸方向下,受试者在不同性别
间 的最大前伸距离并无统计学上显着的差异,亦即无论男性或女性,其能达到的最大前
伸距离很相近。
受试者内差异:
由於 direction′gender 之 F3,33 = 1.78, p > 0.05,故二变项不存在交互作用,亦即
无论男性或女性,其能达到的最大前伸距离在各方向之表现很一致。
由於 direction 之 F3,33 = 16.43, p < 0.0001,故同一受试者在不同方向的最大前伸
距离具统计学上显着的差异,亦即 同一受试者在不同方向所能达到的最大前伸距离明显
的不同。
Spericity Test:
由於 direction′gender 之 F3,33 = 1.78, p > 0.05,故二变项不存在交互作用,亦即
无论男性或女性,其能达到的最大前伸距离在各方向之表现很一致。
由於 direction 之 F3,33 = 16.43, p < 0.0001,故同一受试者在不同方向的最大前伸
距离具统计学上显着的差异,亦即 同一受试者在不同方向所能达到的最大前伸距离明显
的不同。
--
plurk
http://www.plurk.com/dasea2030
face book
0963593047,0984262714
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.130.189.38
※ 编辑: dasea2008 (210.66.169.48 台湾), 07/07/2022 04:21:40
※ 编辑: dasea2008 (210.66.169.48 台湾), 04/25/2023 18:27:44