看板Statistics
标 题Re: [问题] 初学者问个关於One-way Anova问题
发信站无名小站 (Thu Sep 28 10:51:31 2006)
转信站ptt!Group.NCTU!grouppost!Group.NCTU!wretch
实际上既然只看一本教本, 这资料及分析结果要代表甚麽,
是一个问题! 就好像拿一个班级的学生资料来做分析, 结
果能化表的是甚麽?
这资料的设计, 就好像拿一个班级的学生, 依某种标准分
类将学生分成三组, 然後观察每一个学生在某些日子是否
有某种行为, 例如缺课. 而要问:
三种学生的行为有没有显着差异?
观察的 "某些日子" 是 "研究者" 不知采用甚麽标准选定
的. 数据是每一位 "观察日数", "有缺课日数" 及 "有缺
课日数的比例".
然後, 被提出的问题是: 做 ANOVA 的变项是 "百分比",
还是 "缺课日数"+"观察日数"+"百分比"?
不谈抽样及代表性的问题 --- 虽然那是最重要的问题!
「"特殊字的数量"+"全部字的数量"+"百分比" 全部一起比」
是甚麽意思?
实际的资料可说只有一个: 特殊字数. 而 "全部字数" 是
人为的, 它影响特殊字数的多寡.
就 ANOVA 的条件而言, 要求:
各观测值相互独立、变异数相等、不能太偏离常态
常态性且不管(这资料当然不符合!) 独立性就闭着眼晴假
设成立吧! 但 "变异数相等" 这条件无论如何是无法唬过
去的! 因此, 要做 ANOVA, 去找看看是否有能处理不等变
异数的软体吧! (别问我! 我不知道.)
假设考虑前面所举学生缺课的例子:
(1) 假设每位学生是抽查实验观察期间中的一些日子, 抽
查几天是研究者决定, 但抽样是采在观察期间中以随
机方式为之. 而且各学生的抽样是互不相干的. 并且,
假设 "实验观察期间" 够长, 使得实际观察日数相对
於此期间的日数, 比例很小, 例如小於10%.
(2) 假设 "缺课" 与否是明确定义的, 不因不同日子而不
同, 也不因不同学生而有差别.
(3) 假设基本上只是要看
该班三类型学生的缺课率是否不
同.
(4) 假设影响该班学生缺课率的, 只有被考虑的学生类型.
也就是: 该三类型学生, 同一类型学生的缺课率是相
同的. 实际观测到的 "样本缺课率" 有差异, 纯粹是
因抽样误差或随机误差.
在这些假设下, 资料及模型如下:
分组 "样本" 理论缺课率 观测日数 缺课日数
====== ======= ========== ======== ========
I 1 P1 N11 X11
2 P1 N12 X12
: : : :
: : : :
a P1 N1a X1a
II 1 P2 N21 X21
2 P2 N22 X22
: : : :
: : : :
b P2 N2b X2b
III 1 P3 N31 X31
2 P3 N32 X32
: : : :
: : : :
c P3 N3c X3c
假说:
H0: P1 = P2 = P3
Ha: P1, P2, P3 并非全部一致
检定:
Pearson 卡方近似, 或 exact test.
模型诊断:
是否同一组内各样本对应的 "理论缺课率" 是一致的?
[方法] 各 "样本" 都足够大时可用卡方近似,否则看
有没 exact test 的软体.
--
来自统计专业的召唤...
无名小站 telnet://wretch.twbbs.org Statistics (统计方法讨论区)
成大计中站 telnet://bbs.ncku.edu.tw Statistics (统计方法及学理讨论区)
盈月与繁星 telnet://ms.twbbs.org Statistics (统计:让数字说话)
交大资讯次世代 telnet://bs2.twbbs.org Statistics (统计与机率)
★本文未经本人同意请勿转载; 回覆请勿全文引用, 请仅留下直接涉及部分。
--
夫兵者不祥之器物或恶之故有道者不处君子居则贵左用兵则贵右兵者不祥之器非君子
之器不得已而用之恬淡为上胜而不美而美之者是乐杀人夫乐杀人者则不可得志於天下
矣吉事尚左凶事尚右偏将军居左上将军居右言以丧礼处之杀人之众以哀悲泣之战胜以
丧礼处之道常无名朴虽小天下莫能臣侯王若能守之万物将自宾天地相合以降甘露民莫
之令而自均始制有名名亦既有夫亦将知止知止可以不殆譬道之在天 163.15.188.87海