作者SierraLiao (Sierra)
看板Statistics
标题观察值过少且资料没有变异的问题
时间Sun Oct 7 23:40:32 2018
由於本人从没学过统计学
这几天才接触SPSS的操作和应用
有个愚笨的问题想请问大家.....
原先欲探讨不同程度学生在某学习情形是否有显着差异
假设自变项为不同程度(低、中、高)学生
依变项为某学习情形
编码时,我把出现该情形设为1,未出现则为0
但1的观察值只有3个,皆为低程度学生
其余都是0(近三百个)
若出现以上情况
因学生的程度并无变异,且中、高程度没有可比较的变异数
检定跑出来即有显着差异
所以这个研究假设应该拿掉吗?
且资料因不符常态与同质性
故使用无母数K-W H检定
这样还需将以上情形考虑进去吗?
感谢大家耐心看完此愚蠢的问题......
Ps不好意思
刚刚在修改文章时误将各位给的留言给删除了..囧” 抱歉......
※ 编辑: SierraLiao (61.223.83.107), 10/08/2018 08:53:53
※ 编辑: SierraLiao (61.223.83.107), 10/08/2018 08:55:52
※ 编辑: SierraLiao (61.223.83.107), 10/08/2018 08:57:05
1F:→ andrew43: 看来是个2*3的次数交叉表。常用卡方同质性并适当修正。 10/08 12:53
2F:→ andrew43: 假如资料是0/300,0/300,3/300,那应该不足达到显着的 10/08 12:54
3F:→ SierraLiao: 谢谢Andrew回覆 因为我原文只列了一个依变项 应该说 10/08 15:35
4F:→ SierraLiao: 学习情形有四个层面 某一层面只有3个观察值且都无变 10/08 15:35
5F:→ SierraLiao: 异 那这样应该无法使用卡方吧....? 10/08 15:35
6F:→ SierraLiao: 3个为1 300为0 10/08 15:36
7F:→ andrew43: 其实我越看越不懂。XD。 10/08 15:50
8F:→ SierraLiao: 哈哈抱歉搞混你了,让我来解释一下XD 就是我假设不同 10/08 16:00
9F:→ SierraLiao: 程度学生在A,B,C,D方面的学习情形有显着差异 但在D方 10/08 16:00
10F:→ SierraLiao: 面出现原文的问题(只有3个低程度学生有D学习情形,其 10/08 16:01
11F:→ SierraLiao: 他程度都没有)这样跑分析的结果就是有差异(低>中,低 10/08 16:01
12F:→ SierraLiao: >高)问题是这个结果可以用吗 10/08 16:01
13F:→ andrew43: 这看来是多变量的反应变数,如果每个受测者都会测得4个 10/08 16:05
14F:→ andrew43: 结果。 10/08 16:05
15F:→ andrew43: 采用多变量分析,或是单变量做4次但有适当修正,都是可 10/08 16:08
16F:→ andrew43: 以考虑的。如果做单变量,就大概如我先前说的交叉表。 10/08 16:08
17F:→ andrew43: 至於罕见情况造成的分析问题,看采取的分析方法会有不 10/08 16:09
18F:→ andrew43: 同的处理方式。 10/08 16:09
19F:→ andrew43: 话说回来,你说D应变数在组间有差异我仍感到怀疑。 10/08 16:11
20F:→ SierraLiao: 好的 谢谢你 我再研究研究多变量分析~不过想再请问你 10/08 16:19
21F:→ SierraLiao: 若我把学生背景分为不同程度和不同语言背景 那这样 10/08 16:19
22F:→ SierraLiao: 还能往多变量分析走吗(假设一-1,-2,-3,-4:不同程度 10/08 16:19
23F:→ SierraLiao: 学生在A,B,C,D学习情形有显着差异;假设二-1,-2,-3,-4 10/08 16:19
24F:→ SierraLiao: :不同语言背景学生在A,B,C,D学习情形有显着差异) 10/08 16:19
25F:→ andrew43: 这就变成二因子。看实际什麽方法才知道可不可行。 10/08 16:22
26F:→ yhliu: 依变项(或称"反应变项"更合适)是0-1 变项, 不适合一般 t, 10/09 08:24
27F:→ yhliu: ANOVA 以及 based on ranks 的无母数方法及多变量方法, 应 10/09 08:25
28F:→ yhliu: 考虑 binary data 的分析方法. 至於样本中仅有稀少的 1, 10/09 08:27
29F:→ yhliu: 绝大多数是0 的反应值, 也不适合卡方这种大样本近似方法. 10/09 08:28
30F:→ yhliu: 如果样本碓实够大而反应值极度偏颇, 用卜瓦松, 否则还是用 10/09 08:30
31F:→ yhliu: 二项. 10/09 08:31
32F:→ andrew43: 确实有多变量方法。例如生态学中是否出现物种之分析 10/09 11:47
33F:→ andrew43: 至於是否能达到原po目的并解决稀有事件则需适当挑选方法 10/09 11:52
34F:→ andrew43: 可以拿"multivariate analysis binary data"当关键字 10/09 13:07
35F:→ andrew43: 蛮多东西的 10/09 13:07
36F:→ hsnuyi: 这是实验设计的问题吧... 10/11 17:00