作者tonmai (hey)
站内Statistics
标题[问题] 阶层回归分析系数不显着
时间Fri Jan 31 21:25:01 2014
最近在分析资料时遇到一个状况,想请教各位该怎麽解释/调整分析方式。
我的研究中是使用多元回归分析,而预测变项是分成两个区块投入。
分析结果,两个模式的整体解释力都有达到显着,
模式一和模式二的 R平方 分别为.28和.43,R平方改变量达到显着。
但是,在模式二中,所有变项系数都未显着。(变项间没有共线性的问题,vif=1-2)
未标准化系数
模式 B 估计值 标准误差 标准化系数 t P
-------------------------------------------------------------
1 (常数) 1.736 1.188 1.461 .148
A .547 .245 .230 2.238 .028
B .727 .256 .303 2.837 .006
C .218 .101 .232 2.149 .035
-------------------------------------------------------------
2 (常数) -3.162 1.971 -1.604 .113
A .405 .240 .170 1.688 .096
B .477 .262 .199 1.816 .074
C .104 .106 .111 .980 .331
D .228 .124 .224 1.839 .070
E .200 .123 .196 1.634 .107
对於这样的结果该怎麽解释呢?
我目前是以模式一进行解释,但总觉得怪怪的(毕竟模式二的解释力较大)。
ps.我也试着在预测变项中只投入ABCD或ABCE,
两个模式都有显着(一个是C、D变项显着,一个是A、C、E显着)。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 1.170.126.113
1F:→ coldwind0912:能否提供一下变项的平均数.标准差 02/01 12:53
2F:→ coldwind0912:我想问题应该在那.... 02/01 12:53
谢谢提问,平均数标准差如下:
A 2.63 ± 2.48
B 3.16 ± 2.46
C 6.97 ± 6.28
D 18.52 ± 5.79
E 13.13 ± 5.76
依变项 7.20 ± 4.21
3F:→ coldwind0912:如此看来 您的变项是连续型data吗? 02/01 18:29
4F:→ coldwind0912:以这描述性统计量来看 残差好大...能分析回归模型吗? 02/01 18:30
6F:→ coldwind0912:但有大概的讲了一些回归分析的观念 02/01 18:33
其实严格讲算是ordinary scale,因为是使用李克特式量表。
残差的问题,我其实不太确定(不太会看图)有没有符合常态分配...
http://ppt.cc/O7T7
顺带附上残差P-P图及残差-预测値散布图
http://ppt.cc/BRDG
http://ppt.cc/vuaH
7F:→ coldwind0912:其实 照图表看起来 是有点没有符合回归残差的假定 02/02 01:48
8F:→ coldwind0912:但应该不致於反应到回归系数上影响这麽多才是 02/02 01:49
9F:→ coldwind0912:但我满好奇 如果是用likert量尺 为何标准差如此大... 02/02 01:50
10F:→ coldwind0912:以likert六点量表来说 应该标准差约略为1吧 02/02 01:51
11F:→ coldwind0912:所以 你的资料或变项型态是不是要再确认看看? 02/02 01:52
不好意思,没说清楚,
A、B变项是单题的10点量表,C、D、E都是多题加总之後的分数。
变项是都有正偏态的情形,但应该不影响回归的使用?
12F:→ yhliu:Model 2 是 model 1 加上 D, E 两解释变数? 我猜这两解释变 02/02 15:26
13F:→ yhliu:数不会与 A, B, C 无关或低度相关. 但显然这两变数加入, 至 02/02 15:28
14F:→ yhliu:少其中之一, 对解释力的贡献是可怀疑的. 模型中加入不重要的 02/02 15:29
15F:→ yhliu:解释变数, 将使参数估计的误差扩大, 这是导致在 model 1 显 02/02 15:30
16F:→ yhliu:着的 A, B, C 等解释变数在 model 2 变成不显着的可能原因. 02/02 15:31
17F:→ yhliu:看标准化系数看不出什麽, 看原始尺度的回归系数及其标准误, 02/02 15:32
18F:→ yhliu:比较能看出问题是否如我猜测的. 02/02 15:33
没错,model 2 就是再加上D、E变项。
其实这些变项间都有或多或少相关(如下表)
Y A B C D E
Y 1
A .289* 1
B .394** .079 1
C .362** .154 .314** 1
D .485** .276* .432** .309** 1
E .429** .127 .257* .479** .480** 1
我目前解释的方式是比较朝向
「ABC变项就可以很好的解释Y,增加DE变项无法增加对Y的了解」来解释。
但又卡在,
当以ABCD或ABCE来预测时,
其实又都可显着增加解释力(和只用ABC来预测相比),且D/E变项也有显着解释力,
这样说起来,
好像是因为变项间的相关才导致以ABCDE来预测时,所有变项的效果都不显着。
只是先前询问老师,
老师是觉得相关也没有到极高、VIF也都蛮低的(都不到2),应该不是这个问题。
ps.已补上未标准化的数据,好像也没有误差过度膨胀的状况。
19F:→ coldwind0912:从未标准化估计值的标准误来看 我觉得标准误有点大.. 02/02 19:32
20F:→ coldwind0912:尤其A.B又是单题10点量表 从M和SD来说 这分布也太... 02/02 19:33
21F:→ coldwind0912:单题的10点量表 要视为continuous data跑回归..... 02/02 19:34
22F:→ coldwind0912:我只能说这误差值没爆表 已经是不幸中的大幸了... 02/02 19:35
23F:→ yhliu:本来 model 1 的系数显着性就不是很高 (t 值不是很大), 加入 02/03 17:17
24F:→ yhliu:D, E, 虽然 VIF 不是很大, 但系数的标准误应有明显提高吧? 02/03 17:18
25F:→ yhliu:这样结果变成不显着, 又有什麽奇怪? 02/03 17:19
26F:→ yhliu:增加解释项, 必然提高 R^2, 因此才有 adjusted R^2 的提出, 02/03 17:20
27F:→ yhliu:希望稍为修正虚假的 R^2 提高现象. 02/03 17:21
28F:→ yhliu:如果认为 D, E 还是应考虑, 那麽, 试着去掉 D 或去掉 E 看看 02/03 17:21
29F:→ yhliu:吧. 02/03 17:22
30F:→ yhliu:回头看了系数及标准误, 是系数变小了. 这是因 D, E 变数分掉 02/03 17:23
31F:→ yhliu:了 A, B, C 的 "效应". 因为这些变数相互间都是正的相关, 所 02/03 17:24
32F:→ yhliu:以 A, B, C 的系数因 D, E 的加入而变小也是很合理的. 02/03 17:25
33F:→ yhliu:100元分给5个人跟分给3个人相比, 当然每个人得到的钱变少; 02/03 17:26
34F:→ yhliu:即使5个人分时总钱数略有增加, 除非增加幅度够大, 否则每个 02/03 17:27
35F:→ yhliu:人分得的钱也将变少. 这个例子就像这种情况. 02/03 17:28
感谢大家的热心指导、讨论!
让我可以厘清对回归的一些观念,也发现到自己之前忽略了好多该注意的地方。
我比较清楚问题在哪里了,刚好放完年假可以回学校再努力!
如果大家还有其他想法,或是想提醒後进注意的,也欢迎再提出。
再次感谢大家!新年快乐!
※ 编辑: tonmai 来自: 1.170.11.184 (02/05 17:45)