作者tonmai (hey)
站內Statistics
標題[問題] 階層迴歸分析係數不顯著
時間Fri Jan 31 21:25:01 2014
最近在分析資料時遇到一個狀況,想請教各位該怎麼解釋/調整分析方式。
我的研究中是使用多元迴歸分析,而預測變項是分成兩個區塊投入。
分析結果,兩個模式的整體解釋力都有達到顯著,
模式一和模式二的 R平方 分別為.28和.43,R平方改變量達到顯著。
但是,在模式二中,所有變項係數都未顯著。(變項間沒有共線性的問題,vif=1-2)
未標準化係數
模式 B 估計值 標準誤差 標準化係數 t P
-------------------------------------------------------------
1 (常數) 1.736 1.188 1.461 .148
A .547 .245 .230 2.238 .028
B .727 .256 .303 2.837 .006
C .218 .101 .232 2.149 .035
-------------------------------------------------------------
2 (常數) -3.162 1.971 -1.604 .113
A .405 .240 .170 1.688 .096
B .477 .262 .199 1.816 .074
C .104 .106 .111 .980 .331
D .228 .124 .224 1.839 .070
E .200 .123 .196 1.634 .107
對於這樣的結果該怎麼解釋呢?
我目前是以模式一進行解釋,但總覺得怪怪的(畢竟模式二的解釋力較大)。
ps.我也試著在預測變項中只投入ABCD或ABCE,
兩個模式都有顯著(一個是C、D變項顯著,一個是A、C、E顯著)。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 1.170.126.113
1F:→ coldwind0912:能否提供一下變項的平均數.標準差 02/01 12:53
2F:→ coldwind0912:我想問題應該在那.... 02/01 12:53
謝謝提問,平均數標準差如下:
A 2.63 ± 2.48
B 3.16 ± 2.46
C 6.97 ± 6.28
D 18.52 ± 5.79
E 13.13 ± 5.76
依變項 7.20 ± 4.21
3F:→ coldwind0912:如此看來 您的變項是連續型data嗎? 02/01 18:29
4F:→ coldwind0912:以這描述性統計量來看 殘差好大...能分析迴歸模型嗎? 02/01 18:30
6F:→ coldwind0912:但有大概的講了一些迴歸分析的觀念 02/01 18:33
其實嚴格講算是ordinary scale,因為是使用李克特式量表。
殘差的問題,我其實不太確定(不太會看圖)有沒有符合常態分配...
http://ppt.cc/O7T7
順帶附上殘差P-P圖及殘差-預測値散布圖
http://ppt.cc/BRDG
http://ppt.cc/vuaH
7F:→ coldwind0912:其實 照圖表看起來 是有點沒有符合迴歸殘差的假定 02/02 01:48
8F:→ coldwind0912:但應該不致於反應到迴歸係數上影響這麼多才是 02/02 01:49
9F:→ coldwind0912:但我滿好奇 如果是用likert量尺 為何標準差如此大... 02/02 01:50
10F:→ coldwind0912:以likert六點量表來說 應該標準差約略為1吧 02/02 01:51
11F:→ coldwind0912:所以 你的資料或變項型態是不是要再確認看看? 02/02 01:52
不好意思,沒說清楚,
A、B變項是單題的10點量表,C、D、E都是多題加總之後的分數。
變項是都有正偏態的情形,但應該不影響迴歸的使用?
12F:→ yhliu:Model 2 是 model 1 加上 D, E 兩解釋變數? 我猜這兩解釋變 02/02 15:26
13F:→ yhliu:數不會與 A, B, C 無關或低度相關. 但顯然這兩變數加入, 至 02/02 15:28
14F:→ yhliu:少其中之一, 對解釋力的貢獻是可懷疑的. 模型中加入不重要的 02/02 15:29
15F:→ yhliu:解釋變數, 將使參數估計的誤差擴大, 這是導致在 model 1 顯 02/02 15:30
16F:→ yhliu:著的 A, B, C 等解釋變數在 model 2 變成不顯著的可能原因. 02/02 15:31
17F:→ yhliu:看標準化係數看不出什麼, 看原始尺度的迴歸係數及其標準誤, 02/02 15:32
18F:→ yhliu:比較能看出問題是否如我猜測的. 02/02 15:33
沒錯,model 2 就是再加上D、E變項。
其實這些變項間都有或多或少相關(如下表)
Y A B C D E
Y 1
A .289* 1
B .394** .079 1
C .362** .154 .314** 1
D .485** .276* .432** .309** 1
E .429** .127 .257* .479** .480** 1
我目前解釋的方式是比較朝向
「ABC變項就可以很好的解釋Y,增加DE變項無法增加對Y的了解」來解釋。
但又卡在,
當以ABCD或ABCE來預測時,
其實又都可顯著增加解釋力(和只用ABC來預測相比),且D/E變項也有顯著解釋力,
這樣說起來,
好像是因為變項間的相關才導致以ABCDE來預測時,所有變項的效果都不顯著。
只是先前詢問老師,
老師是覺得相關也沒有到極高、VIF也都蠻低的(都不到2),應該不是這個問題。
ps.已補上未標準化的數據,好像也沒有誤差過度膨脹的狀況。
19F:→ coldwind0912:從未標準化估計值的標準誤來看 我覺得標準誤有點大.. 02/02 19:32
20F:→ coldwind0912:尤其A.B又是單題10點量表 從M和SD來說 這分布也太... 02/02 19:33
21F:→ coldwind0912:單題的10點量表 要視為continuous data跑回歸..... 02/02 19:34
22F:→ coldwind0912:我只能說這誤差值沒爆表 已經是不幸中的大幸了... 02/02 19:35
23F:→ yhliu:本來 model 1 的係數顯著性就不是很高 (t 值不是很大), 加入 02/03 17:17
24F:→ yhliu:D, E, 雖然 VIF 不是很大, 但係數的標準誤應有明顯提高吧? 02/03 17:18
25F:→ yhliu:這樣結果變成不顯著, 又有什麼奇怪? 02/03 17:19
26F:→ yhliu:增加解釋項, 必然提高 R^2, 因此才有 adjusted R^2 的提出, 02/03 17:20
27F:→ yhliu:希望稍為修正虛假的 R^2 提高現象. 02/03 17:21
28F:→ yhliu:如果認為 D, E 還是應考慮, 那麼, 試著去掉 D 或去掉 E 看看 02/03 17:21
29F:→ yhliu:吧. 02/03 17:22
30F:→ yhliu:回頭看了係數及標準誤, 是係數變小了. 這是因 D, E 變數分掉 02/03 17:23
31F:→ yhliu:了 A, B, C 的 "效應". 因為這些變數相互間都是正的相關, 所 02/03 17:24
32F:→ yhliu:以 A, B, C 的係數因 D, E 的加入而變小也是很合理的. 02/03 17:25
33F:→ yhliu:100元分給5個人跟分給3個人相比, 當然每個人得到的錢變少; 02/03 17:26
34F:→ yhliu:即使5個人分時總錢數略有增加, 除非增加幅度夠大, 否則每個 02/03 17:27
35F:→ yhliu:人分得的錢也將變少. 這個例子就像這種情況. 02/03 17:28
感謝大家的熱心指導、討論!
讓我可以釐清對迴歸的一些觀念,也發現到自己之前忽略了好多該注意的地方。
我比較清楚問題在哪裡了,剛好放完年假可以回學校再努力!
如果大家還有其他想法,或是想提醒後進注意的,也歡迎再提出。
再次感謝大家!新年快樂!
※ 編輯: tonmai 來自: 1.170.11.184 (02/05 17:45)