作者sapphireBOB (澄響幸輝絕品泉水)
看板Statistics
標題[問題] 迴歸截距的標準誤
時間Sat Jun 9 11:49:11 2018
使用R內建共線性高的範例資料 longley 之後
經過stepwise後,得到的截距項標準誤非常大 (遠大於其他放入模型因子的std.error)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 285.10657
105.82554 2.694 0.0359 *
GNP 0.26798 0.07762 3.452 0.0136 *
Unemployed 0.01801 0.01406 1.281 0.2475
Armed.Forces -0.00610 0.01187 -0.514 0.6257
Population -1.91067 1.00841 -1.895 0.1069
Employed -1.02614 0.90003 -1.140 0.2977
想請問這個項目該怎麼解釋? 謝謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.241.130.83
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1528516153.A.E1D.html
1F:推 Mancer: t還是顯著啊不然哩 06/09 13:33
2F:→ myty383: 你的截距估計值也很大阿,感覺標準誤大很正常 06/09 13:33
3F:→ myty383: 我覺得問題是為何你的截距這麼大,這可能是你的Y和X們 06/09 13:34
4F:→ myty383: 單位之類的是不是有弄錯?或者是這樣放在解釋上會不會出現 06/09 13:35
5F:→ myty383: 詭異的現象 06/09 13:35
6F:推 andrew43: 你把Y除1000就會變小了啊。別忘了單位會影響 06/09 14:28
我的 training data 長這樣
第一個column是Y 感覺scale沒有差很多啊
GNP.deflator GNP Unemployed Armed.Forces Population Employed Symbol
1 83.0 234.289 235.6 159.0 107.608 60.323 Train
2 88.5 259.426 232.5 145.6 108.632 61.122 Train
3 88.2 258.054 368.2 161.6 109.773 60.171 Train
5 96.2 328.975 209.9 309.9 112.075 63.221 Train
6 98.1 346.999 193.2 359.4 113.270 63.639 Train
9 101.2 397.469 290.4 304.8 117.388 66.019 Train
10 104.6 419.180 282.2 285.7 118.734 67.857 Train
11 108.4 442.769 293.6 279.8 120.445 68.169 Train
12 110.8 444.546 468.1 263.7 121.950 66.513 Train
13 112.6 482.704 381.3 255.2 123.366 68.655 Train
14 114.2 502.601 393.1 251.4 125.368 69.564 Train
15 115.7 518.173 480.6 257.2 127.852 69.331 Train
7F:→ myty383: 你把單位調一調就解決了 06/09 14:53
y/1000 後確實有解決
不過為什麼這樣做 截距就會變小呢?
是因為 Beta_hat = (X'X)^-1X'y 的關係嗎?
8F:推 myty383: 因為他要反應你都Y的大小阿,你的係數那麼小,截距不大的 06/09 15:08
9F:→ myty383: 畫,估出來的Y就遠遠小很多 06/09 15:08
10F:→ myty383: 你畫個散布圖,你就會發現因為他要把結距估計進去最好的 06/09 15:09
11F:→ myty383: 配適方法就是把你的截距放大 06/09 15:09
感謝!
※ 編輯: sapphireBOB (111.241.130.83), 06/09/2018 15:12:23
12F:推 maoc: 共線性高的資料....用 stepwise? 06/10 20:29
13F:→ myty383: 只是在試驗吧 06/10 20:53
14F:→ yhliu: 截距項的標準誤,跟共線性何干? 一個迴歸式各係數(含常數項) 06/11 05:25
15F:→ yhliu: 之標準誤, 是不能相互比較的, 哪需耍管什麼常數項標準誤特 06/11 05:27
16F:→ yhliu: 別大的問題?那根本不是問題! 更何況一個迴歸式的常數項, 只 06/11 05:30
17F:→ yhliu: 是一個調整項, 不說在此例相對於常數項的係數值沒有特別大, 06/11 05:33
18F:→ yhliu: 就算真的標準誤相對於係數值特別大, 也沒有什麼需要特別注 06/11 05:35
19F:→ yhliu: 意的. 06/11 05:35