作者sapphireBOB (澄响幸辉绝品泉水)
看板Statistics
标题[问题] 回归截距的标准误
时间Sat Jun 9 11:49:11 2018
使用R内建共线性高的范例资料 longley 之後
经过stepwise後,得到的截距项标准误非常大 (远大於其他放入模型因子的std.error)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 285.10657
105.82554 2.694 0.0359 *
GNP 0.26798 0.07762 3.452 0.0136 *
Unemployed 0.01801 0.01406 1.281 0.2475
Armed.Forces -0.00610 0.01187 -0.514 0.6257
Population -1.91067 1.00841 -1.895 0.1069
Employed -1.02614 0.90003 -1.140 0.2977
想请问这个项目该怎麽解释? 谢谢!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.241.130.83
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1528516153.A.E1D.html
1F:推 Mancer: t还是显着啊不然哩 06/09 13:33
2F:→ myty383: 你的截距估计值也很大阿,感觉标准误大很正常 06/09 13:33
3F:→ myty383: 我觉得问题是为何你的截距这麽大,这可能是你的Y和X们 06/09 13:34
4F:→ myty383: 单位之类的是不是有弄错?或者是这样放在解释上会不会出现 06/09 13:35
5F:→ myty383: 诡异的现象 06/09 13:35
6F:推 andrew43: 你把Y除1000就会变小了啊。别忘了单位会影响 06/09 14:28
我的 training data 长这样
第一个column是Y 感觉scale没有差很多啊
GNP.deflator GNP Unemployed Armed.Forces Population Employed Symbol
1 83.0 234.289 235.6 159.0 107.608 60.323 Train
2 88.5 259.426 232.5 145.6 108.632 61.122 Train
3 88.2 258.054 368.2 161.6 109.773 60.171 Train
5 96.2 328.975 209.9 309.9 112.075 63.221 Train
6 98.1 346.999 193.2 359.4 113.270 63.639 Train
9 101.2 397.469 290.4 304.8 117.388 66.019 Train
10 104.6 419.180 282.2 285.7 118.734 67.857 Train
11 108.4 442.769 293.6 279.8 120.445 68.169 Train
12 110.8 444.546 468.1 263.7 121.950 66.513 Train
13 112.6 482.704 381.3 255.2 123.366 68.655 Train
14 114.2 502.601 393.1 251.4 125.368 69.564 Train
15 115.7 518.173 480.6 257.2 127.852 69.331 Train
7F:→ myty383: 你把单位调一调就解决了 06/09 14:53
y/1000 後确实有解决
不过为什麽这样做 截距就会变小呢?
是因为 Beta_hat = (X'X)^-1X'y 的关系吗?
8F:推 myty383: 因为他要反应你都Y的大小阿,你的系数那麽小,截距不大的 06/09 15:08
9F:→ myty383: 画,估出来的Y就远远小很多 06/09 15:08
10F:→ myty383: 你画个散布图,你就会发现因为他要把结距估计进去最好的 06/09 15:09
11F:→ myty383: 配适方法就是把你的截距放大 06/09 15:09
感谢!
※ 编辑: sapphireBOB (111.241.130.83), 06/09/2018 15:12:23
12F:推 maoc: 共线性高的资料....用 stepwise? 06/10 20:29
13F:→ myty383: 只是在试验吧 06/10 20:53
14F:→ yhliu: 截距项的标准误,跟共线性何干? 一个回归式各系数(含常数项) 06/11 05:25
15F:→ yhliu: 之标准误, 是不能相互比较的, 哪需耍管什麽常数项标准误特 06/11 05:27
16F:→ yhliu: 别大的问题?那根本不是问题! 更何况一个回归式的常数项, 只 06/11 05:30
17F:→ yhliu: 是一个调整项, 不说在此例相对於常数项的系数值没有特别大, 06/11 05:33
18F:→ yhliu: 就算真的标准误相对於系数值特别大, 也没有什麽需要特别注 06/11 05:35
19F:→ yhliu: 意的. 06/11 05:35