作者jasonhsu14 (14号星期五的杰森)
看板Statistics
标题[问题] 共线性情况下的判定系数有参考性吗
时间Thu Dec 3 12:56:11 2020
各位前辈好
小弟这边有个复回归的共线性问题想请教一下
就是我的自变量有两个,但这两个自变量本身是高度相关
那在"完全不处理共线性"的情况下
我的第一个问题是
我这样跑回归跑出来的回归参数估计值beta,对於我输入不同的自变量所预测到的依变量Y
这样情况下的Y,是否适合采纳?
第二个问题是
若上述的Y适合采纳的情况下,那这条回归方程式的判定系数R平方,是否还有参考性
以上两个问题,还麻烦版友们协助
也先谢谢愿意耐心看到此段落并了解我问题的版友们
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 61.230.23.231 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1606971373.A.765.html
1F:→ andrew43: 预测值唯有自变数范围且相关性皆与原始资料相仿才会准 12/03 14:06
2F:推 rebe212296: 请搜寻张翔老师的共线性诊断影片 12/03 14:27
3F:→ rebe212296: 自变量有几个就有几个回归系数 12/03 14:28
4F:推 west1996: 1. 既然x间可替换,yhat值自然会算出同样的数,所以可以 12/03 14:36
5F:→ west1996: 用 12/03 14:36
6F:→ west1996: 2. rsquare公式只与y跟yhat有关,与bets无关,所以可用 12/03 14:36
谢谢楼上诸位的回答
※ 编辑: jasonhsu14 (220.135.101.201 台湾), 12/06/2020 10:16:30
7F:→ locka: 借题想问:所谓两个自变数高度相关,听起来是其中一个变数 12/07 08:32
8F:→ locka: 对y的解释性可以大部分由另一个变数代替(也就是第2个变数对 12/07 08:32
9F:→ locka: y的解释性有限),那这个时候放第2个变数不是增加复杂度吗? 12/07 08:32
10F:→ locka: 想问这情况下判断要不要留第二个变数的准则是什麽呢? 12/07 08:32
11F:推 west1996: 看建模目的而定,没有标准答案 12/08 00:02
12F:推 iphone2003: 应该要先确认「可用」的意思是什麽?共线性发生时,X 12/08 15:15
13F:→ iphone2003: ’X接近nonsingular,因此beta估计量跟yhat的variance 12/08 15:15
14F:→ iphone2003: 会很大 12/08 15:15
15F:推 ee012345: 高度共线性的时候,beta估计的变异很大,但y的变异没差 12/13 10:04
16F:→ ee012345: 所以如果只是预测(y)的话没问题,但模型(beta)不好解释 12/13 10:06
17F:→ ee012345: 至於要保留哪个变数是模式选择的问题 12/13 10:07
18F:→ ee012345: 有人会选让Rsquare最低的,也有人取平均直接取代他们 12/13 10:08