作者chungyuandye (chungyuandye)
看板Statistics
标题Re: [问题] 回归里的多元共线
时间Sat Jan 28 10:58:19 2006
※ 引述《latique (Afro)》之铭言:
: ※ 引述《sevenkiller (恶狠很的一发)》之铭言:
: : 就是自变项间是否有高度相关
: : 如果自变项间高度相关的话 会影响到对回归系数之假设检测
: : 实际上操作的话 SPSS所提供之collinearity的统计包括
: : Tolerance VIF和Condition Index等
: : 这些统计是有关连性的 如Tolerance与VIF就是互为倒数 如果是Tolerance越小
: : 就表示该自变项与其他自变项间之共线性越高
: : 总而言之 共线性在分析当中是低比较好 共线性一高 就代表你的回归有问题
: : 解释起来就很麻烦了
: 所以当各自变项出现共线性的关系
: 表示之间有高度相关
: 对於解释依变项也较没有解释力的意思吗~~
Y=b0+b1*X1+b2*X2+....+bk*Xk
Xi=c0+c1*X1+c2*X2+..+c_{i-1}*X_{i-1}+c_{i+1}*X_{i+1}+..ck*Xk
这边可以算出一个R^2
VIF_i=1/(1-R^2)
VIF_i值很大(通常以10为门槛), 表示该自变数能被其他自变数所取代,
所以它可以不需要列在解释变数
B=Inverse(X^T*X)*X^T*Y
如果是完全共线性, 那个X^T*X这个矩阵里至少有两行的元素等比例
所以行列式值为0, 那麽Inverse就不存在, 因此估计出来的B也会没意义
应该是这样子, 有错请指正
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 222.250.191.69