看板Statistics
标 题Re: [问题] 被统计搞疯啦~~~有谁能指教一下的
发信站成大计中BBS (Fri Jun 17 10:26:13 2005)
转信站ptt!Group.NCTU!grouppost!Group.NCTU!nckubbs
※ 引述《[email protected] (you got it)》之铭言:
: 有人能跟我说多元回归分析中的
: hat matrix diagonal elements
考虑简单直线回归的情形:
h_i = (1/n) + (x_i-\bar{x})^2/Σ(x_j-\bar{x})^2
可以发现: h_i 代表的是第 i 点的 x 值与中心相距多远
(除了多一个常数 1/n 以外).
对复回归, 其意义也是相同: h_i 愈大, 表示该点就自变
数所处位置而言, 离中心较远. 你可以用两自变数的情形
验证之.
: studentized deleted residual
"deleted residual" 是去掉 "待测点" 後, 配适原模型,
然後计算待测点与根据该估计模型预测结果之离差. 在线
性回归模型, 事实上 deleted residual 与普通 residual
有一简单关系, 即 d_i = e_i/√(1-h_i).
而 studentized deleted residual 是以其标准误校正结
果, 就像一般的 t 统计量.
因此, 若 studentized deleted residual 绝对值偏高,
表示这点与其他点可能属不同模型, 即这一点的反应值是
outlier.
: cook's Di statistic
若 outlier 发生在 h_i 较大, 也就是离观测点中心较远
时, 将扭曲估计结果. 也就是说: 最小平方估计结果会受
这样的点重大影响, 是所谓 influential point.
Cook's D 就是检测影响点的一个指标.
: variance inflationary factor
当解释变数间相关(复相关)太高时, 即所谓 "多重共线性"
问题. 完全的共线性使回归系数的估计发生问题; 不完全
的共线性(高复相关)则使回归系数估计结果不稳定 (标准
差或变异数偏高). VIF就是检查自变数间的相关会造成回
归系数估计量的标准差将被扩大成几倍/
: the Cp statistic
选模的一种指标, 由 "预测误差" 的想法而来, 是均方预
测误差与纯误差均方的比. 但因不同数量的解释变数 Cp
的期望值不同, 因此引发在选模上究竟要取 Cp 最小或取
Cp 最接近期望值的争议.
: 分别是在检定什麽吗?我只知公式,但我不
: 了解它们的涵意,就要期末考了>"<
: 麻烦各位帮忙一下!
: 谢谢
--
统计专业版需要你! 不论你是统计高手或初学, 是统计专业或应用领域人才, 欢迎光临!
成大计中站 telnet://bbs.ncku.edu.tw Statistics (统计方法及学理讨论区)
无名小站 telnet://wretch.twbbs.org Statistics (统计方法讨论区)
盈月与繁星 telnet://ms.twbbs.org Statistics (统计:让数字说话)
交大资讯次世代 telnet://bs2.twbbs.org Statistics (统计与机率)
批踢踢实业站 telnet://ptt.cc Statistics (统计学及统计软体版)
--
㊣Origin:《
成大计中 BBS 站 》[bbs.ncku.edu.tw] 来源:[pc117.stat.ncku.edu.tw]