看板Statistics
標 題Re: [問題] 被統計搞瘋啦~~~有誰能指教一下的
發信站成大計中BBS (Fri Jun 17 10:26:13 2005)
轉信站ptt!Group.NCTU!grouppost!Group.NCTU!nckubbs
※ 引述《[email protected] (you got it)》之銘言:
: 有人能跟我說多元迴歸分析中的
: hat matrix diagonal elements
考慮簡單直線迴歸的情形:
h_i = (1/n) + (x_i-\bar{x})^2/Σ(x_j-\bar{x})^2
可以發現: h_i 代表的是第 i 點的 x 值與中心相距多遠
(除了多一個常數 1/n 以外).
對複迴歸, 其意義也是相同: h_i 愈大, 表示該點就自變
數所處位置而言, 離中心較遠. 你可以用兩自變數的情形
驗證之.
: studentized deleted residual
"deleted residual" 是去掉 "待測點" 後, 配適原模型,
然後計算待測點與根據該估計模型預測結果之離差. 在線
性迴歸模型, 事實上 deleted residual 與普通 residual
有一簡單關係, 即 d_i = e_i/√(1-h_i).
而 studentized deleted residual 是以其標準誤校正結
果, 就像一般的 t 統計量.
因此, 若 studentized deleted residual 絕對值偏高,
表示這點與其他點可能屬不同模型, 即這一點的反應值是
outlier.
: cook's Di statistic
若 outlier 發生在 h_i 較大, 也就是離觀測點中心較遠
時, 將扭曲估計結果. 也就是說: 最小平方估計結果會受
這樣的點重大影響, 是所謂 influential point.
Cook's D 就是檢測影響點的一個指標.
: variance inflationary factor
當解釋變數間相關(複相關)太高時, 即所謂 "多重共線性"
問題. 完全的共線性使迴歸係數的估計發生問題; 不完全
的共線性(高複相關)則使迴歸係數估計結果不穩定 (標準
差或變異數偏高). VIF就是檢查自變數間的相關會造成迴
歸係數估計量的標準差將被擴大成幾倍/
: the Cp statistic
選模的一種指標, 由 "預測誤差" 的想法而來, 是均方預
測誤差與純誤差均方的比. 但因不同數量的解釋變數 Cp
的期望值不同, 因此引發在選模上究竟要取 Cp 最小或取
Cp 最接近期望值的爭議.
: 分別是在檢定什麼嗎?我只知公式,但我不
: 了解它們的涵意,就要期末考了>"<
: 麻煩各位幫忙一下!
: 謝謝
--
統計專業版需要你! 不論你是統計高手或初學, 是統計專業或應用領域人才, 歡迎光臨!
成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區)
無名小站 telnet://wretch.twbbs.org Statistics (統計方法討論區)
盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話)
交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率)
批踢踢實業站 telnet://ptt.cc Statistics (統計學及統計軟體版)
--
㊣Origin:《
成大計中 BBS 站 》[bbs.ncku.edu.tw] 來源:[pc117.stat.ncku.edu.tw]