作者jasonhsu14 (14號星期五的傑森)
看板Statistics
標題[問題] 共線性情況下的判定係數有參考性嗎
時間Thu Dec 3 12:56:11 2020
各位前輩好
小弟這邊有個複迴歸的共線性問題想請教一下
就是我的自變量有兩個,但這兩個自變量本身是高度相關
那在"完全不處理共線性"的情況下
我的第一個問題是
我這樣跑迴歸跑出來的迴歸參數估計值beta,對於我輸入不同的自變量所預測到的依變量Y
這樣情況下的Y,是否適合採納?
第二個問題是
若上述的Y適合採納的情況下,那這條回歸方程式的判定係數R平方,是否還有參考性
以上兩個問題,還麻煩版友們協助
也先謝謝願意耐心看到此段落並了解我問題的版友們
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.230.23.231 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1606971373.A.765.html
1F:→ andrew43: 預測值唯有自變數範圍且相關性皆與原始資料相仿才會準 12/03 14:06
2F:推 rebe212296: 請搜尋張翔老師的共線性診斷影片 12/03 14:27
3F:→ rebe212296: 自變量有幾個就有幾個迴歸係數 12/03 14:28
4F:推 west1996: 1. 既然x間可替換,yhat值自然會算出同樣的數,所以可以 12/03 14:36
5F:→ west1996: 用 12/03 14:36
6F:→ west1996: 2. rsquare公式只與y跟yhat有關,與bets無關,所以可用 12/03 14:36
謝謝樓上諸位的回答
※ 編輯: jasonhsu14 (220.135.101.201 臺灣), 12/06/2020 10:16:30
7F:→ locka: 借題想問:所謂兩個自變數高度相關,聽起來是其中一個變數 12/07 08:32
8F:→ locka: 對y的解釋性可以大部分由另一個變數代替(也就是第2個變數對 12/07 08:32
9F:→ locka: y的解釋性有限),那這個時候放第2個變數不是增加複雜度嗎? 12/07 08:32
10F:→ locka: 想問這情況下判斷要不要留第二個變數的準則是什麼呢? 12/07 08:32
11F:推 west1996: 看建模目的而定,沒有標準答案 12/08 00:02
12F:推 iphone2003: 應該要先確認「可用」的意思是什麼?共線性發生時,X 12/08 15:15
13F:→ iphone2003: ’X接近nonsingular,因此beta估計量跟yhat的variance 12/08 15:15
14F:→ iphone2003: 會很大 12/08 15:15
15F:推 ee012345: 高度共線性的時候,beta估計的變異很大,但y的變異沒差 12/13 10:04
16F:→ ee012345: 所以如果只是預測(y)的話沒問題,但模型(beta)不好解釋 12/13 10:06
17F:→ ee012345: 至於要保留哪個變數是模式選擇的問題 12/13 10:07
18F:→ ee012345: 有人會選讓Rsquare最低的,也有人取平均直接取代他們 12/13 10:08