作者cawaiilulu (across)
看板Statistics
標題[問題]共線性與預測準確度
時間Wed Dec 23 13:37:07 2015
我建了一個模型 共10個變項 共線性設定vif<5
但是還是有共線性問題 其中三個變項的正負號反過來了
我試著剔除一些相對不合理的變項
但是只要剔除一個 準確率就會下降很多 大約3-4%
例如 兩萬個人1/0預測 就會差距到快一千人左右
我用了幾個不同的樣本去測試模型 全都得到同樣的結論
就是原來的模型最好 但是卻有三個解釋起來很麻煩(其實兩兩比較也很麻煩)的變項
請問大家有遇過這種情況嗎? 如果在原模型精準度比較高的情況下
要怎麼處理這些正負號反過來的變項?
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 74.135.39.138
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1450849031.A.03C.html
1F:→ celestialgod: 只是預測可以考慮PLS,如果要解釋模型就要嘗試 12/23 13:39
2F:→ celestialgod: 畫圖去找出哪一組的交互作用影響的 12/23 13:39
3F:→ celestialgod: 不完全是主作用造成正負號不同 12/23 13:40