作者riviera (Nikita~)
看板Statistics
標題[問題] GEE IV選擇的疑問
時間Sat Sep 23 17:51:26 2017
我有一群重複測量的大腦老化的數據,嘗試用SPSS GEE分析。
DV是腦部的網路改變
IV是類澱粉堆積
主要是看DV隨時間的變化,會不會因為類澱粉堆積的不一樣,有所不同
所以 IV= time, 類澱粉堆積, 類澱粉堆積 x time,
age, gender, sex, race 也會一起control
做出來是有interaction。
但我的問題是,其實還有其他很多重要的IV, 起碼有四個以上,這些跟腦部老化都有相關
是要每一個都放進去model嗎? 理論上放進去是合理的
但都加上 Variable, variable x time....ect,這樣往往最後都會不顯著,
雖說這些新加的IV彼此是沒有相關的,
解釋上難道說,事後來放進去的 IV其實對DV影響較大嗎?
但是最後的model還有每一個IV都是不顯著的。
問一下,
有沒有類似 stepwise regression中可以選擇該放那些IV的方法嗎?
有點類似let model select the best fit variable ?
當有太多IV要放,IV x time也要放,這樣run GEE可以嗎?
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 210.242.90.181
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1506160288.A.58E.html
1F:推 goodpoint: 先搞清楚interaction的意義. 還有你的DV是連續型變數嗎 09/24 23:44
2F:→ goodpoint: 自變數的類澱粉堆積是連續還是類別 ? 類澱粉堆積是 09/24 23:44
3F:→ goodpoint: time dependent還是time independent variable ? 09/24 23:45
4F:→ goodpoint: GEE裡面沒有stepwise 那種. GEE的model fit是用別的參 09/24 23:46
5F:→ goodpoint: 數. 我建議你找一個生統的專家幫你分析你的data 09/24 23:46
6F:→ goodpoint: 我覺得你沒搞清楚 variable*time放入model是啥意思 09/24 23:48
7F:→ riviera: 都是連續變項。 09/25 13:46
8F:→ riviera: Interaction 主要是看IV對DV隨時間的改變有無不同 09/25 13:48
9F:→ riviera: 現在的問題是IV的選擇。有無一個依循? 09/25 13:50