作者riviera (Nikita~)
看板Statistics
标题[问题] GEE IV选择的疑问
时间Sat Sep 23 17:51:26 2017
我有一群重复测量的大脑老化的数据,尝试用SPSS GEE分析。
DV是脑部的网路改变
IV是类淀粉堆积
主要是看DV随时间的变化,会不会因为类淀粉堆积的不一样,有所不同
所以 IV= time, 类淀粉堆积, 类淀粉堆积 x time,
age, gender, sex, race 也会一起control
做出来是有interaction。
但我的问题是,其实还有其他很多重要的IV, 起码有四个以上,这些跟脑部老化都有相关
是要每一个都放进去model吗? 理论上放进去是合理的
但都加上 Variable, variable x time....ect,这样往往最後都会不显着,
虽说这些新加的IV彼此是没有相关的,
解释上难道说,事後来放进去的 IV其实对DV影响较大吗?
但是最後的model还有每一个IV都是不显着的。
问一下,
有没有类似 stepwise regression中可以选择该放那些IV的方法吗?
有点类似let model select the best fit variable ?
当有太多IV要放,IV x time也要放,这样run GEE可以吗?
谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 210.242.90.181
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1506160288.A.58E.html
1F:推 goodpoint: 先搞清楚interaction的意义. 还有你的DV是连续型变数吗 09/24 23:44
2F:→ goodpoint: 自变数的类淀粉堆积是连续还是类别 ? 类淀粉堆积是 09/24 23:44
3F:→ goodpoint: time dependent还是time independent variable ? 09/24 23:45
4F:→ goodpoint: GEE里面没有stepwise 那种. GEE的model fit是用别的参 09/24 23:46
5F:→ goodpoint: 数. 我建议你找一个生统的专家帮你分析你的data 09/24 23:46
6F:→ goodpoint: 我觉得你没搞清楚 variable*time放入model是啥意思 09/24 23:48
7F:→ riviera: 都是连续变项。 09/25 13:46
8F:→ riviera: Interaction 主要是看IV对DV随时间的改变有无不同 09/25 13:48
9F:→ riviera: 现在的问题是IV的选择。有无一个依循? 09/25 13:50