作者kasey ( )
看板Statistics
标题[问题] panal/longitudinal data 问题
时间Sun Oct 25 17:48:38 2015
如果是跟统计软体有关请重发文章,使用程式做为分类。
请详述问题内容,以利板友帮忙解答,过短文章依板规处置,请注意。
为避免版面混乱,请勿手动置底问题,擅用E做档案编辑
大家好, 我有个问题想请教
目前有一个 data set, 是 panal data, 可是他是 unbalanced 的资料
变数有 Quarter, Employee Id, Hospital Visit,
Salary, Health Score, 和一些 demograpgics 的资料
我想验证 Health Score 是否会随着时间增加而增加,
还有画一些图看 Health Score 跟其他变数的关系
请问在画scatter plot方面,
直接用整个dataset去做会有问题吗? 还是要分成不同的subset?
虽然我觉得直接用应该可以, 不过还是想询问大家的意见.
然後在 验证 Health Score 是否会随着时间增加而增加,
这方面我不太确定该怎麽做, 因为每个quarter的人数组成都不一样,
直觉上用普通的 Linear Model (把 quarter 放在解释变数中) 可能有问题
p.s. 目前单用每quarter的平均值来看, Health Score 随时间是有增加的.
可以请大家给点意见吗? 谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 50.131.13.101
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1445766520.A.B84.html