作者cwshih (cwshih)
看板Statistics
标题[问题] 关於串档及存活率分析
时间Sat Dec 27 23:25:55 2014
如果是跟统计软体有关请重发文章。
如果跟论文有关也烦请您重发文章。
请详述问题内容,以利板友帮忙解答,过短文章依板规处置,请注意。
是这样的
目前在进行健保资料的研究
想把住院档(dd档)串门诊档(cd档)及承保档(id档)
住院档已经利用整合功能将同ID同次住院但申报多笔的资料整合
以整合过的住院档串门诊档时
一直觉得串出来的不正确
因为
根据疾病特性
出院後应该会有多笔门诊返诊时间(至少半年要返诊追踪一次)
所以预期串出来的门诊档人数会比住院档人数多
但是
我串出来之後
住院人数是几笔门诊人数就是几笔(我是以ID进行两表的资料合并)
想请问
1.如果住院档只有一笔(也就是只住院一次)但门诊有三笔
那串出来会如何呈现呢?
是像
(A)会出现空格
ID IN_DATE OPD_DATE
1245 20120101 20120601
20121201
20130601
还是像
(B)会把空格填满
ID IN_DATE OPD_DATE
1245 20120101 20120601
1245 20120101 20121201
1245 20120101 20130601
因为我是选择两表皆提供观察值
所以如果像A一样的话
那我就会删掉很多笔了.....
另外
想问一个存活率的问题
我手边共有5年的资料
想知道第一年存活率和第三年存活率
应该怎样去设定时间呢(或者是说应该如何去进行这样的分析)
为什麽这麽问呢?
因为每个病人的开刀时间都不一样
假设我的5年资料是20080101-20131231
有一个病人是20131205开刀
然後活着回家
可是这样也不能算一年啊
又如果
有病人是20080625开刀
然後一直存活到20131231都没有显示死亡
那当然这个病人第三年依然存活
如果直接把全部的资料丢进去跑存活分析
似乎有点怪怪的
所以想请问大家
是否有比较好的做法
谢谢大家
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 61.228.181.141
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/Statistics/M.1419693957.A.D7C.html
1F:推 imaltar: 你是直接用dd档串cd档吗 这样id会是多对多并档 12/27 23:35
2F:→ imaltar: 合并资料要1对1或1对多 12/27 23:36
3F:→ cwshih: 对不起,我没看懂1对1或1对多..,所以我现在应该怎麽做呢? 12/27 23:51
4F:→ cwshih: 我的确是直接用dd档串cd档 12/27 23:52
5F:推 imaltar: dd档一个id有好几笔 cd档一个id也有好几笔 直接并就是多 12/27 23:57
6F:→ imaltar: 对多, 这样就会有误 12/27 23:58
7F:→ imaltar: 应该是先筛出疾病id档, 这个档一个id只会有一笔资料, 12/28 00:00
8F:→ cwshih: 所以...我把住院档的重覆ID删掉,让每笔ID都是一个,这样去 12/28 00:01
9F:→ imaltar: 再分别去串cd档和dd档, 这样就会有正确的门诊和住院次数 12/28 00:01
10F:→ cwshih: 串吗? 12/28 00:02
11F:→ imaltar: 例如住院档的第一笔ID, 可能就是因此疾病第一次住院纪录 12/28 00:02
12F:→ imaltar: 再分别并CD DD 12/28 00:03
13F:→ cwshih: 所以,DD档要做两次吗?第一次先找出因此病开刀的ID 12/28 00:06
14F:→ cwshih: 然後山除重覆ID(因为可能一个人在五年内开两次或三次) 12/28 00:07
15F:→ cwshih: 然後用只有一笔ID的DD档去串门诊档及承保档 12/28 00:08
16F:推 imaltar: 看你的定义, 是第一次的就纳入, 还是两次以上才是你的研 12/28 00:08
17F:→ cwshih: 这样做可行吗? 12/28 00:09
18F:→ imaltar: 究样本, 总之就是要先抓出只有单笔资料的ID档 再去串档 12/28 00:09
19F:→ cwshih: 了解,我去试试,谢谢你 12/28 00:11