作者bmka (偶素米虫)
看板R_Language
标题Re: [问题] 拆解time-dependent的资料
时间Wed Apr 22 19:28:28 2015
※ 引述《celestialgod (攸蓝)》之铭言:
: ※ 引述《yummy7922 (crucify)》之铭言:
: : [问题类型]:
: : 程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
: : [软体熟悉度]:
: : 请把以下不需要的部份删除
: : 入门(写过其他程式,只是对语法不熟悉)
: : [问题叙述]:
: : 请简略描述你所要做的事情,或是这个程式的目的
: : 资料是多个人的重复测量资料,每个人的观察笔数并不相同,
: : 其中有一个会变动的变数(ex:用药资料,某几次有吃,某些次没有吃),
: : 资料大概是长这样:
: : ID M1 duration IS ID start stop M1 IS
: : 1 1 1 0 1 0 1 1 0
: : 1 0 2 0 1 1 4 0 1
: : 1 0 3 0 2 0 3 1 0
: : 1 0 4 1 2 3 5 0 0
: : 2 1 1 0 3 0 1 1 0
: : 2 1 2 0 ---> 3 1 2 0 1
: : 2 1 3 0
: : 2 0 4 0
: : 2 0 5 0
: : 3 1 1 0
: : 3 0 2 1
: : 资料中M1是会变动的变数,is是我的outcome,
: : 希望可以转变成右方的样子,即,如果有资料变动就做纪录,
: : 就是一般要处理time-dependent survival的样子,
: : 目前只知道sas该怎麽处理,想来请教各位,
: : R应该怎麽做转换,谢谢大家
: I do not know whether there is a function to do this in R,
: but I do this by dplyr.
: library(data.table)
: library(dplyr)
: library(magrittr)
: dat = data.frame(ID = rep(1:3, c(4, 5, 2)), M1 = c(1,rep(0:1,
: each=3),0,0,1,0)) %>% tbl_dt(FALSE)
: dat = dat %>% group_by(ID) %>% mutate(duration = 1:length(M1), IS = 0)
: dat$IS[c(4, 11)] = 1
: dat %>% group_by(ID) %>%
: summarise(stop = cumsum(rle(M1)$lengths),
: M1 = rle(M1)$values,
: IS = IS[cumsum(rle(M1)$lengths)]) %>% group_by(ID) %>%
: mutate(start = c(0, stop[1:(length(stop)-1)]))
: ID stop M1 IS start
: 1 1 1 1 0 0
: 2 1 4 0 1 1
: 3 2 3 1 0 0
: 4 2 5 0 0 3
: 5 3 1 1 0 0
: 6 3 2 0 1 1
: 补充一点,如果资料量大,请把rle的计算过程独立成另一个变数,不然算太多次会有点
: 久,这里只是方便写法,懒得另立变数。
: 当然只要有group_by 都可以用tapply做,只是比较麻烦就不写了
不必那麽麻烦, 多生一个start column就可以
start <- tapply(duration, ID, function(x){ c(0, x[-length(x)])})
多切几个subinterval其实没关系
懂得partial likelihood的原理就知道出来的结果是一样的
老话一句,基本观念最重要
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 73.213.28.43
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1429702109.A.E74.html
1F:→ celestialgod: 哈哈,我根本不知道他要跑什麽,我只是弄成他要的 04/22 20:18
2F:→ celestialgod: 样子。 04/22 20:18
3F:推 celestialgod: 谢谢大大补充。 04/22 20:18
4F:推 celestialgod: 更正,谢谢大大指导QQ 04/22 20:24
5F:→ bmka: 现在才发现这里是R版,不是统计版...歹势了 04/22 20:48
6F:→ bmka: 请继续讨论程式写法 >_< 04/22 20:50
7F:→ celestialgod: 大大,统计在这里也很重要,不走冤枉路才是写程式 04/22 22:00
8F:→ celestialgod: 最好的不二法门。 04/22 22:00
9F:推 yummy7922: 谢谢你们,因为还要观察实际的转换情形,另外处理 04/23 12:54
10F:→ yummy7922: 所以才会想准确的切割,谢谢你们的指教唷! 04/23 12:55