作者ntpuisbest (阿龍)
看板R_Language
標題[問題]用迴圈整理同個ID的看病次數
時間Sat Jun 9 12:24:10 2018
library(COUNT)
data(rwm5yr)
medical<-rwm5yr
https://imgur.com/xLr3I5j
我的目的是像這樣
同個id是同個人
我想要把資料整理成
去計算同個人的 總共 的看病次數
其他的column 就用 同個id最後的 資訊
最後要整理成
id docvis age
1 1 56
2 4 48
3 13 62
請問有套件可以做到這件事情嗎
還是怎麼寫這個迴圈呢
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.114.237.189
※ 文章網址: https://webptt.com/m.aspx?n=bbs/R_Language/M.1528518253.A.295.html
1F:推 locka: medical %>% group_by(id) %>% summarize(docvis=n(), age= 06/09 12:51
2F:→ locka: max(age)) 06/09 12:51
3F:→ locka: dplyr group_by() +pipe 應該是最直覺好讀的方法? 06/09 12:52
4F:→ locka: 更正 docvis=n () 應該為docvis=sum(docvis) 06/09 12:54
6F:→ ntpuisbest: 請問其他變數該怎麼處理有沒有辦法指定 06/09 13:03
就是可不可以讓medical的[,2:12]都是類似age=max的結果
另外可以讓hhninc 取平均數嗎
謝謝大大
※ 編輯: ntpuisbest (140.114.237.189), 06/09/2018 13:05:48
7F:推 piggood: summarise_all(funs(last)) 06/09 13:07
8F:→ piggood: 可以保留唯一 ID 所有欄的最後一筆資料 06/09 13:08
9F:推 piggood: 平均值就是用 mean(hhninc) 06/09 13:11
10F:→ piggood: 不過 summarise 跟 summarise_all 沒辦法一起使用 06/09 13:12
那這樣看起來我還是必須要
慢慢打了
因為我的docvis一定要加總才行
※ 編輯: ntpuisbest (140.114.237.189), 06/09/2018 13:16:39
11F:推 locka: 感謝piggood大大分享,原來summarise_all是這樣用…以前一 06/09 13:32
12F:→ locka: 直沒搞懂XD 06/09 13:32
13F:→ locka: 原po可以分別用summarise跟summarise_all做完後再合併…… 06/09 13:37
14F:→ locka: 其他只好等版上大神回應了 06/09 13:37