作者tHEiPHoNe ( )
看板R_Language
標題[問題] 依照區間切割資料
時間Wed Jan 6 17:55:42 2016
有一組消費者資料
id date
1 1204
1 1205
1 1209
1 1210
1 1211
2 1201
2 1202
2 1205
2 1207
3 1204
3 1206
若同一user不間斷天數消費則計算為同一筆
不同user或是間斷消費天數則計入下一筆
如下
id date num
1 1204 1
1 1205 1
1 1209 2
1 1210 2
1 1211 2
2 1201 3
2 1202 3
2 1205 4
2 1207 5
3 1204 6
3 1206 7
想請問有建議使用的function嗎?
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 202.89.121.17
※ 文章網址: https://webptt.com/m.aspx?n=bbs/R_Language/M.1452074144.A.996.html
※ 編輯: tHEiPHoNe (202.89.121.17), 01/06/2016 18:01:18
1F:→ andrew43: 我只會for()下去…… 01/06 23:45
2F:推 JackBaska: 如果只有一個主要依據如日期 或User 那就 dplyr 01/07 00:26
3F:→ JackBaska: group_by(date) , cut 加入區間 01/07 00:27
4F:→ JackBaska: 這個問題我會有點不太懂因為就敘述我會覺得應該是單分 01/07 00:28
5F:→ JackBaska: date資料或單分消費者資料 , 但依原PO分法後處理會變 01/07 00:28
6F:→ JackBaska: 很髒 01/07 00:28
7F:推 JackBaska: 另外只要對資料做 as.Date 就可以直接用factor階級做 01/07 00:37
8F:→ JackBaska: filter 01/07 00:37