作者silent910 (唉呀呀)
看板R_Language
標題[問題] 二維度的資料加總
時間Fri Sep 19 21:14:25 2014
[軟體熟悉度]:
請把以下不需要的部份刪除
使用者(已經有用R 做過不少作品)
[問題敘述]:
各位R使用者,我有一個問題,就是我有一筆資料,資料欄位分別為使用者ID
,影片ID(假設影片總共有三部)以及影片的觀看時間,記錄使用都在觀看影片
的情形,而每一個使用者有可能會重複觀看某一個影片,觀看影片的時間也
有可能不同,而我想知道使用者在他觀看每一部影片的總時間是如何?
是要使用哪一個函數??
for example:
id video_id time(min)
1 a 10
2 a 5
2 a 5
3 b 1
1 c 6
2 b 7
3 c 2
3 a 5
那我想得到結果是:
id\video_id a b c
1 10 0 6
2 10 7 0 中間的數值為觀看影片時間的加總
3 5 1 0
感謝大家~~~
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 113.28.26.107
※ 文章網址: http://webptt.com/m.aspx?n=bbs/R_Language/M.1411132468.A.134.html
1F:→ celestialgod: dat = $(data); output = tapply(dat$time, list( 09/19 22:06
2F:→ celestialgod: dat$id, dat$video_id), sum) 09/19 22:06
3F:→ silent910: c大你好,我試過了, dat = $(data)似乎不能用 09/22 07:12
4F:→ raysonic: library(reshape2) 09/22 10:59
5F:→ raysonic: dcast(melt(A,id=c("id","video_id")), id~video_id,sum 09/22 11:01
6F:→ raysonic: A 是你的資料 09/22 11:01
7F:→ celestialgod: $(data) 是你的資料拉 09/23 10:10