R_Language 板


LINE

※ 引述《criky (立業成家)》之銘言: : [問題類型]: : : 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) : [軟體熟悉度]: : 新手(沒寫過程式,R 是我的第一次) : [問題敘述]: : 我的資料像是學校的成績系統 : 欄位有學生id,學年,學期,科目id,科目名,成績 : 一個學生有n列, : 現在想將一個學生拉成一列 : 我是先paste(學年+學期),再用reshape函數作, : data.2<-reshape(data.1,v.names="成績",idvar="學號",timevar="學年學期 : ",direction="wide") : 但轉換後成績的部分, : 只有某個科目的成績, : 若用先paste(學年+學期+科目id),再用reshape函數作, : 是可以作出來,不過這樣NA值會很多, : 我想要用"每個學生的學期平均數"作整理 : 所以資料欄位會是1個學生id+8個學期平均: : 學生id 第1學年第1學期平均 第1學年第2學期平均 第2學年第1學期平均 : … : 不知道要怎麼寫, : 請問一下,謝謝。 : [環境敘述]: : win8 : [關鍵字]: : reshape library(data.table) library(dplyr) library(magrittr) # data generation # 假設一百個學生,五科,三年,上下兩學期 numStu <- 100 numSubject <- 5 numYear <- 3 numSemester <- 2 datBigTable <- data.table(stuID = rep(1:numStu, each = numSubject*numYear* numSemester), year = rep(102:(101+numYear), times = numStu*numSubject, each = numSemester), semester = rep(1:numSemester, times = numStu*numSubject*numYear), subjectID = rep(1:numSubject, times = numStu, each = numSemester*numYear)) datBigTable %<>% mutate(Grade = sample(1:100, nrow(.), TRUE), subjectName = c("國文", "英文", "數學", "自然", "社會")[subjectID]) %>% tbl_dt(FALSE) # Source: local data table [3,000 x 6] # # stuID year semester subjectID Grade subjectName # (int) (int) (int) (int) (int) (chr) # 1 1 102 1 1 32 國文 # 2 1 102 2 1 95 國文 # 3 1 103 1 1 95 國文 # 4 1 103 2 1 7 國文 # 5 1 104 1 1 60 國文 # 6 1 104 2 1 65 國文 # 7 1 102 1 2 85 英文 # 8 1 102 2 2 28 英文 # 9 1 103 1 2 33 英文 # 10 1 103 2 2 7 英文 # .. ... ... ... ... ... ... datBigTable %>% mutate(yearSemester = sprintf("%03i%02i", year, semester)) %>% group_by(stuID, yearSemester) %>% summarise(meanGrade = mean(Grade)) %>% dcast.data.table(stuID ~ yearSemester, value.var = "meanGrade") %>% tbl_dt(FALSE) # Source: local data table [100 x 7] # # stuID 10201 10202 10301 10302 10401 10402 # (int) (dbl) (dbl) (dbl) (dbl) (dbl) (dbl) # 1 1 47.4 55.0 36.2 12.8 60.4 36.8 # 2 2 59.2 58.2 58.0 36.4 57.2 47.8 # 3 3 53.8 59.2 60.8 54.2 65.4 34.0 # 4 4 70.0 69.4 66.2 42.2 48.8 45.0 # 5 5 52.8 64.8 34.2 39.4 59.4 50.0 # 6 6 50.0 50.2 45.2 60.6 59.0 68.6 # 7 7 38.0 46.6 50.0 49.6 32.2 52.2 # 8 8 53.4 58.6 47.0 37.6 56.8 47.8 # 9 9 26.6 64.0 37.6 25.2 65.4 55.2 # 10 10 47.0 40.2 26.4 45.6 65.6 40.0 # .. ... ... ... ... ... ... ... 原本想用tidyr:::spread,不過不知道怎麼了,dplyr更新到0.4.3就不給我用了Orz 更新,突然想到我轉換後的變數名稱是數字,所以才會不行.... library(tidyr) datBigTable %<>% mutate(year = year - 101) datBigTable %>% mutate(yearSemester = sprintf("第%i學年第%i學期平均", year, semester)) %>% group_by(stuID, yearSemester) %>% summarise(meanGrade = mean(Grade)) %>% spread(yearSemester, meanGrade) %>% tbl_dt(FALSE) # Source: local data table [100 x 7] # # stuID 第1學年第1學期平均 第1學年第2學期平均 第2學年第1學期平均 # (int) (dbl) (dbl) (dbl) # 1 1 54.6 51.4 41.4 # 2 2 57.6 49.4 63.6 # 3 3 46.8 62.2 51.4 # 4 4 45.0 62.8 60.0 # 5 5 43.8 49.6 43.8 # 6 6 54.4 44.0 59.2 # 7 7 47.6 65.4 52.0 # 8 8 63.6 68.2 75.2 # 9 9 40.4 41.6 50.0 # 10 10 39.0 52.4 50.2 # .. ... ... ... ... # # 第2學年第2學期平均 第3學年第1學期平均 第3學年第2學期平均 # ... ... ... -- R資料整理套件系列文: magrittr #1LhSWhpH (R_Language) http://tinyurl.com/1LhSWhpH data.table #1LhW7Tvj (R_Language) http://tinyurl.com/1LhW7Tvj dplyr(上) #1LhpJCfB (R_Language) http://tinyurl.com/1LhpJCfB dplyr(下) #1Lhw8b-s (R_Language) tidyr #1Liqls1R (R_Language) http://tinyurl.com/1Liqls1R --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.74.87
※ 文章網址: https://webptt.com/m.aspx?n=bbs/R_Language/M.1457341838.A.2C4.html
1F:推 criky: 板主簽名檔的文章套件幾乎可以整理大部分的資料啊~厲害! 03/07 22:22
2F:→ criky: 謝謝!我先試試有問題再請教 03/07 22:22
3F:→ criky: 我執行後有出現錯誤訊息如下: 03/08 16:14
4F:→ criky: Error in dcast.data.table(., stuID ~ yearSemester, 03/08 16:14
5F:→ criky: value.var = "meanGrade") :'data' must be a data.table. 03/08 16:15
6F:→ criky: 不知道還需要修改什麼? 03/08 16:16
你input的東西 不是data.table 要給tbl_dt或是給data.table在餵進這個函數前 dplyr版本 >= 0.4.3 data.table版本 >= 1.9.7 ※ 編輯: celestialgod (140.109.74.87), 03/08/2016 16:59:53







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Tech_Job站內搜尋

TOP