R_Language 板


LINE

※ 引述《celestialgod (天)》之铭言: : ※ 引述《henry48124 (= =)》之铭言: : : [问题类型]: : : 程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来) : : [软体熟悉度]: : : 入门(写过其他程式,只是对语法不熟悉) : : [问题叙述]: : : 各位大大好,我有一笔资料长得像是: : : head(df) : : id place count : : 1 A 1 : : 1 B 1 : : 2 B 1 : : 2 C 3 : : 3 D 2 : : 4 A 1 : : 4 C 2 : : 4 D 5 : : 5 B 1 : : 我希望能让他变成 : : id count top_place1 top_place2 : : 1 2 A B : : 2 4 C B : : 3 2 D : : 4 8 D C : : 5 1 B : : [程式范例]: : : 这是我目前的做法,总觉得写得怪怪的,如果未来要做到 top100 就不能这样写 : : 谢谢各位 Orz : : library(dplyr) : : answer <- NULL : : for(x in as.list(unique(df$id))) { : : df_id <- df %>% : : filter(id == x) %>% : : arrange(-count) : : count <- sum(df$count) : : top_place1 <- NA : : top_place2 <- NA : : col <- c(x, count, top_place1, top_place2) : : for(y in 1:nrow(df_id)) { : : if(y <= 2) { : : col[y+2] <- df_id[y,]$place : : } : : answer <- rbind(answer, col) : : } : : [环境叙述]: : : [关键字]: : method 1是硬干,可以直接先看method 2 : library(data.table) : library(stringr) : library(pipeR) : DT <- data.table(id = rep(1:5, c(2,2,1,3,1)), : place = c("A","B","B","C","D","A","C","D","B"), : count = c(1,1,1,3:1,2,5,1)) : ## method 1: : setorder(DT, id, -count, -place) : numRank <- 3 : DT[ , .(lapply(1:numRank, function(i){ : ifelse(length(place) >= i, place[i], "") : }) %>>% transpose %>>% sapply(str_c, collapse = ",")), by = .(id)] %>>% : `[`(j = str_c("top_place", 1:numRank) := transpose(str_split(V1, ",")), : by = .(id)) %>>% : `[`(j = V1 := NULL) %>>% : merge(DT[ , .(count = sum(count)), by = .(id)], by = "id") : # id top_place1 top_place2 top_place3 count : # 1: 1 A B 2 : # 2: 2 C B 4 : # 3: 3 D 2 : # 4: 4 D C A 8 : # 5: 5 B 1 : ## method 2: : setorder(DT, id, -count, -place) : numRank <- 3 : DT[ , rr := length(count) - frank(count, ties.method = "first")+1, by = .(id)] : DT[rr %in% 1:numRank] %>>% : dcast(id ~ rr, value.var = "place") %>>% : setnames(as.character(1:numRank), str_c("top_place", 1:numRank)) %>>% : merge(DT[ , .(count = sum(count)), by = .(id)], by = "id") : # id top_place1 top_place2 top_place3 count : # 1: 1 A B NA 2 : # 2: 2 C B NA 4 : # 3: 3 D NA NA 2 : # 4: 4 D C A 8 : # 5: 5 B NA NA 1 我的作法是这样: library(dplyr) library(magrittr) library(tidyr) df <- data.frame(id = rep(1:5, c(2,2,1,3,1)), place = c("A","B","B","C","D","A","C","D","B"), count = c(1,1,1,3:1,2,5,1), stringsAsFactors = FALSE) %>% tbl_df() df %>% group_by(id) %>% mutate(seq = order(count, decreasing = TRUE), sumCount = sum(count)) %>% filter(seq <= 2) %>% ungroup() %>% mutate(seqName = sprintf('top_place%s', seq)) %>% select(-count, -seq) %>% spread(key = seqName, value = place, fill = NA) # A tibble: 5 x 4 id sumCount top_place1 top_place2 * <int> <dbl> <chr> <chr> 1 1 2 A B 2 2 4 C B 3 3 2 D <NA> 4 4 8 D C 5 5 1 B <NA> --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.160.116.220
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1502630653.A.3AD.html







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Boy-Girl站内搜寻

TOP