R_Language 板


LINE

※ 引述《wmj10054039 (MJ)》之铭言: : ※ 引述《celestialgod (天)》之铭言: : : 程式: : : library(data.table) : : library(pipeR) : : library(stringr) : : dataStr <- "流水号 课程名称 时间 地点 人数 : : 102 A 二3,4四5,7 甲 10 : : 248 B 一1,2,3 乙 20 : : 314 C 三4五7,8,a 丙 5" : : removeEmptyFunc <- function(x) x[nchar(x) > 0] : : fread(dataStr) %>>% : : `[`(j = `:=`(星期 = str_split(时间, "[a-zA-Z0-9,]+") %>>% : : lapply(removeEmptyFunc), : : 节次 = str_split(时间, "[^a-zA-Z0-9,]+") %>>% : : lapply(removeEmptyFunc))) %>>% : : `[`(j = .(星期 = unlist(星期), 节次 = unlist(节次)), : : by = .(流水号, 课程名称, 地点, 人数)) %>>% : : `[`(j = `:=`(节次 = str_split(节次, ","))) %>>% : : `[`(j = .(节次 = unlist(节次)), by = .(流水号, 课程名称, 地点, 人数, 星期)) : : ## no pipe 程式码 : : dataDT <- fread(dataStr) : : dataDT[ , `:=`(星期 = lapply(str_split(时间, "[a-zA-Z0-9,]+"), : : removeEmptyFunc), : : 节次 = lapply(str_split(时间, "[^a-zA-Z0-9,]+"), : : removeEmptyFunc))] : : tmpDT <- dataDT[ , .(星期 = unlist(星期), 节次 = unlist(节次)), : : by = .(流水号, 课程名称, 地点, 人数)] : : tmpDT[ , `:=`(节次 = str_split(节次, ","))] : : tmpDT[ , .(节次 = unlist(节次)), by = .(流水号, 课程名称, 地点, 人数, 星期)] : : 结果: : : # 流水号 课程名称 地点 人数 星期 节次 : : # 1: 102 A 甲 10 二 3 : : # 2: 102 A 甲 10 二 4 : : # 3: 102 A 甲 10 四 5 : : # 4: 102 A 甲 10 四 7 : : # 5: 248 B 乙 20 一 1 : : # 6: 248 B 乙 20 一 2 : : # 7: 248 B 乙 20 一 3 : : # 8: 314 C 丙 5 三 4 : : # 9: 314 C 丙 5 五 7 : : # 10: 314 C 丙 5 五 8 : : # 11: 314 C 丙 5 五 a : 我在回应区的问题是想要把如果节次包含3节以上的课程,只取出头跟尾的节次,并且只有 : 一节课的课程重复两次,也就是说每个课程重复在dataframe的次数都会是偶数倍(主要 : 目的是想知道每个时段下不同地点会产生的进出人数),举例来说: : 流水号 课程名称 时间 人数 地点 : 102 A 二3,4四5,7 10 甲 : 248 B 一1,2,3 20 乙 : 314 C 三4五7,8,a 5 丙 : 整理成 : 流水号 课程名称 地点 人数 星期 节次 : 102 A 甲 10 二 3 : 102 A 甲 10 二 4 : . . : . . : . . : 248 B 乙 20 一 1 : 248 B 乙 20 一 3 : 314 C 丙 5 三 4 : 314 C 丙 5 三 4 : 314 C 丙 5 五 7 : 314 C 丙 5 五 a : 我目前的想法是利用c大处理我之前问题的方法,将已经把时间拆开成星期跟节次但 : 还没unlist的节次取出,用回圈搭配条件判断存成新的list再放回data.frame,但发现 : 这个方法存成的list只会有最後一个元素有值,其他都是NULL。想请教是哪边有错误, : 或是有更好的解决方法,谢谢。 : [程式范例] : oldlist = df$节次 : newlist = list() : for (i in length(oldlist)) { : if (length(oldlist[[i]]) == 1){ : newlist[[i]] = rep(oldlist[[i]][1], 2) : }else if (length(oldlist[[i]]) == 2){ : newlist[[i]] = c(oldlist[[i]][1], oldlist[[i]][2]) : }else if (length(oldlist[[i]]) == 3){ : newlist[[i]] = c(oldlist[[i]][1], olslist[[i]][3]) : } : } 直接用原本整理好的data.table在整理一下就好了 (outDT是前次的输出) # 先转成factor (节次为1~8 然後接A~E,如果不对再自行调整) # 这样会转成整数比较好做 outDT[ , 节次 := factor(节次, c(1:8, letters[1:5]))] # 用diff找出前後都相差1的节次还把它们移除掉 outDT[ , filter := diff(c(-2, 节次)) == 1 & diff(c(节次, 20)) == 1, by = .(流水号, 课程名称, 地点, 人数, 星期)] # 过滤掉前後都相差1的节次 finalDT <- outDT[filter == FALSE] # 把filter这个栏位移除掉 finalDT[ , filter := NULL] # 最後: # 流水号 课程名称 地点 人数 星期 节次 # 1: 102 A 甲 10 二 3 # 2: 102 A 甲 10 二 4 # 3: 102 A 甲 10 四 5 # 4: 102 A 甲 10 四 7 # 5: 248 B 乙 20 一 1 # 6: 248 B 乙 20 一 3 # 7: 314 C 丙 5 三 4 # 8: 314 C 丙 5 五 7 # 9: 314 C 丙 5 五 a --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.233.83.41
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1528288066.A.8F0.html ※ 编辑: celestialgod (36.233.83.41), 06/06/2018 20:29:25
1F:推 wmj10054039: 感谢C大和Wush大 ~~收益良多! 06/07 20:54







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:BabyMother站内搜寻

TOP