Re: [问题] 依变项分组的加总

时间Sun Dec 5 11:08:28 2021

下面的讨论是错在细节语法非常简单，但一些基本观念要先知道之後才不会重复犯错 ※ 引述《cheen885 ()》之铭言： : 标题: 依变项分组的加总 : 时间: Fri Dec 3 18:24:00 2021 : : 各位大大好，不好意思 : : 想请问 : : 我手边有一组资料 : : https://i.imgur.com/w453bWR.jpg : : : : 因为想依照日期（date）、医师（doctor ）、诊间时段（TimeofPeriod）分群，将最右 : 栏的premodel108个数值累加 : : 但是希望可以是 X1-X7、X8-X15的数值分别累加 : : 我打的程式码是： : : file<-mutate(group_by(file,date,doctor,TimeofPeriod),cum=cumsum(predmodel108 : )) : : 做出来的却是 X1-X15的累加QQ 其实就如celestialgod大所说，这个应该是对的等价於 file %>% group_by(date, doctor, TimeofPeriod) %>% mutate(cum=cumsum(predmodel108)) 原PO可以再确认看看我主要针对下面的讨论回覆 : : 想请问我的程式码应如何修正呢 : : 谢谢大家QQQQ : : -- :

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 101.9.114.174 (台湾) : ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1638527042.A.383.html : ※ 编辑: cheen885 (101.9.114.174 台湾), 12/03/2021 18:26:59 : 推 locka: file <- file %>% group_by(date, doctor,TimeofPeeiod) %> 12/03 18:43 : 推 locka: % summarise(sum=sum(premodel108) 12/03 18:43 : 推 locka: 然後既然都用 dplyr 了就用 pipeline 吧巢状的程式码不好 12/03 18:43 : 推 locka: 阅读 12/03 18:43 此处locka大用summarise，其实mutate和summarise是都可以但後面误会原PO的意思新变项是分组後「逐笔资料」的累加，而不是各小组的累加应用cumsum而非sum 例如资料a： gp val 1 1 10 2 1 20 3 1 30 4 2 10 5 2 20 用a %>% group_by(gp) %>% summarise(new = sum(val))的话会变成 gp new 1 1 60 2 2 30 而原PO要的则是a %>% group_by(gp) %>% summarise(new = cumsum(val)) gp new 1 1 10 2 1 30 3 1 60 4 2 10 5 2 30 : 呜谢谢你！！那麽快速回复我好感动 : 不过想请问我跑出来长这样... : https://i.imgur.com/5mqEZ02.jpg : 应该如何处理呢QQ : 谢谢你注意除了sum以外，原PO这里细节上也犯了一个错你赋值的对象是 final09a_new$PTT，而非final09a_new final09a_new$PTT是一个变项而已但是右边的内容final09a_new %>% group_by %>% summarise() 是一个资料集错误1.把一个资料集赋值进一个变项，硬套是可以套进去，但绝对不是原PO要的错误2.如上面的例子，用sum的话资料列数会变成分组组数所以final09a_new$PTT的长度会是final09a_new的列数右边的内容则只有341列（因为你分成341组了）用summarise有一个问题是，运算出来的dataset会只剩下分组变项例如上面的例子，原本的val就不见了如果原PO要保留非分组变项，只希望多一个栏位建议还是用mutate : ※ 编辑: cheen885 (101.9.114.174 台湾), 12/03/2021 21:29:11 : → locka: 看错误讯息是资料笔数对不起来，剩下没有可重现错误的资料 12/03 21:49 : → locka: 爱莫能助(耸肩 12/03 21:49 : 推 Gjerry: 其实可以考虑用 split 切开 data frame 等用 lapply 处理 12/03 23:38 : → Gjerry: 完再合起来，对於不熟悉的人来说应该比较直觉 12/03 23:38 : → locka: G大其实我觉得 lapply 也没有很直观耶XDDD 12/04 00:06 : 推 chenwz: 因为group_by 分组後的列数跟原本资料对不起来，所以没办 12/04 09:19 : → chenwz: 法直接给新栏位。可以重给一个df, 再join起来 12/04 09:19 : 推 Gjerry: 不然用 for loop 也可以，一开始就学 dplyr 我觉得会有点 12/04 15:30 : → Gjerry: 卡卡的 12/04 15:30 : 推 celestialgod: 我觉得原PO一开始就写对了原PO要不要检查一下资料 12/05 01:09 : → celestialgod: ？ 12/05 01:09 : → celestialgod: https://reurl.cc/2oqm5X 12/05 01:09 : → celestialgod: 不然试试看data.table 12/05 01:09 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.109.196.250 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1638673712.A.1FF.html ※ 编辑: fox1375 (140.109.196.250 台湾), 12/05/2021 11:09:35

1^F：推 locka: 推fox大，我昨天在捷运上看太快，是我没正确理解问题就回覆 12/05 12:44

2^F：→ locka: 原来原po要的是累加…(突然觉得好丢脸QQ) summarise的确是 12/05 12:45

3^F：→ locka: 单纯用在分组後加总的情况。另外没想到F大竟然还观察到赋值 12/05 12:45

4^F：→ locka: 对象错误的小细节，请受小弟一拜m(_ _)m 12/05 12:45

5^F：→ locka: 不过还是觉得很奇怪，如果原本写的是对的怎麽会跑出非预期 12/05 12:50

6^F：→ locka: 的结果(搔头) 12/05 12:50

这个要原PO提供完整程式码才能判断了以结果来说显然是group_by没有依预期的方式运作可能是使用错误、版本问题或套件的冲突导致例如同时使用dplyr和plyr两个套件就会这样顺便宣导所有plyr的功能dplyr都可以完成 plyr已停止更新，不应再使用 ※ 编辑: fox1375 (140.109.196.250 台湾), 12/05/2021 13:24:33

7^F：推 cheen885: 谢谢f大！！我有在我的原文补上完整的程式码，我後来一 12/06 20:44

8^F：→ cheen885: 直重跑，发现还是一直跑错，一直找不到内文的照片我到 12/06 20:44

9^F：→ cheen885: 底要跑对的XD，後来听取您的建议，不使用plyr的套件， 12/06 20:44

10^F：→ cheen885: 我就成功跑出我要的结果了！！真的很感谢你的帮忙：D!! 12/06 20:44

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

R_Language 板

Re: [问题] 依变项分组的加总

热门看板

赞助商连结