作者yaowei2010 (yaowei)
看板R_Language
标题[问题] 找出重复数据 平均後删掉其余重复列
时间Tue Sep 30 14:35:58 2014
[软体熟悉度]:
新手
[问题叙述]:
如题目 由於同一栏内有重复的项目 抓出来後平均做为代表数值 其余的删掉
(同一项目名称只能出现一次)
[程式范例]:
(原来) (处理後)
Name data1 data2 Name data1 data2
A 1 1 A 2 2
A 2 2 B 1 1
A 3 3 C 2 2
B 1 1 → D 4.5 3.5
C 2 2 E 3 3
D 4 4
D 5 3
E 1 1
E 3 3
E 5 5
我知道怎麽在里面配对 但删掉这部分怕会影响for loop处理i的问题
不知道该怎麽写比较好
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.112.25.100
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/R_Language/M.1412058961.A.FE7.html
1F:推 andrew43: tapply(d$data1, d$Name, mean) # d是个data frame 09/30 18:36
2F:→ andrew43: 之後再自己拚凑看看。 09/30 18:37
3F:→ andrew43: 或是用 aggregate() 也可以。 09/30 18:39
4F:→ andrew43: aggregate(cbind(data1,data2), data=d, FUN=mean) 09/30 18:40
5F:→ andrew43: 其中的 d 就是原 data frame。 09/30 18:40