作者criky (立业成家)
看板R_Language
标题[问题] 选取重覆的资料
时间Wed Apr 13 17:22:08 2016
[问题类型]:
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
[软体熟悉度]:
新手(没写过程式,R 是我的第一次)
[问题叙述]:
有5年的报名资料,资料栏位如年度,姓名,身份证ID,科系
考生可能会隔年重考(不同年度)
也可能会同一年重覆报考不同科系
我想要找出同一年重覆报考不同科系的资料,
要怎麽做呢?谢谢~
example:
学年度 身分证字号 学生姓名 报考科系
1 100 A121297328 Andy 中文系
2 100 A121297328 Andy 历史系
3 100 A121297329 Jo 中文系
4 100 A121297330 Ann 历史系
5 100 A121297331 Jack 哲学系
6 101 A121297332 Julie 中文系
7 101 A121297333 Rose 中文系
8 101 A121297334 Tim 历史系
9 101 A121297334 Tim 哲学系
10 101 A121297335 Renee 哲学系
11 101 A121297336 Joyce 历史系
12 101 A121297328 Andy 中文系
我执行
sample.1<-which(duplicated(subset(sample,select=c("学年度","身分证字号"))))
会有Warning message:
In grepl("\n", lines, fixed = TRUE) :
input string 1 is invalid in this locale
sample.1
[1] 2,9
我想要的结果应该是[1] 1,2,8,9
要怎麽做呢?
[环境叙述]:
[关键字]:
重覆
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 60.251.46.218
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1460539331.A.326.html
※ 编辑: criky (60.251.46.218), 04/13/2016 17:22:24
1F:→ celestialgod: #1Lhw8b-s 第1.点,dplyr::distinct 04/13 17:26
2F:→ celestialgod: 看错了 应该用duplicated 04/13 17:27
3F:→ celestialgod: 取特定column的资料 用duplicated就可以看了 04/13 17:28
4F:→ cywhale: which(duplicated(subset(data,select=c("ID","year")))) 04/13 17:31
5F:→ criky: 原来是这个函数, 谢谢 04/13 20:54
※ 编辑: criky (203.64.5.211), 04/14/2016 10:06:32