作者yaowei2010 (yaowei)
看板R_Language
标题[问题] 重复配对
时间Thu Aug 28 15:03:06 2014
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
新手(没写过程式,R 是我的第一次)
[问题叙述]:
由於match只会回传第一个配对到的位子,多重配对我估狗过後似乎没有特定
如match的function,不知道该怎麽办,请问有这样的function吗(如例子
[程式范例]:
[data 1]
name location
A 1
B 1
C 2
D 3
[data 2]
name2 location
a1 1
a2 1
a3 1
a4 2
a5 2
a6 2
a7 2
a8 3
依照location做match後(不是用match())
name match
A a1
A a2
A a3
B a1
B a2
B a3
C a4
C a5
C a6
C a7
D a8
为了节省大大们的麻烦
(不需用给我完整的code,可以给我hint或有独特的function即可)
感恩
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.112.174.174
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/R_Language/M.1409209389.A.3CC.html
1F:→ yaowei2010: 因为我实际data很大,merge不知为何记忆体爆炸 08/28 15:04
2F:推 obarisk: 依location做卡氏积 08/28 15:35
3F:→ yaowei2010: 卡式积@_@? 08/28 15:44
4F:推 cywhale: 用grep可以传multip match 08/28 21:08
5F:推 pinpin: 可试试data.table 不然可能要用像ff这种处理big data的pkg 08/28 23:59
6F:推 summitstudio: library(dplyr); left_join(data1,data2,by='loc') 08/29 00:52
7F:推 Wush978: 推楼上,一直想po被抢先了. 另外附注一下, dplyr效能很好 08/29 23:35
8F:→ Wush978: 我实际测过两个百万table的left_join只需要半分钟左右 08/29 23:36
9F:→ yaowei2010: 感恩 没想到package强大很多 我写老半天效能超差>< 09/02 16:13