作者oliversu (su)
看板R_Language
標題[問題] 如何exclude 兩個vectors重複的數
時間Sun Jan 24 14:30:21 2016
[軟體熟悉度]:
入門
[問題敘述]:
我有兩個vectors
分別叫做 sampledata與controldata
controldat是從sampledata隨機取樣3750個
現在我想做一個treatmentdata是把 上述兩個vector重複的數字刪掉
然而,
因為sampledata裡面本身就有重複的數字
如果使用 setdiff這個函數就會發生重複數字被刪除兩次
例如
sampledata{2,3,2,7,5,8,9,8}
controldata{2,8}
預期得到結果 sampledata{3,2,7,5,9,8}
我也試過%in% 的方式,但發現都無法如預期
由於資料頗大,我無法確認%in%的問題出在哪
希望大家幫幫我
我才剛開始摸索R
感謝大家
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 72.33.2.245
※ 文章網址: https://webptt.com/m.aspx?n=bbs/R_Language/M.1453617023.A.8F9.html
1F:→ andrew43: 可以的話不要這樣想。應該先有一個包括所有資料的表格。 01/25 02:22
2F:→ andrew43: 其中這個表格必須有ID欄。你現在沒有ID,所以怎麼切都會 01/25 02:23
3F:→ andrew43: 不知道哪裡出問題。 01/25 02:23
4F:→ andrew43: 又因為你有ID欄,要切資料、取交集聯集都會容易很多。 01/25 02:24
5F:→ andrew43: 如果 01/25 02:24
6F:→ oliversu: 謝謝,換個切入點思考就解決了 01/25 14:09