R_Language 板


LINE

問題一 [問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 新手(沒寫過程式,R 是我的第一次) 目前較懂得用packages做分析 但對於資料預處理還是不太熟悉 [問題敘述]: 我要怎麼找出該欄的最小三個值所對應之"列樣本" [程式範例]: #資料產生 sample1=sample(1:3,100,replace=T) sample2=sample(1:3,100,replace=T) sample3=sample(1:3,100,replace=T) sample4=sample(1:3,100,replace=T) sample5=sample(1:3,100,replace=T) data=as.data.frame(rbind(sample1,sample2,sample3,sample4,sample5)) #轉成類別型資料 for(i in 1:ncol(data)) data[,i]=as.factor(data[,i]) #計算樣本與樣本間相似程度,m表示距離矩陣,數值越小表示越相似 n=nrow(data) m=matrix(nrow=n,ncol=n) for(i in seq_len(n - 1)) for(j in seq(i, n)) m[j, i]=m[i, j]=sum(data[i,] != data[j,]) #m的輸出會長這樣,其中col1代表sample1,以此類推 col1 col2 col3 col4 col5 1 0 25 65 56 24 2 58 0 45 23 84 3 65 73 0 77 36 4 21 53 43 0 71 5 25 36 68 74 NA 問題:我要找col1中最小的兩個值之樣本,也就是4和5,有什麼語法可供參考嗎? 因為如果用which.min(data[,1])的話,只會得到4 問題二 [問題類型]: *[1;30;40m 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) *[m [軟體熟悉度]: *[1;30;40m請把以下不需要的部份刪除 新手(沒寫過程式,R 是我的第一次)*[m [問題敘述]: *[1;30;40m請簡略描述你所要做的事情,或是這個程式的目的*[m 現有三個樣本,每個樣本有100個變數,所以維度是3*100 我想依序比對這三個樣本之變數來產生第四個樣本(圖示a) 在產生的過程中 該變數以多數決的方式產生第四個樣本之變數(圖示b) 若遇到無法以多數決的方式產生之情況(圖示c) 就截至比對目前結果為止,找出三個樣本哪個與第四個樣本最接近 並根據此樣本的值去產生該變數(說明d) a. V1 V2 V3 V4 V5 V6 V7 ... ... V100 sample1 1 3 2 3 1 3 2 ... ... 1 sample2 3 2 1 3 2 1 3 ... ... 1 sample3 1 3 2 3 1 3 1 ... ... 2 sample4 1 3 2 3 1 3 2 ... ... 1 b.(以V1為例) V1 V2 V3 V4 V5 V6 V7 ... ... V100 sample1 "1" 3 2 3 1 3 2 ... ... 1 sample2 3 2 1 3 2 1 3 ... ... 1 sample3 "1" 3 2 3 1 3 1 ... ... 2 sample4 1 3 2 3 1 3 2 ... ... 1 c.(以V7為例) V1 V2 V3 V4 V5 V6 V7 ... ... V100 sample1 1 3 2 3 1 3 "2" ... ... 1 sample2 3 2 1 3 2 1 "3" ... ... 1 sample3 1 3 2 3 1 3 "1" ... ... 2 sample4 1 3 2 3 1 3 2 ... ... 1 d. 因為到V7卡住,所以先對Sample1到Sample4(V1~V6)算一次相似程度 計算的方式與問題一相同,所以比對程序截至到V6,此時的距離矩陣為 col1 col2 col3 col4 1 0 5 0 0 2 5 0 5 5 3 0 5 0 0 4 0 5 0 NA (情況1)從結果可知 第四個樣本(col4)與第一與第三個樣本較相似 此時可根據第一與第三個樣本的V7,第四個樣本的V7可任意填入2或1 (情況2) col1 col2 col3 col4 1 0 5 0 0 2 5 0 5 5 3 0 5 0 "1" 4 0 5 0 NA 如果今天算出來的距離矩陣是這樣 就可以很確定第四個樣本的V7要填入2 [程式範例]: sample1=sample(1:3,100,replace=T) sample2=sample(1:3,100,replace=T) sample3=sample(1:3,100,replace=T) data=as.data.frame(rbind(sample1,sample2,sample3)) 接下來就請各位前輩多多提點一下了~感謝幫忙 --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.184.161.128
※ 文章網址: https://webptt.com/m.aspx?n=bbs/R_Language/M.1438527811.A.57F.html ※ 編輯: sinclairJ (111.184.161.128), 08/02/2015 23:06:27
1F:→ andrew43: 1. order(m$col1) 08/02 23:23
2F:→ andrew43: 2. 有點複雜。沒有例外大概從眾數下手。 08/02 23:25
3F:→ andrew43: 因為眾數不一定唯一或存在,所以看你眾數的例外處理如何 08/02 23:26
4F:→ andrew43: 才能再繼續寫下去。 08/02 23:27
5F:→ andrew43: 可以從table(foo)來檢查foo的頻率,這大概是第一步。 08/02 23:28
6F:→ sinclairJ: 因為只會用三個樣本去生成一個樣本 所以我目前想到的 08/02 23:30
7F:→ sinclairJ: 處理方式就是情況1與情況2 嗚嗚 08/02 23:30
8F:→ andrew43: 另外我覺得先不要看多個變數。一次解一個變數,再套用。 08/02 23:31
9F:→ sinclairJ: 哦~從變數的角度下去看就是了 謝謝a大建議 我在想想~ 08/02 23:36
10F:→ celestialgod: 1. 建議你的m 對角線都變更成NA 08/02 23:41
11F:→ celestialgod: 不然你的order取下去可能有問題 08/02 23:42
12F:→ sinclairJ: 目前想到用recode 但會把將非對角線的0也取代 08/02 23:53
13F:→ celestialgod: http://pastebin.com/qYYgXYAf 08/02 23:53
14F:→ celestialgod: library(Matrix)沒用到 08/02 23:54
15F:→ sinclairJ: library(car);recode(m,"0=NA") 08/02 23:54
16F:→ celestialgod: 你如果遇到有0個相等怎麼辦? 08/02 23:55
17F:→ sinclairJ: 沒有一定要找一模一樣的 就找距離最小的 所以如果 08/02 23:59
18F:→ sinclairJ: 第四個樣本所對應第一,二及三的距離為 11,20,5(舉例) 08/03 00:00
19F:→ sinclairJ: 那就以第三個樣本為基準去填補第四個樣本之該變數 08/03 00:00
20F:→ celestialgod: 我的意思是你用recode會有問題 08/03 00:06
21F:→ celestialgod: 如果你要用那個距離矩陣算order的話 08/03 00:07
22F:→ celestialgod: 第二個問題只要算一行的相似矩陣,不建議算整個矩陣 08/03 00:08
23F:→ sinclairJ: 哦 了解了 謝C大提醒 08/03 00:15
24F:→ celestialgod: 還有一件事,你生成的資料,每一行的levels是不同, 08/03 00:19
25F:→ celestialgod: 計算相等會有問題... 08/03 00:19
26F:→ sinclairJ: 如果轉成as.character會能解決嗎? 08/03 00:20
27F:→ celestialgod: 當然我連結的生成方式也是有問題 08/03 00:20
28F:→ celestialgod: 可以解決 08/03 00:20
29F:→ celestialgod: 建議不要factor了,直接用character或是int做 08/03 00:21
30F:→ sinclairJ: OK~謝C大提醒 08/03 00:23
31F:→ sinclairJ: http://i.imgur.com/6fveUhS.jpg 08/03 20:57
32F:→ sinclairJ: 有參考網路上這個寫法,能取出每個column的眾數,不過 08/03 20:58
33F:→ sinclairJ: 遇到該col是0,1,2的時候就會掛掉,請問該怎麼在functio 08/03 20:59
34F:→ sinclairJ: n裡加入條件式比較好? 08/03 20:59
35F:→ celestialgod: 直接在>1那裏改就好 08/03 21:20
36F:→ celestialgod: 建議這樣做 http://pastebin.com/fLwhB3Ca 08/03 21:42
37F:→ celestialgod: 我不知道你距離相等怎麼做,我直接幫你設定隨機抽 08/03 21:42
38F:→ celestialgod: 最後再去改算不出mode的部分,會比較有效率 08/03 21:45
39F:→ celestialgod: why colwise 請看#1LeXNCKV (R_Language) 08/03 21:46
40F:→ sinclairJ: 有try了一下 目前尚未遇到問題 謝謝C大幫忙 08/04 01:32
41F:→ sinclairJ: 會問題在推文詢問你了~感謝! 08/04 01:32







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Soft_Job站內搜尋

TOP