R_Language 板


LINE

[問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 請把以下不需要的部份刪除 入門(寫過其他程式,只是對語法不熟悉) [問題敘述]: 如題 最近在用randomForest這個package做分類預測 y是binary variable 跑出結果後用getTree抓其中一顆決策樹出來 輸出大概就是 left daughter right daughter split var split point status prediction 這樣 然後有幾點想請教版友: 1. getTree的split pint判斷 stack overflow有人說 若split point是2.5 則<=2.5往左走 >2.5往右走 但是若split var是factor的話呢? 像是三個levels "學生" "老師" "教官" 若直接這樣getTree的話 split point那會變成亂數 ex. 3 所以我後來試著給他數字 學生為1 老師為2 教官為3 split point變成2.5 1.5之類 但在解釋上說不過去 也無法套用stack overflow裡的人的邏輯 若split var是年齡區間還可以解釋 例如20歲以下為1 20~30歲是2 30歲以上是3 split point為2.5時 我還能理解為<=2.5是30歲以下 >2.5是30歲以上 當然 這是現階段的理解 ex. set.seed(100) data <- data.frame(y=sample(c("好", "不好"), 100, replace=TRUE), x1=sample(c("學生", "老師", "教官"), 100, replace=TRUE), x2=sample(c("20歲以下", "20~30歲", "30歲以上"), 100, replace=TRUE) ) library(randomForest) rf <- randomForest(y~., data=data, ntree=10, proximity=TRUE) tree <- getTree(rf, labelVar=TRUE) 然後tree的結果就如上面所述 請問我究竟該如何理解這個結果呢? (2015/07/25 09:39) 補充:根據?getTree得到split point的解釋是 x1有3個類別 split point若為3 則是指(1,1,0) 因為1*2^0+1*2^1+0*2^3=3 然後學生和老師都歸類到左邊 所以判斷依據是"是否為教官" 否就丟到左邊這樣嗎? 2. 最後是畫圖的問題 我在網路上找到一位網友自己寫了一個函式叫to.dendrogram 程式附在下面 但是畫出來的決策樹只有split point的名稱 ex.學生 教師 可是我希望把split point也畫上去 ex. <=2.5, <=1.5等 目前知道的繪圖有幾個package:rpart, tree之類 但那都要用rpart或ctree來跑"一顆"決策樹 然後再用package內的繪圖函式畫圖 但是跟隨機森林的那10顆(ntree=10)決策數是不一樣的吧! 不要求很精美的圖 主要是想修改網友的to.dendrogram的code 弄成有split point的結果 但是attr(rval, "edgetext")那邊一直搞不定@@ 或是這裡有大神能提供更好的解法 感激不盡!! 總結一下問題 1. randomForest中getTree的split var為factor時 split point該如何判斷? 2. to.dendrogram的圖中 如何修改code才能把split point放上去? 這些問題困擾小弟好久了~"~ 再次感謝 [程式範例]: http://pastie.org/10311492 [系統環境]: R version 3.2.1 (2015-06-18) Platform: x86_64-w64-mingw32/x64 (64-bit) Running under: Windows 8 x64 (build 9200) locale: [1] LC_COLLATE=Chinese (Traditional)_Taiwan.950 [2] LC_CTYPE=Chinese (Traditional)_Taiwan.950 [3] LC_MONETARY=Chinese (Traditional)_Taiwan.950 [4] LC_NUMERIC=C [5] LC_TIME=Chinese (Traditional)_Taiwan.950 attached base packages: [1] stats graphics grDevices utils datasets methods base other attached packages: [1] tree_1.0-36 data.table_1.9.4 randomForest_4.6-10 loaded via a namespace (and not attached): [1] magrittr_1.5 plyr_1.8.3 tools_3.2.1 reshape2_1.4.1 Rcpp_0.11.6 [6] stringi_0.5-5 stringr_1.0.0 chron_2.3-47 [關鍵字]: randomForest 隨機森林 getTree --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.215.230
※ 文章網址: https://webptt.com/m.aspx?n=bbs/R_Language/M.1437830114.A.120.html ※ 編輯: SFMAndroid (36.229.215.230), 07/25/2015 21:15:34 ※ 編輯: SFMAndroid (36.229.215.230), 07/25/2015 21:24:00 ※ 編輯: SFMAndroid (36.229.215.230), 07/25/2015 21:26:49 ※ 編輯: SFMAndroid (36.229.215.230), 07/25/2015 21:37:25
1F:推 ntme: 沒用過,但看pdf文件中說y是factor才作分類 07/25 21:35
2F:→ celestialgod: 你可以給一個seed還有你R的版本嗎 07/25 21:38
3F:→ celestialgod: 我這裡沒有試出來split point像你說的情形 07/25 21:38
※ 編輯: SFMAndroid (36.229.215.230), 07/25/2015 21:40:34
4F:→ SFMAndroid: seed設成100 R版本跟系統環境已補上 謝謝~ 07/25 21:41
5F:→ celestialgod: 你後面補的解釋應該沒有錯 1.的答案應該如你理解 07/25 21:42
6F:→ SFMAndroid: 請問c大 那若predictor是連續變數的話 <=是往左 07/25 21:43
7F:→ celestialgod: 不過seed一百我還是沒有看到6(攤手 07/25 21:43
8F:→ SFMAndroid: >是往右沒錯吧? 07/25 21:44
9F:→ celestialgod: 對 07/25 21:44
10F:→ SFMAndroid: 抱歉 設完seed後我忘記改結果了@@ 07/25 21:44
※ 編輯: SFMAndroid (36.229.215.230), 07/25/2015 21:46:32
11F:→ SFMAndroid: 謝謝c大:) 07/25 21:46
12F:→ celestialgod: http://tinyurl.com/pwtzucf 07/25 21:50
13F:→ celestialgod: 上面連結是別人寫的plot.getTree 07/25 21:50
14F:→ celestialgod: 有不少FUNCTION 下載之後 都source應該就可以用 07/25 21:50
15F:→ celestialgod: 我就不測試了 07/25 21:51
16F:→ SFMAndroid: 好的感謝c大 再請教一個問題 若x2多一個類別"清潔工" 07/25 21:52
17F:→ SFMAndroid: split point得到9 (1,0,0,1)這樣 就是學生跟清潔工歸 07/25 21:53
18F:→ SFMAndroid: 左邊 其餘歸右邊這樣? 但我以為決策樹是二分(是否)的 07/25 21:54
19F:→ celestialgod: 對 07/25 21:54
20F:→ celestialgod: 每一個類別都有是否 所以有2^類別數那麼多個組合 07/25 21:55
21F:→ SFMAndroid: 區分方式 像這樣是"是否是教官或老師" 不是就往左? 07/25 21:55
22F:→ celestialgod: 類別比較麻煩 所以他要每一個種類做一個CHECK 07/25 21:55
23F:→ SFMAndroid: 完全理解了 謝謝!! 07/25 21:56
24F:→ celestialgod: 忘了講 剛剛那個我發現是一個套件 07/25 21:57
25F:→ celestialgod: 應該可以用devtools:::install_github來安裝 07/25 21:57
26F:→ SFMAndroid: 嘗試中 感謝:) 07/25 21:58
27F:→ celestialgod: install_github("araastat/reprtree") 07/25 22:00
28F:→ SFMAndroid: 下載成功了 又多學一招XD 謝c大 07/25 22:03







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:WOW站內搜尋

TOP