作者askpeople (就是要問!!!)
看板Statistics
標題[程式] R程式 - 決策樹指令無法使用
時間Fri Feb 19 12:27:08 2016
[軟體程式類別]: R
請填入軟體程式類別,例如:SAS、SPSS、AMOS、R、STATA、EVIEWS...等
[程式問題]: 無法使用決策樹指令 (tree)
資料處理、迴歸、敘述統計、logistic、probit...等
[軟體熟悉度]: 新手
請把以下不需要的部份刪除
新手
熟悉
專家
問題如下:
使用資料探勘的決策樹方式分類,但讀取資料時發現錯誤,無法使用tree的指令,我輸入
的語法如下:
babies2 <- read.csv("C:/Users/NTBU/Desktop/babies2.csv")
babies = na.exclude(babies2) #資料有missing,去除遺失值
np = ceiling(0.1*nrow(babies));np #取10% 當測試樣本
test = sample(1:nrow(babies),np)
babies.test = babies[test,] #10%測試樣本
babies.train = babies[-test,] # 90%訓練樣本
babies.tree =
tree(bclass~gestation+parity+age+height+weight+smoke,data=babies.train)
#這一步出現錯誤: 訊息如下:
Error in tree(bclass ~ gestation + parity + age + height + weight + smoke, :
factor predictors must have at most 32 levels
附上我的資料型態 和 錯誤視窗圖 (我使用csv檔讀入),如下:
http://imgur.com/VmYfxU1
我不知道 factor predictor的問題是什麼? 它說至少是32個水準 是指應變數嗎?
但cart不是說:
無論應變數是數值 或 類別都可以放入模型嗎? 還是說我的資料有什麼問題?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 120.97.5.90
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1455856031.A.545.html
1F:→ andrew43: 圖的網址錯誤。可能是最多只能有32個level。 02/19 14:19
3F:→ askpeople: 我的自變數只有smoke是2個level、parity是2個level 02/19 15:08
4F:→ askpeople: 應該是不會超過,但卻出現錯誤 02/19 15:08
※ 編輯: askpeople (120.97.5.90), 02/19/2016 15:14:59
5F:→ andrew43: str(bodies.train) 仔細看看是不是資料型態沒讀正確。 02/19 17:13
6F:→ joejoe14758: 你的testing 資料影本應該不會有bclass這欄位吧 03/24 18:55