作者askpeople (就是要问!!!)
看板Statistics
标题[程式] R程式 - 决策树指令无法使用
时间Fri Feb 19 12:27:08 2016
[软体程式类别]: R
请填入软体程式类别,例如:SAS、SPSS、AMOS、R、STATA、EVIEWS...等
[程式问题]: 无法使用决策树指令 (tree)
资料处理、回归、叙述统计、logistic、probit...等
[软体熟悉度]: 新手
请把以下不需要的部份删除
新手
熟悉
专家
问题如下:
使用资料探勘的决策树方式分类,但读取资料时发现错误,无法使用tree的指令,我输入
的语法如下:
babies2 <- read.csv("C:/Users/NTBU/Desktop/babies2.csv")
babies = na.exclude(babies2) #资料有missing,去除遗失值
np = ceiling(0.1*nrow(babies));np #取10% 当测试样本
test = sample(1:nrow(babies),np)
babies.test = babies[test,] #10%测试样本
babies.train = babies[-test,] # 90%训练样本
babies.tree =
tree(bclass~gestation+parity+age+height+weight+smoke,data=babies.train)
#这一步出现错误: 讯息如下:
Error in tree(bclass ~ gestation + parity + age + height + weight + smoke, :
factor predictors must have at most 32 levels
附上我的资料型态 和 错误视窗图 (我使用csv档读入),如下:
http://imgur.com/VmYfxU1
我不知道 factor predictor的问题是什麽? 它说至少是32个水准 是指应变数吗?
但cart不是说:
无论应变数是数值 或 类别都可以放入模型吗? 还是说我的资料有什麽问题?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 120.97.5.90
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1455856031.A.545.html
1F:→ andrew43: 图的网址错误。可能是最多只能有32个level。 02/19 14:19
3F:→ askpeople: 我的自变数只有smoke是2个level、parity是2个level 02/19 15:08
4F:→ askpeople: 应该是不会超过,但却出现错误 02/19 15:08
※ 编辑: askpeople (120.97.5.90), 02/19/2016 15:14:59
5F:→ andrew43: str(bodies.train) 仔细看看是不是资料型态没读正确。 02/19 17:13
6F:→ joejoe14758: 你的testing 资料影本应该不会有bclass这栏位吧 03/24 18:55