[问题] 决策树的一个小疑问

时间Mon Jul 18 23:15:05 2016

大家好, 我想请问一些关於决策树的小疑问, 假如现在我有一笔资料, 例如纪录了100人的血型身高体重收入等等10个属性值, 那如果今天我想要用血型来当作我的information gain 或是 gini gain的计算目标, 以此为依据来产生决策树, 是否会出现有属性被重复拿来当作分支的的条件筛选? 其实我是在学习使用 python的sklearn时候, 看到他里面提供的范例如： http://scikit-learn.org/stable/modules/tree.html#classification 他得到的决策树中,可以看到有些属性被重复拿来使用, 这样是可行的罗? 如果用语不太精确的话请见谅. -- 感谢帮忙:) --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 180.176.219.238 ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1468854907.A.D11.html

1^F：推 xdd1524: 属性的型态是连续型的话常常都会重复 07/19 13:25

2^F：推 x1234567: 决策树的特性是一次只用一个变数将样本分割(分支)，因 07/19 21:49

3^F：→ x1234567: 分支内样本改变了，是有可能再选到用过的变数，不过建 07/19 21:49

4^F：→ x1234567: 议要看validate 的预测能力有没有掉很多 07/19 21:49

5^F：→ yuhow: 想请问要如何看'validate'的预测能力？我不是很明白这句 07/19 22:11

6^F：→ andrew43: 例如把资料分成训练集和验证集几次，即交叉验证 07/20 03:16

7^F：→ x1234567: 因目的是未来套用的准确度高，所以用非训练样本来看看这 07/20 09:08

8^F：→ x1234567: 个现象是不是还存在，避免过度训练 07/20 09:08

9^F：→ yuhow: 喔喔！那我有点懂了感谢大家 :D 07/20 21:43

赞助商连结

您可能会有兴趣的文章

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称，例如：Boy-Girl 或站内搜寻

TOP

WEB批踢踢(PTT)

Statistics 板

[问题] 决策树的一个小疑问

热门看板

赞助商连结