作者cshcsh6847 (cshcsh6847)
看板DataScience
标题[问题] 测试资料的特徵重要性
时间Thu Dec 26 17:01:19 2019
有一些问题想来问问版上的大大
拜托大家赐教了
在训练ML的时候
用tree based模型可以看feature importance
知道模型基於哪些特徵来决定结果的
但是如果在跑测试资料的时候
想请问各位有没有办法显示出为什麽分类结果是如此
E.g.
1/0 分类
A B C D feature是重要的
但是这笔资料主要是A的数值影响他被分类到1
请问各位有做过这类的事情吗?
谢谢!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 39.8.71.208 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1577350881.A.800.html
1F:→ chang1248w: 这是模型解释的部分吧? 你可以从模型的最後面写一支 12/26 18:26
2F:→ chang1248w: 输出,然後把valid data跑过一遍 12/26 18:26
3F:→ chang1248w: 没事,我误会你的意思了 12/26 18:28
4F:→ sxy67230: 用Shap这个Python library 可以解决你的问题,他的做法 12/26 18:35
5F:→ sxy67230: 是基於game theory,只要你有模型,设定好测试基准,根 12/26 18:35
6F:→ sxy67230: 据你的测试集可以知道你的特徵选取原因。 12/26 18:35
7F:推 MXNet: sensitivity analysis? 12/27 00:32
8F:→ y956403: 很多时候不是单纯因为一个特徵而被分类的吧 12/27 01:51
9F:推 a78998042a: InterpretML: A Unified Framework for Machine Learn 12/28 01:42
10F:→ a78998042a: ing Interpretability. 算新议题,看看吧 12/28 01:46