Statistics 板


LINE

大家好 我不是统计背景出身的 但今天跟学生咪挺时聊到 在回归分析中可以利用某解释变数加入前後的 R^2 变化 来当作该变数的重要程度 请问这个做法是常见或正确的吗? 有没有相关文献可供参考呢? 我自己想了一个反例如下: 假设有三个解释变数 x1, x2, x3 其中 x1 和 x2 很有解释力但却高度共线性 x3 则是聊胜於无的变数 在控制 x1 和 x3 时 由於 x2 和 x1 高度共线性 所以额外加入 x2 并不会让 R^2 上升太多 另一方面 在控制 x1 和 x2 时 由於 x3 本身没啥用处 所以额外加入 x3 也不会让 R^2 上升太多 综上所述 光靠 R^2 的变化来定义变数重要性可能会有问题(?) 但如果把上例的 x1 拿掉呢? 我也不知道答案 印象中在随机森林里有类似的变数重要性定义方式 但我查了 ISLR 第二版的 8.2.1 节 其定义是将每棵树加入该解释变数後下降的 RSS 取平均 但这麽一来 由於资料已经重新取样 共线性的问题应该不大 与上述范例里的回归分析似乎又不相同 还请各位大大指点迷津或者提供相关文献 万分感谢~ <(_ _)> --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 211.78.36.246 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1722443551.A.5FF.html
1F:推 chang1248w: RF一般会讲到的variable importance 有 ISLR 8.2.1中 08/01 07:13
2F:→ chang1248w: 的 loss gain和2001年的那篇review中使用的variable 08/01 07:13
3F:→ chang1248w: importance (又称 permutation importance ) 08/01 07:13
4F:→ chang1248w: 後者的行为更像linear regression 里面会遇到的共线 08/01 07:15
5F:→ chang1248w: 性问题 08/01 07:15
6F:推 chang1248w: 前者因为predictor subsampling的关系,对每棵树而讲 08/01 07:30
7F:→ chang1248w: 变数加入的顺序是不一定的,每个变数都有机会在它变 08/01 07:30
8F:→ chang1248w: 得没有用之前被计算loss gain 08/01 07:30
9F:→ chang1248w: 这个问题的重点在,你期望的importance,到底是 info 08/01 07:33
10F:→ chang1248w: rmative 还是 uniqueness 08/01 07:33
11F:→ recorriendo: 至少要用adjusted R^2 ... 08/01 12:55
12F:→ recorriendo: "变数重要性"本来就是一个笼统的概念 每个人说的重要 08/01 13:08
13F:→ recorriendo: 性指涉的东西可能不一样 例如如您所述考虑/不考虑其 08/01 13:10
14F:→ recorriendo: 他变数就是一个在每个人理解的"重要性"中扮演脚色不 08/01 13:13
15F:→ recorriendo: 一的考量 08/01 13:13
16F:→ recorriendo: 一旦想要考虑各种变数组合 其实就是在问某变数在不同 08/01 13:28
17F:→ recorriendo: 个regression model里的重要性如何统合成单一指标 08/01 13:29
18F:→ recorriendo: 这其实没有一个标准方法 甚至不同研究圈的主流方法也 08/01 13:30
19F:→ recorriendo: 不一致 也有看过有研究者个人会特别偏好某种方法 08/01 13:31
20F:→ recorriendo: 我熟悉的领域现在大都使用Burnham的方法 算一遍所有 08/01 13:34
21F:→ recorriendo: 变数子集的regression model後用AIC去组出一个score 08/01 13:35
22F:→ andrew43: 一个比较简单的方法,就是同时报导复回归及单回归的 08/01 13:45
23F:→ andrew43: 标准化回归系数。但这还不是一个单一的「重要性指标」。 08/01 13:45
24F:推 WangElly: regression model很忌讳共线性,要先排除,r square 才 08/01 20:08
25F:→ WangElly: 有意义,无他法。 08/01 20:08
26F:→ andrew43: R package relaimpo 中提供的数种方法也可以参考。 08/02 11:05
27F:→ andrew43: https://i.imgur.com/mrWVxiY.png 08/02 11:05







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:iOS站内搜寻

TOP