Statistics 板


LINE

请问各位大大, 最近在研究使用卡方检定来进来特徵筛选,主要是针对「类别特徵」。 大部份都是在response也是类别时。 但我不确定,如果使用在数值response上头,也是可行吗? 下面这一篇,建议使用的方式,是将数值型特徵discritize. 这样就可以用卡方了。 https://stats.stackexchange.com/a/479206/250305 不知道是不是如果遇到数值反应变数,也是只能将其discritize以使用卡方检定呢? --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.82.150.205 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1647918254.A.5B3.html
1F:→ andrew43: 就我所知,一定是离散的反应变数。预先离散化也有方法。 03/23 16:49
2F:→ andrew43: 或是考虑其它特徵选择的方法。 03/23 16:49
3F:→ recorriendo: 不是 你连续就有更多方法可以比较两组的分布是否不 03/23 21:53
4F:→ recorriendo: 同 为何要绕一大圈先离散化再做卡方 03/23 21:53
5F:→ recorriendo: 不是不能做 而是没有意义 03/23 21:54
6F:→ recorriendo: 连续甚至有方法可以同时考虑更多东西 例如:特徵之 03/23 21:58
7F:→ recorriendo: 间的重叠性 (correlation-based feature selection 03/23 21:58
8F:→ recorriendo: ) 03/23 21:58
9F:→ yhliu: 你的卡方检定是准备检定什麽东西呢? 两变数关联, 或检定资 03/24 18:52
10F:→ yhliu: 料是否适合某一分布? 或几个样本对应的群体分布是否相同? 03/24 18:54
11F:→ yhliu: 基本上数值性资料会先考虑数值性资料的方法; 在数值性的方 03/24 18:55
12F:→ yhliu: 不合适例如两变数不是直线型关联而且关联型态不知时, 才会 03/24 18:57
13F:→ yhliu: 考虑离散化进行卡方检定. 此时当然要分组, 各组次数要足够, 03/24 19:00
14F:→ yhliu: 因为卡方检定是大样本近似方法, 也就是套用中央极限定理而 03/24 19:01
15F:→ yhliu: 出的方法. 03/24 19:02
16F:→ blacklove: 谢谢大家的回覆,我的这个问题主要是想了解如果处理 03/28 16:28
17F:→ blacklove: 特徵筛选,在建模时,常会先将无相关的特徵排除, 03/28 16:30
18F:→ blacklove: 那麽针对特徵是类别变数,该怎麽确认是否需将它排除 03/28 16:31
19F:→ blacklove: 我目前仅知的作法是用tree-based模型的 03/28 16:32
20F:→ blacklove: feature importance来作为筛选依据 03/28 16:33
21F:→ blacklove: 谢谢你们,我在cross-validated上提问,也有网友回覆 03/28 16:34
22F:→ blacklove: 将数值离散化後,会有资讯丢失的状况,虽然可以使用 03/28 16:35
23F:→ blacklove: 但是不建议! 03/28 16:35







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:BuyTogether站内搜寻

TOP