作者wangborwai (wangborwai)
看板Statistics
标题[问题] 变异数检定还是t-test?
时间Fri Apr 24 10:36:56 2020
有一组心脏病的资料,样本数大概有三百个、共有13个变数,有类别也有连续变数、目标
变数是二元离散变数(0、1)
要对资料进行建模分类,但在分类之前想要先做检定删掉对目标变数没有影响力的变数,
就是某个变数x在目标变数的两个类别中是没有显着差异的就删掉,不知道这样的想法有
没有问题?
如果可以的话是做t检定还是变异数检定?如果是t检定的话又分为独立、单一跟成对,要
用哪个呢?针对离散变数的话是做卡方检定吗?如果做变异数检定的话是不是一定要先做
常态、线性跟同质性检定?
不好意思因为想要做一套完整的分析所以问题有点多
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 117.19.228.155 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1587695818.A.91E.html
1F:推 andrew43: 既然是预测二元单变数,何不直接logistic regression再04/24 11:11
2F:→ andrew43: 进行变数(模型)挑选?04/24 11:11
因为这次并没有打算使用逻辑斯回归而是选择其他方法,所以想说可不可以用检定的方式
选择变数
※ 编辑: wangborwai (117.19.228.155 台湾), 04/24/2020 13:21:12
3F:→ yhliu: 比较变异数或平均数都不足以比较出各该潜在解释变数与目标 04/24 13:46
4F:→ yhliu: 变数是否有关. 应比较整个分配. 就连续型变数而言, 考虑 04/24 13:48
5F:→ yhliu: Komogorov-Smirmnov test, 就离散型变数, 考虑列联表检定. 04/24 13:51
6F:→ yhliu: Y=1 和 Y=0 是不同个案, 除非抽样是依目标值配对(如 case- 04/24 13:53
7F:→ yhliu: control study), 否则我不知道你将如何去 "配对" 样本? 04/24 13:54
8F:推 ksherry: 单纯挑变数, 就用 LPM 先看显着性, 记得用 White S.E. 04/24 20:03
9F:推 j1990312: 你如果直接跑lasso 然後用logistics regression,好像就 04/28 12:55
10F:→ j1990312: 解决你这个问题 04/28 12:55
11F:推 j1990312: 楼上y大的想法很合理,你应该告诉我们,你的最终目的是 04/28 12:58
12F:→ j1990312: 什麽,你是要建模吗?! 04/28 12:58
13F:推 rebe212296: t 检定需要常态资料 05/02 15:18