作者marki (marki)
看板Statistics
标题[问题] 想请问bootstrape跑OR
时间Sat Jun 12 11:12:46 2021
各位前辈好
小弟使用R
我手上有一个Data set, 里面有一个outcome(DV), 一个自变数(IV), 和一个调整变数
三个变数都是binary data
总共有800个观察值 DV与调整变数没有missing data, 但是IV有200个missing data
而在IV有值的部分400个是0, 200个是1
所以我想要用bootstrap的方式重复抽取IV的200个missing data
0与1的比例大概是0.67:0.33
然後用logistic regression的方式估算OR的estimate
抽取1000次 所以总共会有1000个OR estimate
然後看这1000个数字的2.5% and 97.5%估算95% CI
我想要请问
1) 这个方式估算estimate与95%CI是可行的吗?
2) 请问有比较好的R package处理这件事情吗?
3) 我猜因为那个参数的分布可能不是normal distribution,
所以没有办法用mean +/- 1.96SD估算95% CI, 不知道我的想法有没有错呢?
谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.239.220.230 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1623467568.A.162.html
1F:→ Pieteacher: try clopper Pearson CI? 06/12 12:18
2F:→ andrew43: 看不懂bootstrap抽200个missing data是什麽作用 06/12 22:48
3F:→ andrew43: 要做回归不是要针对1000(或800)样本去bootstrap吗? 06/12 22:50
4F:→ marki: 不好意思 我可能表达的不够清楚 06/13 10:19
5F:→ marki: 因为IV有200个missing data, 所以我想每次从里面 06/13 10:21
6F:→ marki: 抽1/3的人为1, 剩下2/3为0。然後反覆抽1000次 06/13 10:22
7F:→ marki: 每次都可以带入logistic regression算出一个OR的估计值 06/13 10:23
8F:→ marki: 所以我想95% CI应该可以计算这1000个估计值2.5% and 97.5% 06/13 10:24
9F:→ marki: 我的dataset有800笔观察值 但IV只有600笔有值 06/13 10:25
※ 编辑: marki (36.239.220.230 台湾), 06/13/2021 10:28:16
10F:推 Tinderstick: 你的 CI 没考虑到部分 IV 为插补值所带来的估计误差 06/13 13:09
11F:推 Tinderstick: 抱歉,更正一下 06/13 13:40
12F:推 Tinderstick: 你的 CI 没考虑到插补 IV 的误差与估计 OR 的误差之 06/13 13:45
13F:→ Tinderstick: 间的交互作用 06/13 13:45
14F:推 Tinderstick: 在 iid 的前提下,或许可在 bootstrap 里改用 leave- 06/13 13:51
15F:→ Tinderstick: one-out logistic regression 06/13 13:51
16F:推 Tinderstick: leave-one-out cross-validation logistic regressio 06/13 14:51
17F:→ marki: 谢谢。想请问我要如何用leave one out 处理误差的交互作用 06/13 17:13
18F:→ marki: 呢? 06/13 17:13
19F:推 Tinderstick: 抱歉,好像没那麽复杂,我想到我的问题去了。你的 re 06/13 23:38
20F:→ Tinderstick: sampling procedure 应该可以捕捉插补误差和估计误差 06/13 23:38
21F:→ Tinderstick: ,只要每一次 bootstrap replication 都包含这两个步 06/13 23:38
22F:→ Tinderstick: 骤即可 06/13 23:38
23F:推 locka: 可以借问一下OR指的是什麽吗?谢谢~ 06/15 20:22
24F:→ andrew43: odds ratio 06/15 21:47
25F:→ locka: 原来如此 我一直想到operation research…XD 06/16 09:32
26F:→ marki: 谢谢各位前辈详解 06/22 13:47