作者marki (marki)
看板Statistics
標題[問題] 想請問bootstrape跑OR
時間Sat Jun 12 11:12:46 2021
各位前輩好
小弟使用R
我手上有一個Data set, 裡面有一個outcome(DV), 一個自變數(IV), 和一個調整變數
三個變數都是binary data
總共有800個觀察值 DV與調整變數沒有missing data, 但是IV有200個missing data
而在IV有值的部分400個是0, 200個是1
所以我想要用bootstrap的方式重複抽取IV的200個missing data
0與1的比例大概是0.67:0.33
然後用logistic regression的方式估算OR的estimate
抽取1000次 所以總共會有1000個OR estimate
然後看這1000個數字的2.5% and 97.5%估算95% CI
我想要請問
1) 這個方式估算estimate與95%CI是可行的嗎?
2) 請問有比較好的R package處理這件事情嗎?
3) 我猜因為那個參數的分布可能不是normal distribution,
所以沒有辦法用mean +/- 1.96SD估算95% CI, 不知道我的想法有沒有錯呢?
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.239.220.230 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1623467568.A.162.html
1F:→ Pieteacher: try clopper Pearson CI? 06/12 12:18
2F:→ andrew43: 看不懂bootstrap抽200個missing data是什麼作用 06/12 22:48
3F:→ andrew43: 要做迴歸不是要針對1000(或800)樣本去bootstrap嗎? 06/12 22:50
4F:→ marki: 不好意思 我可能表達的不夠清楚 06/13 10:19
5F:→ marki: 因為IV有200個missing data, 所以我想每次從裡面 06/13 10:21
6F:→ marki: 抽1/3的人為1, 剩下2/3為0。然後反覆抽1000次 06/13 10:22
7F:→ marki: 每次都可以帶入logistic regression算出一個OR的估計值 06/13 10:23
8F:→ marki: 所以我想95% CI應該可以計算這1000個估計值2.5% and 97.5% 06/13 10:24
9F:→ marki: 我的dataset有800筆觀察值 但IV只有600筆有值 06/13 10:25
※ 編輯: marki (36.239.220.230 臺灣), 06/13/2021 10:28:16
10F:推 Tinderstick: 你的 CI 沒考慮到部分 IV 為插補值所帶來的估計誤差 06/13 13:09
11F:推 Tinderstick: 抱歉,更正一下 06/13 13:40
12F:推 Tinderstick: 你的 CI 沒考慮到插補 IV 的誤差與估計 OR 的誤差之 06/13 13:45
13F:→ Tinderstick: 間的交互作用 06/13 13:45
14F:推 Tinderstick: 在 iid 的前提下,或許可在 bootstrap 裡改用 leave- 06/13 13:51
15F:→ Tinderstick: one-out logistic regression 06/13 13:51
16F:推 Tinderstick: leave-one-out cross-validation logistic regressio 06/13 14:51
17F:→ marki: 謝謝。想請問我要如何用leave one out 處理誤差的交互作用 06/13 17:13
18F:→ marki: 呢? 06/13 17:13
19F:推 Tinderstick: 抱歉,好像沒那麼複雜,我想到我的問題去了。你的 re 06/13 23:38
20F:→ Tinderstick: sampling procedure 應該可以捕捉插補誤差和估計誤差 06/13 23:38
21F:→ Tinderstick: ,只要每一次 bootstrap replication 都包含這兩個步 06/13 23:38
22F:→ Tinderstick: 驟即可 06/13 23:38
23F:推 locka: 可以借問一下OR指的是什麼嗎?謝謝~ 06/15 20:22
24F:→ andrew43: odds ratio 06/15 21:47
25F:→ locka: 原來如此 我一直想到operation research…XD 06/16 09:32
26F:→ marki: 謝謝各位前輩詳解 06/22 13:47