作者phil5566 (5566)

看板Statistics

標題

[問題] 信賴區間和覆蓋率的問題?

時間Tue Feb 21 02:10:23 2017

假設我們要估計參數θ,找到一個估計量θ^, 並且用bootstrap的方式找出stand error 接著建立95%信賴區間C.I.,重複產生100組樣本, 並且算出100個θ^的值,建立100組C.I.,發現 100組裡卻只有80多組有包含θ(因為是模擬所以θ已知), 請問會造成這種現像的可能原因有哪些? 我自己想來想去只想到估計量θ^可能是有偏的估計量, 不知還有沒有其他因素,請教版上大大,謝謝 --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.224.17.7 ※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1487614226.A.7DB.html

1^F：推 andrew43: 可否請你把抽樣和建立CI的過程說明清楚一點？我認真看 02/21 11:20

2^F：→ andrew43: 了幾次還是不能確定你怎麼做的。 02/21 11:20

3^F：→ phil5566: 首先先用模擬的方式產生一組我有興趣研究的樣本,用這組 02/21 13:52

4^F：→ phil5566: 樣本求出θ^,因為θ^很複雜,所以沒辦法用手算求出Var,只 02/21 13:54

5^F：→ phil5566: 好用bootstrap的方式求stand error代替,假設bootstrap 02/21 13:57

6^F：→ phil5566: 1000次,再每bootstrap一次下也可求出θ^,假設叫θb^,共 02/21 14:00

7^F：→ phil5566: 有1000個θb^,這1000個θb^的s.d.,即bootstrap下的 02/21 14:02

8^F：→ phil5566: stand error,接這建立C.I.,我建立C.I.的方式有四種, 02/21 14:12

9^F：→ phil5566: 以下用R的語法說明較快,先說明一些代號,th0=θ^, 02/21 14:17

10^F：→ phil5566: th=那1000組的θb^,alpha<-c(0.025,0.975), 02/21 14:20

11^F：→ phil5566: 1.normalC.I.:th0 + qnorm(alpha) * sd(th) 02/21 14:23

12^F：→ phil5566: 2.basic C.I.:2*th0-quantile(th,rev(alpha),type=1) 02/21 14:25

13^F：→ phil5566: 3.percentile C.I.:quantile(th, alpha, type=6) 02/21 14:27

14^F：→ phil5566: 剛剛忘了說我bootstrap的方式是採抽後放回的抽樣方式 02/21 14:30

15^F：→ phil5566: 第4種 BCa C.I.最麻煩,zalpha <- qnorm(alpha) 02/21 14:48

16^F：→ phil5566: z0<- qnorm(sum(th0 < th) / length(th)) 02/21 14:49

17^F：→ phil5566: L<- mean(th.jack) - th.jack 02/21 14:49

18^F：→ phil5566: a <- sum(L^3)/(6 * sum(L^2)^1.5) 02/21 14:49

19^F：→ phil5566: adj.alpha <- pnorm(z0 + (z0+zalpha)/(1-a*(z0+zalpha) 02/21 14:50

20^F：→ phil5566: )) 02/21 14:50

21^F：→ phil5566: quantile(th, adj.alpha, type=6)--->BCa C.I. 02/21 14:50

22^F：→ phil5566: 這裡面的th.jack就是把我產生的那組資料 02/21 14:53

23^F：→ phil5566: 假設叫T(n筆data),逐一的剔掉一筆data後,在剩餘的data下 02/21 14:58

24^F：→ phil5566: 所算出的估計量,假設叫θj^,所以從第一筆開始剔除到最後 02/21 15:00

25^F：→ phil5566: 一筆,會得到n筆的θj^,這n筆θj^就叫作th.jack 02/21 15:02

26^F：→ phil5566: 更正:是在剩餘的data下所算出的"估計值",不是"估計量" 02/21 15:04

27^F：→ phil5566: --------------------------------------------------- 02/21 15:05

28^F：→ phil5566: 以上是產生一組data下所算出的4種C.I.,那我重複產生100 02/21 15:06

29^F：→ phil5566: 組data下可算出100組4種C.I.,在分別去計算4種C.I.有沒有 02/21 15:08

30^F：→ phil5566: 包含我所設定的參數θ的比率,即為文中的覆蓋率 02/21 15:10

31^F：→ phil5566: 我比較疑惑的是我的4種C.I.都是建立在95%信心水準下 02/21 15:13

32^F：→ phil5566: 照理說做100組應該要有95組左右的C.I都會包到設定的參數 02/21 15:15

33^F：→ phil5566: 怎麼會掉到80多組?所以我想是不是估計量是有偏的,所以 02/21 15:16

34^F：→ phil5566: 覆蓋率才會有落差? 02/21 15:17

35^F：→ phil5566: 不好意思~我說了一大堆~我也不知道有沒有講到重點,實際 02/21 15:28

36^F：→ phil5566: 上我的θ是一個向量,不過就只是每個分量的元素都做和我 02/21 15:30

37^F：→ phil5566: 上面所說的一樣的事而已 02/21 15:31

38^F：→ phil5566: 附上原始的codehttp://pastebin.com/jgUBxtvj 02/21 15:32

39^F：→ andrew43: 我猜你boot.CI有問題：哪要那麼多額外的參數？ 02/21 17:03

40^F：→ andrew43: 一般來說只要一組n個數字，頂多再要求alpha=0.95就好了 02/21 17:04

41^F：→ andrew43: 不管你要哪種CI，就只要這二個參數啊。為什麼要額外輸入 02/21 17:05

42^F：→ andrew43: th0 th stat 這些東西？ 02/21 17:05

43^F：→ phil5566: 推文裡前3種C.I.只要用到th0和th,th就是您說的一組數字 02/21 17:41

44^F：→ phil5566: x就是輸入產生的data,而stat是算th.jack會用到的,簡單來 02/21 17:45

45^F：→ andrew43: 我想的求boot 95% CI就只要一個參數，就是資料本身，還 02/21 17:46

46^F：→ phil5566: x和stat是算BCa C.I.會用到的東西所以我要輸入 02/21 17:46

47^F：→ andrew43: 是沒搞懂額外參數的作用是什麼… 02/21 17:46

48^F：→ andrew43: oh謝謝。 02/21 17:47

49^F：→ phil5566: boot.CI回傳的會是4種C.I.的值,我把4種C.I.的算法都寫 02/21 17:48

50^F：→ phil5566: 在一boot.CI這個函數了 02/21 17:49

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

Statistics 板

[問題] 信賴區間和覆蓋率的問題?

熱門看板

贊助商連結