作者fz7 ()
看板Statistics
標題[問題] 95% 信賴區間計算問題
時間Sun May 24 17:48:39 2020
各位好,最近看論文時,對於信賴區間的計算上有一些問題,想請教各位。
比如說有一位醫師,針對80張醫學影像,個別進行腫瘤數量的計算。
每一張皆有一個準確率(0-100%間),所以會有80個準確率。
透過計算這80個準確率的平均值及標準差,可得到信賴區間:
(平均值-1.96*(標準差/80^0.5),平均值+1.96*(標準差/80^0.5))。
故準確率的平均值,應會落在信賴區間的中點。
但若今天是多個醫生,對於同樣80張醫學影像進行識別,要如何計算其平均的信賴區間呢
?
下圖為一個辨識結果的範例,有四個種類的醫師,使用輔助工具的辨識前後效果比較。
前三類的醫師皆為3個人,最後一類為2個人,共有11人。針對同樣80張醫學影像進行辨識
。
但四個種類醫師的辨識準確率之平均值,皆不在95% CI的中點。
https://imgur.com/2Tr4GhT
想請問此結果是如何計算出來的?
非常感謝各位!
參考文獻:
https://arxiv.org/pdf/1911.07372.pdf
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 150.117.153.60 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1590313721.A.348.html
※ 編輯: fz7 (150.117.153.60 臺灣), 05/24/2020 20:24:55
※ fz7:轉錄至看板 DataScience 05/24 20:30
1F:→ andrew43: 這篇只是很單純地以n=240做Wilson Score interval 05/24 22:26
2F:→ andrew43: 並沒有考慮80張圖的隨機因子(針對table S2) 05/24 22:27
3F:→ andrew43: n=240或160(視不同情況) 05/24 22:28
4F:→ fz7: 目前我最大的問題是,95% CI中點應是0.858。但Supplementary 05/25 00:32
5F:→ fz7: 的第一列Trainee在Uuassisted的95% CI是(0.809, 0.897),中點 05/25 00:33
6F:→ fz7: 是0.853。 05/25 00:34
7F:→ fz7: (其他類別也似乎有類似的問題,但一般認知,CI的中點應該會是 05/25 00:34
8F:→ fz7: 會是平均準確率。) 05/25 00:35
9F:→ andrew43: 並沒有所謂點估計一定要在區間估計的中點這回事 05/25 01:08
10F:→ andrew43: 用算0.858那組給你看了,雖是R code但多半能看懂 05/25 01:09
12F:→ fz7: 非常感謝andrew的耐心回覆,解惑了! 05/25 04:55
13F:→ fz7: 另外還有個小問題,像這樣的抽樣方式會把n=80x3的原因為何? 05/25 04:58
14F:→ fz7: 因為80張醫學影像雖然由不同醫師檢驗,但應該是重複的影像。 05/25 05:00
15F:→ fz7: (由醫學影像之母體,隨機抽出的80張醫學影像) 05/25 05:03
16F:→ fz7: 還是這裡也包含了選取檢驗醫師的隨機性? 05/25 05:06
17F:推 andrew43: 不是paper裡寫的就一定是正確的或最合理的。 05/25 08:13
18F:推 youngsam: 看你對隨機項的假設是什麼啊 05/25 10:16
19F:→ fz7: 還是沒有完全理解,所以本篇論文的統計方式是符合定義的嗎? 05/25 14:56
20F:→ fz7: 我的意思是,將n定義為:抽樣影像數x檢驗醫師數,符合定義嗎 05/25 14:59
21F:→ fz7: 但利用了重複的影像 05/25 15:09
22F:→ andrew43: 嚴格來說,若視240樣本為隨機樣本而使用WSM,則隨機樣本 05/25 18:03
23F:→ andrew43: 的意思應該是「任一醫生看任一圖的一個配對」吧 05/25 18:04
24F:→ andrew43: 若該3位醫生正好很行或很差(很可能發生因為3很少)就可 05/25 18:06
25F:→ andrew43: 能高估或低估正確率了,和簡單抽樣240樣本的情況很不同 05/25 18:07
26F:→ fz7: 理解了!非常感謝andrew! 05/25 21:56