作者fz7 ()
看板Statistics
标题[问题] 95% 信赖区间计算问题
时间Sun May 24 17:48:39 2020
各位好,最近看论文时,对於信赖区间的计算上有一些问题,想请教各位。
比如说有一位医师,针对80张医学影像,个别进行肿瘤数量的计算。
每一张皆有一个准确率(0-100%间),所以会有80个准确率。
透过计算这80个准确率的平均值及标准差,可得到信赖区间:
(平均值-1.96*(标准差/80^0.5),平均值+1.96*(标准差/80^0.5))。
故准确率的平均值,应会落在信赖区间的中点。
但若今天是多个医生,对於同样80张医学影像进行识别,要如何计算其平均的信赖区间呢
?
下图为一个辨识结果的范例,有四个种类的医师,使用辅助工具的辨识前後效果比较。
前三类的医师皆为3个人,最後一类为2个人,共有11人。针对同样80张医学影像进行辨识
。
但四个种类医师的辨识准确率之平均值,皆不在95% CI的中点。
https://imgur.com/2Tr4GhT
想请问此结果是如何计算出来的?
非常感谢各位!
参考文献:
https://arxiv.org/pdf/1911.07372.pdf
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 150.117.153.60 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1590313721.A.348.html
※ 编辑: fz7 (150.117.153.60 台湾), 05/24/2020 20:24:55
※ fz7:转录至看板 DataScience 05/24 20:30
1F:→ andrew43: 这篇只是很单纯地以n=240做Wilson Score interval 05/24 22:26
2F:→ andrew43: 并没有考虑80张图的随机因子(针对table S2) 05/24 22:27
3F:→ andrew43: n=240或160(视不同情况) 05/24 22:28
4F:→ fz7: 目前我最大的问题是,95% CI中点应是0.858。但Supplementary 05/25 00:32
5F:→ fz7: 的第一列Trainee在Uuassisted的95% CI是(0.809, 0.897),中点 05/25 00:33
6F:→ fz7: 是0.853。 05/25 00:34
7F:→ fz7: (其他类别也似乎有类似的问题,但一般认知,CI的中点应该会是 05/25 00:34
8F:→ fz7: 会是平均准确率。) 05/25 00:35
9F:→ andrew43: 并没有所谓点估计一定要在区间估计的中点这回事 05/25 01:08
10F:→ andrew43: 用算0.858那组给你看了,虽是R code但多半能看懂 05/25 01:09
12F:→ fz7: 非常感谢andrew的耐心回覆,解惑了! 05/25 04:55
13F:→ fz7: 另外还有个小问题,像这样的抽样方式会把n=80x3的原因为何? 05/25 04:58
14F:→ fz7: 因为80张医学影像虽然由不同医师检验,但应该是重复的影像。 05/25 05:00
15F:→ fz7: (由医学影像之母体,随机抽出的80张医学影像) 05/25 05:03
16F:→ fz7: 还是这里也包含了选取检验医师的随机性? 05/25 05:06
17F:推 andrew43: 不是paper里写的就一定是正确的或最合理的。 05/25 08:13
18F:推 youngsam: 看你对随机项的假设是什麽啊 05/25 10:16
19F:→ fz7: 还是没有完全理解,所以本篇论文的统计方式是符合定义的吗? 05/25 14:56
20F:→ fz7: 我的意思是,将n定义为:抽样影像数x检验医师数,符合定义吗 05/25 14:59
21F:→ fz7: 但利用了重复的影像 05/25 15:09
22F:→ andrew43: 严格来说,若视240样本为随机样本而使用WSM,则随机样本 05/25 18:03
23F:→ andrew43: 的意思应该是「任一医生看任一图的一个配对」吧 05/25 18:04
24F:→ andrew43: 若该3位医生正好很行或很差(很可能发生因为3很少)就可 05/25 18:06
25F:→ andrew43: 能高估或低估正确率了,和简单抽样240样本的情况很不同 05/25 18:07
26F:→ fz7: 理解了!非常感谢andrew! 05/25 21:56