作者saltlake (SaltLake)
看板Statistics
标题[问题] relations between FWER and FDR
时间Wed Aug 28 15:09:59 2024
请问这两个统计误差率之间存有关系式或者转换公式吗?
Familywise Error Rate (FWER) (不知中文文献怎称呼)
False Discovery Rate (FDR) (不知中文文献怎称呼)
例如:
FWER <= a*FDR, a: 某常数。
FWER = func(FDR)
查了一些统计书,提到这两个误差率,多半是描述:
FWER 比较严格,所以会导致较大的二型误差
如果统计决策需要进行「大量的」(如成百上千)的假说测试才能做出,
建议使用较宽松的 FDR,因为用 FWER 很可能得到极小而不合理的统计显
着水准( alpha 值)。
但是具体到底是多少个以下的假说测试才用 FWER?
另外就是上面问的两者间的函数关系,意思是。倘若我们用 FWER 修正
统计显着水准之後,执行这个统计决策会招致多大的 FDR? 反之亦然。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.36.210.113 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1724829001.A.F0A.html
1F:→ yhliu: FWER 是假设要做的 k 个检定其 H0 都成立,却至少一个 H0 08/29 09:15
2F:→ yhliu: 被拒绝的机率;FDR 是被拒绝的 H0 中,有夕少其实 H0 没错 08/29 09:17
3F:→ yhliu: 的比例。如果以疾病检测来说,把每一个被检测的人类比为待 08/29 09:20
4F:→ yhliu: 检定的假说,FWER是=(无病却呈阳性)/(无病) 08/29 09:22
5F:→ yhliu: FDR = (无病却呈阳性)/(阳性)。这是两个不能相互比较的比例 08/29 09:24
6F:→ yhliu: 或条件机率。 08/29 09:24
7F:→ yhliu: 更正:上面以疾病检测对FWER的说明是错的;最初的说明是对的 08/29 09:30
8F:→ yhliu: 以疾病检测来看,人数够多几乎必然出现假阳性,意谓FWER接 08/29 09:31
9F:→ yhliu: 近 1,就如同一篇研究报告做了数十甚至数百检定,即使真实 08/29 09:33
10F:→ yhliu: 情况是所有 H0 都不应被拒绝,但实际上会出现一些 "颢着" 08/29 09:35
11F:→ yhliu: 结论是很正常的。在疾狷检测,(假阳性)/(正常) 比例相当於 08/29 09:37
12F:→ yhliu: 单一假说检定的型一误机率,而 FWER 远比这个大得多。 08/29 09:39
13F:→ yhliu: 但无论如何,FWER 和 FDR 是不能比较的两个概念。 08/29 09:41
翻阅一堆文献後查到:
FDR <= FWER
上述关系是根据下列四对四表格的变数进行分析得到的。
空格,宣告统计不显着,宣告统计显着,总数
真正的虚无假说数,U, V, m0
非真 ,T, S, m-m0
空格 ,m-R, R, m
从而,
FWER = P( V >= 1)
定义新随机变数
Q = V/( V + S ),即被拒的虚无假说当中,错误拒绝的比例。
则
FDR = Qe = E(Q) = E( V/( V + S ) ) = E( V/R )
接下来从等号和不等号分别分析:
一、等号:
假如所有虚无假说皆为真,则
FDR = FWER
因为这时候 s = 0 且 v = r,所以
倘 v = 0 则 Q = 0,而且
> 0 1,因而导致
P( V >= 1 ) = E(Q) = Qe
(上面论述的最下面两列看不懂,为何 v > 0 会让 Q = 1? 从先前的
数学式看不出来这点。)
二、不等式(小於):
若 m0 < m,则 FDR < FWER
在这时候,
倘 v > 0 则 v/r <= 1,导致 chi2( v >= 1) >= Q。对此关系取期望值,
则 P( V >= 1) >= E(Q) = Qe
(上面论述看不懂。)
※ 编辑: saltlake (114.36.216.142 台湾), 09/07/2024 08:07:47