作者saltlake (SaltLake)
看板Statistics
標題[問題] relations between FWER and FDR
時間Wed Aug 28 15:09:59 2024
請問這兩個統計誤差率之間存有關係式或者轉換公式嗎?
Familywise Error Rate (FWER) (不知中文文獻怎稱呼)
False Discovery Rate (FDR) (不知中文文獻怎稱呼)
例如:
FWER <= a*FDR, a: 某常數。
FWER = func(FDR)
查了一些統計書,提到這兩個誤差率,多半是描述:
FWER 比較嚴格,所以會導致較大的二型誤差
如果統計決策需要進行「大量的」(如成百上千)的假說測試才能做出,
建議使用較寬鬆的 FDR,因為用 FWER 很可能得到極小而不合理的統計顯
著水準( alpha 值)。
但是具體到底是多少個以下的假說測試才用 FWER?
另外就是上面問的兩者間的函數關係,意思是。倘若我們用 FWER 修正
統計顯著水準之後,執行這個統計決策會招致多大的 FDR? 反之亦然。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.210.113 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1724829001.A.F0A.html
1F:→ yhliu: FWER 是假設要做的 k 個檢定其 H0 都成立,卻至少一個 H0 08/29 09:15
2F:→ yhliu: 被拒絕的機率;FDR 是被拒絕的 H0 中,有夕少其實 H0 沒錯 08/29 09:17
3F:→ yhliu: 的比例。如果以疾病檢測來說,把每一個被檢測的人類比為待 08/29 09:20
4F:→ yhliu: 檢定的假說,FWER是=(無病卻呈陽性)/(無病) 08/29 09:22
5F:→ yhliu: FDR = (無病卻呈陽性)/(陽性)。這是兩個不能相互比較的比例 08/29 09:24
6F:→ yhliu: 或條件機率。 08/29 09:24
7F:→ yhliu: 更正:上面以疾病檢測對FWER的說明是錯的;最初的說明是對的 08/29 09:30
8F:→ yhliu: 以疾病檢測來看,人數夠多幾乎必然出現假陽性,意謂FWER接 08/29 09:31
9F:→ yhliu: 近 1,就如同一篇研究報告做了數十甚至數百檢定,即使真實 08/29 09:33
10F:→ yhliu: 情況是所有 H0 都不應被拒絕,但實際上會出現一些 "顥著" 08/29 09:35
11F:→ yhliu: 結論是很正常的。在疾狷檢測,(假陽性)/(正常) 比例相當於 08/29 09:37
12F:→ yhliu: 單一假說檢定的型一誤機率,而 FWER 遠比這個大得多。 08/29 09:39
13F:→ yhliu: 但無論如何,FWER 和 FDR 是不能比較的兩個概念。 08/29 09:41
翻閱一堆文獻後查到:
FDR <= FWER
上述關係是根據下列四對四表格的變數進行分析得到的。
空格,宣告統計不顯著,宣告統計顯著,總數
真正的虛無假說數,U, V, m0
非真 ,T, S, m-m0
空格 ,m-R, R, m
從而,
FWER = P( V >= 1)
定義新隨機變數
Q = V/( V + S ),即被拒的虛無假說當中,錯誤拒絕的比例。
則
FDR = Qe = E(Q) = E( V/( V + S ) ) = E( V/R )
接下來從等號和不等號分別分析:
一、等號:
假如所有虛無假說皆為真,則
FDR = FWER
因為這時候 s = 0 且 v = r,所以
倘 v = 0 則 Q = 0,而且
> 0 1,因而導致
P( V >= 1 ) = E(Q) = Qe
(上面論述的最下面兩列看不懂,為何 v > 0 會讓 Q = 1? 從先前的
數學式看不出來這點。)
二、不等式(小於):
若 m0 < m,則 FDR < FWER
在這時候,
倘 v > 0 則 v/r <= 1,導致 chi2( v >= 1) >= Q。對此關係取期望值,
則 P( V >= 1) >= E(Q) = Qe
(上面論述看不懂。)
※ 編輯: saltlake (114.36.216.142 臺灣), 09/07/2024 08:07:47