作者saltlake (SaltLake)
看板Statistics
標題[問題] 對控制 FWER 和 FDR 結果詮釋的差別
時間Mon Sep 30 17:33:28 2024
Family-Wise Error Rate (FWER) 是至少有一次偽陽的機率
False Discovery Rate (FDR) 是偽陽數和總拒卻虛無假說數的比例之期望值
對同一個涉及多重比較假說的統計推論,使用 FWER 和 FDR 所得結果會有怎
樣不同?
例如,在單比較統計推論問題,對所得顯著結果的解釋是,另外對這個問題
做許多次測試的推論結果,雖然不必然每次都相同,但是我們可以聲稱,這許
多次的測試結果,有 95% 會落在第一次測試所得的信心區間之內。
那麼,在多重比較的問題呢? 控制 FWER 和 FDR 所得的第一次結果,再經過
多次隨機測試做驗證之後,我們能夠在給定信心水準下聲稱的結果有何差異?
具體例子像是測試五種飼料對豬隻增肥效果,將效果大小由大而小排列。這
會需要 C(5,2) = 10 重測試才能決定這五種飼料的增肥排列。用控制 FWER 和
用控制 FDR 得到的推論結果,會有何不同?
一、FWER,用 Bonferronin 修正
就整體假說測試言,長期來看,有百分之九十五的結果會如初次測試這般排
列。對於整體中的每一個個別測試言,長期來看,有千分之五的結果會如初次
測試這般。
二、FDR,用 Benjamini-Hochberg 修正
就整體假說測試言,長期來看,預期的偽陽數對總顯著數之比值不變,但是
排列結果無法判斷。因為每次隨機抽樣測試,個別測試結果並不受控制,不像
使用 FWER 時有控制其偽陽機率。既然只控制預期的整體偽陽數對顯著數之比
值,每次前次測試要保持初次排列的顯著與否不受控制,所以每次究竟怎排列
全不可預測。
就個別測試言,FDR 只控制整體,所以無法預測。
兩種誤差控制的差異,如同上面描述的那般嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.243.141 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1727688810.A.934.html
※ 編輯: saltlake (114.36.243.141 臺灣), 10/01/2024 05:38:42
2F:→ recorriendo: 虛無假設是"全部都無差別" 只要你宣稱其中任何一個比 10/01 14:23
3F:→ recorriendo: 較有差別就是拒絕虛無假設 FWER就是在控制這樣宣稱的 10/01 14:24
4F:→ recorriendo: type 1 error rate 10/01 14:25
5F:→ recorriendo: 如果虛無假說是成立的 你宣稱任何兩個情況有差別都是 10/01 14:31
6F:→ recorriendo: type 1 error 不管你宣稱的排序是什麼 10/01 14:32
7F:→ recorriendo: 你的理解從開頭就錯了 不是"長期來看" 而是"虛無假說 10/01 14:35
8F:→ recorriendo: 假說成立的情況下" 這和普通統計檢定是一樣的 10/01 14:35
9F:→ recorriendo: 你對信賴區間的理解也有誤(信賴區間和檢定也是兩個分 10/01 14:37
10F:→ recorriendo: 別的主題 其實不知道你硬要混再一起談幹嘛) 不是"第 10/01 14:37
11F:→ recorriendo: 一次測試的區間會包含95%重複試驗結果" 而是 "重複獨 10/01 14:40
12F:→ recorriendo: 立抽樣實驗所得的諸區間95%有含蓋到真值" 10/01 14:41