作者saltlake (SaltLake)
看板Statistics
標題[問題] 對樣本庫隨機分組和全用之差
時間Sun Aug 30 20:41:00 2020
倘擬比較兩個新檢驗方法的性能是否優於標準者,而這三種檢驗方法
都是從人體取出的某些樣本(血液或尿液或者醫學影像等)做量測後給
出判定結果,例如有反應或無反應。
既有資料庫已經有 N 個患者的樣本供測試,那麼以下兩種實驗設計
有何不同?
1. 使用標準方法對所有的樣本做測試,新的兩個方法也對所有樣本做
測試,然後比較這兩個方法的敏感性和特異性。
2. 使用標準方法對所有的樣本做測試。對於那兩個新方法,隨機把樣
本分配給兩個方法之一,讓兩個方法都有 N/2 個測試樣本。然後比
較這兩個方法的敏感性和特異性。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.24.104.17 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1598791262.A.FC7.html
1F:→ yhliu: 其實有些不懂, 關於檢測之技術層面的東西. 08/31 06:22
2F:→ yhliu: (1) 3種檢測方法想必都不能百分百正確判定吧? 08/31 06:26
3F:→ yhliu: 欲知一檢測方法之敏感性與特異性, 必先有一些已知, 百分 08/31 06:28
4F:→ yhliu: 百確定屬陽性或陰性的樣本, 供測試之用. 08/31 06:30
這邊把問題描述更清楚,有兩種新方法和一個公認的標準方法(金標準)。
5F:→ yhliu: (2) 每份樣本可供多少次測試? 如所說,法1 是每份樣本做3種 08/31 06:33
6F:→ yhliu: 測試, 法2 則僅做2種測試. 08/31 06:34
7F:→ yhliu: 就統計上來說, 欲比較兩種新法與舊法之差異時, 法2 樣本數 08/31 06:36
8F:→ yhliu: 只有法1 之半, 統計誤差較大, 表現於估計的就是標準誤較大, 08/31 06:38
9F:→ yhliu: 表現於假說檢定的就是檢定力較低. 08/31 06:39
10F:→ yhliu: 若兩種新法相互比較, 法1是全樣本, 配對資料, 檢定比較兩法 08/31 06:41
11F:→ yhliu: 用 McNemar test; 法2 是兩個半樣本比較, 檢定比較兩法時用 08/31 06:43
12F:→ yhliu: 兩獨立樣本之比例差異檢定. 08/31 06:44
標準方法之所以對所有的樣本都測試,是為了提供「標準答案」以供那兩種新法
比對。比方說樣本一,新測試法一測出說有病,新測法二說沒病,而標準法說有病,
這時以標準法測的結果為準,我們才能判斷就樣本一來說,新測法一正確,而新測法
二錯誤。
把所有樣本隨機平均分配給新測法一和二,這樣這兩個方法才有相同的樣本數。
※ 編輯: saltlake (114.24.104.17 臺灣), 08/31/2020 07:56:37
13F:→ yhliu: 更迷惑了! 除非 "標準方法" 能提供百分之百正確判定, 否則 09/01 07:18
14F:→ yhliu: 如何能做為比較哪種檢測方法較好之依據? 更別說你一開始說 09/01 07:20
15F:→ yhliu: 擬比較兩新法是否優於標準者. 既當標準法為百分百正確, 新 09/01 07:22
16F:→ yhliu: 法如何可能 "較優"? 除非檢測結果完全一致而又較快較省成本 09/01 07:24
17F:→ yhliu: 若標準法非百分百正確, 則任一新法判定與標準不符, 也不能 09/01 07:25
18F:→ yhliu: 說它就是錯的; 反過來說判定相符也只是不能做為比較錯誤率 09/01 07:27
19F:→ yhliu: 之依據, 卻不能說這結果就是對的. 09/01 07:28
說的也是,抱歉。
再修正,目標應該是比較那兩個新方法何者為優。
※ 編輯: saltlake (114.24.79.213 臺灣), 09/01/2020 07:30:41
20F:→ yhliu: 所以如你所舉之例, 標準法+, 新法1也是+, 新法2是-, 除非我 09/01 07:31
21F:→ yhliu: 們能確定標準法是百分百正確, 否則如何能說新法1對而2錯? 09/01 07:32
22F:→ yhliu: 拋開時間、花費不論, 只談正確或錯誤率, 則卻評估一檢測法 09/01 07:35
23F:→ yhliu: 表現, 或欲比較兩法, 都必須有百分百已確定 + - 的樣本, 09/01 07:37
24F:→ yhliu: 否則只如水中撈月. 比如一份測驗題兩人答, 做為評卷者如不 09/01 07:38
25F:→ yhliu: 能知曉正確答案, 如何給答卷者評分? 如何比較兩答卷者優劣? 09/01 07:40
為了簡化問題,這邊的標準法的正確性是當代科技水準能達到的準確度,所以認定
為必定可靠。
統計上所謂的敏感性和特異性也是定義在有一個絕對可靠的金標準之下,如果沒有
這種金標準,根本不能算敏感性和特異性。
※ 編輯: saltlake (114.24.79.213 臺灣), 09/01/2020 13:29:56