作者saltlake (SaltLake)
看板Statistics
標題[問題] 單邊統計推論
時間Mon Aug 12 04:49:09 2024
統計假說測試,當虛無假說是相等時,對立假說有三種基本型:
不等於、大於、和小於
其中,研究者選擇單邊(大於或小於)的對立假說之心理壓力是,
假說設定必須在進行測試之前就給定,可如果選單邊假說,實際
上測出來是相反的結果,就前功盡棄。
但是稍微再想一下,即使事先指定對立假說是大於,之後測出
來是小於,而且統計顯著,這個結果不是可以闡釋為:
第一、可以合理拋棄虛無假說
第二、其實「真相」是與原先想定相反的小於。
換言之,所謂的︰
要測試新產品(藥品或器材或演算法)與標準品的效能差異時,
因為我們事先不確定新的比較好,所以只保守地使用不等於的對
立假說,以便不管測出哪種結果,我們的統計測試都是「成功的
」。這種主張根本沒道理。畢竟我們的真實目的還是希望得到大
於的測試結果。倘預先給不等於而測試結果是小於,即使我們可
以引用教科書闡釋本測試「成功地」證實應拋棄虛無假說而支持
對立假說,對我們真正想達到的實務目的並無幫助。
事實上,不管我們事先設定哪種對立假說,只要真正測試結果
是大於,那麼這結果的意義才是我們真正想要的:
測試結果證實應拋棄虛無假說且支持大於?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.208.38 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1723409351.A.93B.html
1F:→ yhliu: 當研究者或統計人員採用單邊對立假說做檢定時, 就是只關心 08/12 08:32
2F:→ yhliu: 單向的變化; 否則就應採用雙邊對立假說. 就像兩種藥效相比, 08/12 08:34
3F:→ yhliu: 如果只關心 B 藥是不是確實比 A 藥好, 就做 "B藥較好" 的單 08/12 08:36
4F:→ yhliu: 邊對立假說檢定; 如果樣本結果呈現 B 藥甚至較差, 不需進一 08/12 08:38
5F:→ yhliu: 步計算誤差就可以下結論說不拒絕 H0, 也就是說不能證實 B藥 08/12 08:39
6F:→ yhliu: 較好. 如果你還要關心 B 藥是不是較差, 那麼你一開始就不應 08/12 08:41
7F:→ yhliu: 該做單邊對立假說的檢定, 而應該做雙邊對立假說的檢定. 08/12 08:42
8F:→ yhliu: 注意: 統計應該是針對問題的, 不是玩數字遊戲. 意思就是說: 08/12 08:43
9F:→ yhliu: 統計工作的執行, 要先明確目的, 而不只是一個儀式一個形式. 08/12 08:45
照這個角度看,只要是研究目的要找出更好的產品,給定相等的虛無假說,對立假說
沒得選一定要用大於了。
會有此問是因為閱讀各種領域用到統計的論文,不乏見到:
為了保守起見,本研究對立假說採用雙邊而非單邊大於者
可是研究目的根本明確就是開發新產品。
照上面說法,這類論文根本應該採用單邊大於者。
※ 編輯: saltlake (114.36.208.38 臺灣), 08/12/2024 09:20:59
10F:推 jasonfun44: 療效並不是只比最好的效果,包含最差的療效,他是兩 08/12 10:45
11F:→ jasonfun44: 邊都要比,應該說他比的是一個分佈 08/12 10:45
如果只是比兩個演算法,看哪個性能好呢?
※ 編輯: saltlake (114.36.208.38 臺灣), 08/12/2024 12:02:54
12F:→ jasonfun44: 可惜藥效不是演算法,這推論邏輯有問題 08/12 12:35
13F:→ jasonfun44: 藥有醫學、倫理考量,今天新藥的目的是讓所有人都能 08/12 12:56
14F:→ jasonfun44: 獲得更好的治療效果,而非單純說我只要部分人獲得最 08/12 12:56
15F:→ jasonfun44: 好的改善 08/12 12:56
不是很清楚樓上的意思。
假設要測試一個新藥的療效,一個標準方法是和當前標準藥的療效相比。
虛無假說無差別,至於對立假說到底選有差別或大於或小於,並不會影響
測試結果。測試結果顯示新藥療效大於標準藥者,廠商很高興;療效小於
標準藥者,廠商得回去研究如何提升。但這個測試結果和採用何種對立假
說何關?
事先廠商可以選大於或有差別的對立假說,一旦測試假說是小於,這不
滿足對立假說,所以實驗「失敗」。但廠商如果覺得測試新藥有潛力,難
道會因為選了大於的對立假說就不繼續研究改良這個測試新藥?
反之,廠商選了有差別的對立假說,而測試結果是小於,那麼符合對立
假說而實驗「成功」。難道廠商竟可以據此宣稱新藥療效「更好」?
※ 編輯: saltlake (114.36.208.38 臺灣), 08/12/2024 14:15:44
整個想了一下,雖然統計推論的理論有三種對立假說可選,就實際運用
上,只有兩種:
大於 (或小於) <- 視實驗目的而定,目的在證實產品效果優於標準品者
,選擇小於假說乃自始不合邏輯者;反之,目的在證實新產品成本低
於標準品者,選擇大於假說乃自始不合邏輯者。
有差異 <- 即使實驗目的在證實大於(或小於),但是實驗者設計實驗之
時,沒有足夠證據支持本試驗能達成目的,因此本試驗的目的僅限於
和標準品表現有差異就滿足了。倘能達成目的,再進行合於目的之單
邊假說測試;倘不能達成目的,即測試結果無差別者,則基於「本假
說測試設計以外」的證據,決定下一步乃放棄本產品或者做某方面改
良。
這種透過兩個階段來進行假說測試的例子,例如多比較測試。第一
步先做變異數分析,此時對立假說僅是有否差異;倘測試結果顯示有
差異者,再進行後續的一對一或者成對比較測試。
※ 編輯: saltlake (114.36.208.38 臺灣), 08/12/2024 15:25:51
16F:→ yhliu: 以藥效實驗為例, 如果新藥沒有實證說效果較好或不良副作用 08/13 08:43
17F:→ yhliu: 較小, 就是失敗, 斤以實驗目標在證實新藥較好, 可以採用單 08/13 08:45
18F:→ yhliu: 邊對立假說, H0: 新藥沒改進(含較差), Ha: 新藥較好. 08/13 08:46
19F:→ yhliu: 如果是兩種藥比較, 沒有明確偏向, 目的在選擇較好的, 則應 08/13 08:48
20F:→ yhliu: 採雙邊對立假說: H0: 兩種藥效無效明顯)差別, Ha: 有差別. 08/13 08:50
21F:→ yhliu: 當既關心 A 是否比 B 好, 又關心 A 是否比 B 差時, 就是需 08/13 08:51
22F:→ yhliu: 要用雙邊對立假說, 不該用單邊對立假說. 08/13 08:52