作者saltlake (SaltLake)
看板Statistics
标题[问题] 单边统计推论
时间Mon Aug 12 04:49:09 2024
统计假说测试,当虚无假说是相等时,对立假说有三种基本型:
不等於、大於、和小於
其中,研究者选择单边(大於或小於)的对立假说之心理压力是,
假说设定必须在进行测试之前就给定,可如果选单边假说,实际
上测出来是相反的结果,就前功尽弃。
但是稍微再想一下,即使事先指定对立假说是大於,之後测出
来是小於,而且统计显着,这个结果不是可以阐释为:
第一、可以合理抛弃虚无假说
第二、其实「真相」是与原先想定相反的小於。
换言之,所谓的︰
要测试新产品(药品或器材或演算法)与标准品的效能差异时,
因为我们事先不确定新的比较好,所以只保守地使用不等於的对
立假说,以便不管测出哪种结果,我们的统计测试都是「成功的
」。这种主张根本没道理。毕竟我们的真实目的还是希望得到大
於的测试结果。倘预先给不等於而测试结果是小於,即使我们可
以引用教科书阐释本测试「成功地」证实应抛弃虚无假说而支持
对立假说,对我们真正想达到的实务目的并无帮助。
事实上,不管我们事先设定哪种对立假说,只要真正测试结果
是大於,那麽这结果的意义才是我们真正想要的:
测试结果证实应抛弃虚无假说且支持大於?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.36.208.38 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1723409351.A.93B.html
1F:→ yhliu: 当研究者或统计人员采用单边对立假说做检定时, 就是只关心 08/12 08:32
2F:→ yhliu: 单向的变化; 否则就应采用双边对立假说. 就像两种药效相比, 08/12 08:34
3F:→ yhliu: 如果只关心 B 药是不是确实比 A 药好, 就做 "B药较好" 的单 08/12 08:36
4F:→ yhliu: 边对立假说检定; 如果样本结果呈现 B 药甚至较差, 不需进一 08/12 08:38
5F:→ yhliu: 步计算误差就可以下结论说不拒绝 H0, 也就是说不能证实 B药 08/12 08:39
6F:→ yhliu: 较好. 如果你还要关心 B 药是不是较差, 那麽你一开始就不应 08/12 08:41
7F:→ yhliu: 该做单边对立假说的检定, 而应该做双边对立假说的检定. 08/12 08:42
8F:→ yhliu: 注意: 统计应该是针对问题的, 不是玩数字游戏. 意思就是说: 08/12 08:43
9F:→ yhliu: 统计工作的执行, 要先明确目的, 而不只是一个仪式一个形式. 08/12 08:45
照这个角度看,只要是研究目的要找出更好的产品,给定相等的虚无假说,对立假说
没得选一定要用大於了。
会有此问是因为阅读各种领域用到统计的论文,不乏见到:
为了保守起见,本研究对立假说采用双边而非单边大於者
可是研究目的根本明确就是开发新产品。
照上面说法,这类论文根本应该采用单边大於者。
※ 编辑: saltlake (114.36.208.38 台湾), 08/12/2024 09:20:59
10F:推 jasonfun44: 疗效并不是只比最好的效果,包含最差的疗效,他是两 08/12 10:45
11F:→ jasonfun44: 边都要比,应该说他比的是一个分布 08/12 10:45
如果只是比两个演算法,看哪个性能好呢?
※ 编辑: saltlake (114.36.208.38 台湾), 08/12/2024 12:02:54
12F:→ jasonfun44: 可惜药效不是演算法,这推论逻辑有问题 08/12 12:35
13F:→ jasonfun44: 药有医学、伦理考量,今天新药的目的是让所有人都能 08/12 12:56
14F:→ jasonfun44: 获得更好的治疗效果,而非单纯说我只要部分人获得最 08/12 12:56
15F:→ jasonfun44: 好的改善 08/12 12:56
不是很清楚楼上的意思。
假设要测试一个新药的疗效,一个标准方法是和当前标准药的疗效相比。
虚无假说无差别,至於对立假说到底选有差别或大於或小於,并不会影响
测试结果。测试结果显示新药疗效大於标准药者,厂商很高兴;疗效小於
标准药者,厂商得回去研究如何提升。但这个测试结果和采用何种对立假
说何关?
事先厂商可以选大於或有差别的对立假说,一旦测试假说是小於,这不
满足对立假说,所以实验「失败」。但厂商如果觉得测试新药有潜力,难
道会因为选了大於的对立假说就不继续研究改良这个测试新药?
反之,厂商选了有差别的对立假说,而测试结果是小於,那麽符合对立
假说而实验「成功」。难道厂商竟可以据此宣称新药疗效「更好」?
※ 编辑: saltlake (114.36.208.38 台湾), 08/12/2024 14:15:44
整个想了一下,虽然统计推论的理论有三种对立假说可选,就实际运用
上,只有两种:
大於 (或小於) <- 视实验目的而定,目的在证实产品效果优於标准品者
,选择小於假说乃自始不合逻辑者;反之,目的在证实新产品成本低
於标准品者,选择大於假说乃自始不合逻辑者。
有差异 <- 即使实验目的在证实大於(或小於),但是实验者设计实验之
时,没有足够证据支持本试验能达成目的,因此本试验的目的仅限於
和标准品表现有差异就满足了。倘能达成目的,再进行合於目的之单
边假说测试;倘不能达成目的,即测试结果无差别者,则基於「本假
说测试设计以外」的证据,决定下一步乃放弃本产品或者做某方面改
良。
这种透过两个阶段来进行假说测试的例子,例如多比较测试。第一
步先做变异数分析,此时对立假说仅是有否差异;倘测试结果显示有
差异者,再进行後续的一对一或者成对比较测试。
※ 编辑: saltlake (114.36.208.38 台湾), 08/12/2024 15:25:51
16F:→ yhliu: 以药效实验为例, 如果新药没有实证说效果较好或不良副作用 08/13 08:43
17F:→ yhliu: 较小, 就是失败, 斤以实验目标在证实新药较好, 可以采用单 08/13 08:45
18F:→ yhliu: 边对立假说, H0: 新药没改进(含较差), Ha: 新药较好. 08/13 08:46
19F:→ yhliu: 如果是两种药比较, 没有明确偏向, 目的在选择较好的, 则应 08/13 08:48
20F:→ yhliu: 采双边对立假说: H0: 两种药效无效明显)差别, Ha: 有差别. 08/13 08:50
21F:→ yhliu: 当既关心 A 是否比 B 好, 又关心 A 是否比 B 差时, 就是需 08/13 08:51
22F:→ yhliu: 要用双边对立假说, 不该用单边对立假说. 08/13 08:52