作者coldeye (知其不可奈何而安之若命)
看板Statistics
标题Re: [问题] 这样对p值的理解,对吗?
时间Thu Jun 6 04:35:40 2019
最近又看到一名教授对p值写了以下叙述:
「statistical significance 通常译成「统计显着性」,由於significance
也有重要性的意思,所以,也可以译成「统计重要性」。通常是由p值
(或用希腊字母来表达,脸书打不出来)来决定。它是指:在进行统计检定
(统计检验)时,根据检验过程中抽样的样本统计後得到的数字,掉到信赖区间之外
(即出错)的机率。如果p=5%,即是指一百次相同方法(但抽取的样本不同)统计的
结果,有95次会掉在信赖区间内,有5次会在信赖区间外。所以这里有很大的不确定性,
第一个是准确值的估计,要先估计一个准确值,但这只是估计,即假设。这个假设
也是用抽样统计来建立的。第二是信赖区间,一般可能是估计正确值的正负误差构成的,
如果容忍误差是3%,那麽它的信赖区间的误差范围就有6%,即估计值上下各3%。
最後是显着性水准本身,一般常用的5%,当然可以更严格,但抽样的样本就要更大,
也要耗费更多资源去作样本的调查。
设计5%作为显着性水准的门槛--或称「阈值」--是长期经验的结果,
也是社会科学和生医科学常用的。它的历史来源,需要追溯,但我没有去追溯过。
可是,因为它太常用,导致一种错觉,以为达到「显着性水准」如p值小於5%,
就算是「验证」了假设。如大於5%,就算是否证了假设。例如,如果在药物疗物
检验上,一次检验的结果,没有达到小於5%的显着性水准,就结论说该药物是无效的,
换言之,把p值当成一种「确定性」的指标,那就在科学推论上犯了很大的错误:
完全忽略上段所说的三层不确定性!即使把显着性水准提高,例如拉到1%,
仍然一样,上文所谈的三层不确定性,依然存在。当然,它的不确定性程度会小很多。」
我承认引文有点长。
但我发现这名教授似乎把alpha值(5%)和p值理解成一个东西,
而再把基於观测值和alpha值而计算得出的信赖区间再拉进来,
最後说有三种不确定性。
他是不是搞错了很多东西?
※ 引述《coldeye (知其不可奈何而安之若命)》之铭言:
: 看了一篇文章「我们与「显着」的距离:P值是判断研究成败的过时指标吗?」
: https://www.thenewslens.com/article/117647
: 里头有一段话:
: p值是这样的条件机率:Pr(X>=x0∣H0)=p(x0)
: 公式里的H0,代表虚无假设的统计模型(statistical model),
: X代表实际资料的随机变数,x0代表虚无假设统计模型的随机变数,
: 一般来说X与x0分别指实际资料的平均值与统计模型估计的期望值。
: 请问这段话对X和x0的描述正确吗?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 84.13.84.136 (英国)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1559766942.A.045.html
1F:推 andrew43: 比上次那篇更看不懂了 XD06/06 08:12
2F:→ bmka: 这写的什麽鬼...06/06 08:13
3F:→ bmka: 直接回...观念混淆解释完全错误06/06 08:13
4F:推 imaltar: 看不太懂他在讲什麽06/06 09:03
看来不是只有我搞不懂他在写什麽。XD
※ 编辑: coldeye (84.13.73.147 英国), 06/06/2019 21:48:08
5F:→ yuyuyuai: 把p值跟alpha搞混了?06/07 21:48
除了这个,还搞混了很多XD
6F:推 aikotoba: 这篇真的很母汤 一堆讲错06/08 00:59
※ 编辑: coldeye (31.66.109.142 英国), 06/08/2019 01:06:02
这篇跟上篇一样,也上了关键评论网。
https://www.thenewslens.com/article/120318
※ 编辑: coldeye (84.13.88.56 英国), 06/08/2019 17:28:23