作者yhliu (老怪物)
看板Math
标题Re: [机统] 信赖区间的推导过程疑问
时间Tue Jun 14 10:13:12 2022
[问]
统计问题
假设抽样来自常态分布
1.如果已知母标准差,则样本平均的分布亦为N(u, sig/sqrt(n)),则可用
(x bar - u ) / (sig/sqrt(n))方式计算区间
2.如果不知道母标准差,则
上述的标准差用无偏估计s/sqrt(n-1)取代sig/sqrt(n)
但取代後(x bar - u ) / (s/sqrt(n-1))已不为常态分布(而是t分布),
就有人去研究t分布长相,所以根据此分布计算区间
我想问的是,既然是因为有研究才知道t分布,而可以解决此类估计问题,
那当初可否不用无偏标准差,而直接采用 (x bar - u ) / (s/sqrt(n)),
然後取名xx分布,再去研究xx分布,一样可以透过样本平均跟样本标准差
去估计母平均呢?
[回]
当常态群体仅平均数未知时,Xbar - mu 的分布和未知参数无关,也就是
说可以得到其分布,其分位数,因而可以取一区间 [a,b] 具有预定机率,
从中导得 mu 的信赖区间。当然以 Xbar 之标准差 sigma/sqrt(n) 去除,
而得 Z 变量,结果具标准化常态分布,得类似的区间,从而亦得出 mu 的
某一水准的信赖临间。
当常态群体有平均数 mu, 标准差 sigma 两参数未知时,Xbar - mu 之分
布仍依赖 sigma,所以需再以一个分布和 sigma 有关的统计量调整,於是
取代 Z 的 t 变量 (用样本标准差代替 Z 定义式中的群体标准差是自然的
考虑,而统计学者发现 t 变量的分布与未知参数 mu, sigma 皆无关,并
命名此分布为 t 分布。同样可以计算其各分位数,因此可以得预定机率的
一个区间,并得到 mu 的某一水准的信赖区间。
如果 s 是所谓样本标准差 s = sqrt(sum(Xi-Xbar)^2/(n-1)), 则 t 变量
是 t = sqrt(n)(Xbar-mu)/s, 如果 s 计算式中分母用 n, t 变量才是
t = sqrt(n-1)(Xbar-mu)/s.
是否一定要用 t = sqrt(n)(Xbar-mu)/s? 用其他指标可以不可以?例如
用样本全距或四分位距代替 s?我想应该可以,例如全距
R = X(n)-X(1) = [(X(n)-mu)/sigma - (X(1)-mu)/sigma]*sigma
上式表示 R/sigma 的分布会和 mu, sigma 均无关,所以
T = sqrt(n)(Xbar-mu)/R
的分布也将会与 mu, sigma 无关,因此其分布可以确定。
那麽,为什麽用 t 而不用上述 T?原因之一是 t 的分布已经被得到;原
因之二是:基於统计假说检定问题
H0: mu = mu0 against H1: mu != mu0
从最强力检定的观点,可以导出 t 检定是 "一致最强力不偏检定",也就
是说在所有不偏检定中,基於 t 之检定具有一致最强的检定力。而 mu 之
信赖区间和一系列的 mu=mu0 vs. mu!=mu0 的检定问题可以说是相当的,
因此基於 t 变量的信赖区间也具有某种最佳性因此,就不必再考虑其他种
信赖区间了。当然,这只是在样本随机抽自常态群体时是这样,如果群体
不确定是常态,或确定不是常态,那就需考虑其他信赖区间了。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 61.224.146.58 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Math/M.1655172795.A.118.html
1F:→ DIDIMIN : 这些很难在商统或一般统计学讲清楚,只能用填鸭式 06/14 10:34
2F:→ DIDIMIN : 要学生记住哪些情况用什麽分配 06/14 10:35
3F:推 kanx : 谢谢 06/14 19:56
4F:推 Vulpix : 不偏是指μ不动的话,或许整套换成中位数就又可以 06/14 20:33
5F:→ Vulpix : 有不同见解吧。 06/14 20:33
6F:→ yhliu : 文中 "不偏检定" 指的是检定的检定力不小於型I 06/15 12:22
7F:→ yhliu : 误机率。而一个检定没有明确说明的话,型I误机率是 06/15 12:23
8F:→ yhliu : 以中位数为基础的检定是不是具有不是具有不偏性我不 06/15 12:26
9F:→ yhliu : 知道,但如果它具有不偏性,至少在某些参数值组合处 06/15 12:28
10F:→ yhliu : 会贝有较小检定力(当然基本假定是常态群体。) 06/15 12:30
11F:→ yhliu : 漏了一行。。。 06/15 12:31
12F:→ yhliu : 型I误机率不能超过显着水准的。 06/15 12:32