作者MTIS ( )
看板Statistics
标题[问题] 变异数检定与中央极限定理
时间Sat May 5 16:11:35 2018
假设X1, X2, ... X_n iid ~某个二阶动差存在的分配
且 Y1, Y2, ...Y_n iid ~另一个二阶动差存在的分配
由於 X_bar 和 Y_bar 在套用CLT的情况下服从常态分配,
因此能用 t test 来做两母体平均值检定。
但,两母体的变异数能就这样直接用样本标准差套进 F test 作检定吗?
维基百科说好像不适合??
"The F test and chi square tests are both adversely affected by non-normality
and are not recommended for this purpose."
(
https://en.wikipedia.org/wiki/Variance#Sample_variance )
恳请赐教,谢谢!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 218.164.16.142
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1525507899.A.0D4.html
※ 编辑: MTIS (218.164.16.142), 05/05/2018 16:40:13
1F:→ LiamIssac: xbar跟ybar不是随机变数怎麽会服从normal... 05/05 18:16
更正为大写,对吧?
2F:→ yhliu: 不能. 样本变异数之抽样分布对群体之非常态性非常敏感, 因 05/06 06:32
3F:→ yhliu: 此除非两群体确实很接近常态分布, 否则 F test 并不适合. 05/06 06:34
了解~
所以ANOVA也不适合非常态样本罗?
(OLS部分,因为系数的假设检定需要用到残差服从常态分配的假设,
回归分析应该也不适合非常态?)
但,X或Y的变异数的平均 V(X)_bar 在样本数无限大时也适用CLT,进而能用 t test?
※ 编辑: MTIS (36.239.153.179), 05/07/2018 01:36:45
4F:→ yhliu: ANOVA 是平均数间的比较, 是 t test 推至多群体的情形, 因 05/07 10:26
5F:→ yhliu: 此与 t test 有类似的适用条件. 回归分析, 一般线模, 广义 05/07 10:28
6F:→ yhliu: 线模也类似, 在相当一般性的条件下都能引用 CLT. 05/07 10:29
7F:→ yhliu: 注意以上提到的能引用 CLT 的, 是因为都是关於 "样本平均 05/07 10:31
8F:→ yhliu: 数" 的抽样分布; 而原问是关於 "样本变异数" 的抽样分布. 05/07 10:34
9F:→ yhliu: 前者只涉及群体的平均数和变异数, 而後者至少还涉及群体的 05/07 10:36
10F:→ yhliu: 峰度, 样本变异数的大样本分布变异数就与群体峰度系数有关. 05/07 10:39
11F:→ yhliu: 此前3列说得有点乱. 应说: CLT 只需群体平均数标准差存在 05/07 10:47
12F:→ yhliu: 但其收歈速度(能引用clt的样本数)是与群体偏态峰度有关的. 05/07 10:49
13F:→ yhliu: 而样本变异数即使考虑大样本(此时它也渐近常态)其分布也与 05/07 10:51
14F:→ yhliu: 群体峰度有关, 至少其大样本(渐近)变异数就取决於群体峰度. 05/07 10:53
15F:→ yhliu: 再者, 两皮本变异比的 F test 是小样本方法, 只不过其大样 05/07 10:55
16F:→ yhliu: 本特性都与群体峰度有关, 小样本能忽视它吗? 05/07 10:57
谢谢回答~
※ 编辑: MTIS (42.71.221.76), 05/07/2018 20:01:13