作者a22735557 (哥的小辣椒)
看板Statistics
标题[问题] 再问几个统计问题
时间Thu Oct 25 16:02:07 2018
如果是跟统计软体有关请重发文章,使用程式做为分类。
统计软体,如SPSS, AMOS, SAS, R, STATA, Eviews,请都使用程式做为分类
请详述问题内容,以利板友帮忙解答,过短文章依板规处置,请注意。
为避免版面混乱,请勿手动置底问题,善用E做档案编辑
不好意思还是有几个想请教(最後一问)
1. Likelihood ratio test的使用时机,以及其与Neyman-Pearson lemma的关系。
因後者根据我浅薄的认知是,LRT就是其中一种强力检定,而要是未知母体分配则可以使
用此检定。那为何较少看到检定中使用LRT,而是较常看到t,F,chisq等检定?既然是最强
力检定为何不都考虑LRT检定就可?还是说是主要是看data符合哪一种检定的假设,才是
较适合该检定的准则。
2. In logistic regression assumption:
因为已并非线性Model(根本没有error),因此模型前提假设应该已不需要error~~Normal
and E(error)=0、Var(error)=sigma^2 ,应该只剩下Cov(errori , errorj)=0 for each
i not equal to j 以及变项间线性独立(不能有共线性存在)。不知道我这样认为是否正
确?
3. 变异数同质性检定in ANOVA and Linear regression:
在线性Regression中,有提到其中一个假设是Var(ei)~sigma^2,而检定误差变异数是否
同质则可以利用error做White test。
而我的认知是,检定误差变异数是否同质是不等价於检定解释变数之间是否变异数同质的
。
但是,在ANOVA中,我则在某书上看到了进行Model adequancy checking(变异数同质诊断
)中,看到了三种检定方法:Bartlett's test 、Hartley test、Levene's test,但这些
Ho都是假定ANOVA检定中K个母体的变异数是否相等。
这跟我的认知违背了,我认为在Linear regression中检定解释变数之间变异数是否同质
无法等价於error是否符合模型变异数同质的假设,因在Linear Regression中就已经假定
残差独立於各解释变数了。但是在ANOVA中,其模型假设也是Var(eij)=sigma^2 ,但是其
模型诊断的变异数同质检定却不是针对error检定,而是直接诊断独立母体之间变异数是
否同质。
不知道是否是因为,ANOVA中并没有假设彼此之间有一个函数关系(不像Linear Regressio
n中的Y~X1+X2..),因此检定变异数同质自然等价於检定K个母体变异数
是否相等,而Linear Regression则反之,拥有解释变数的存在,也拥有假设解释变数与Y
存在某种函数关系,因此检定变异数同质自然只能针对这个「Linear Regression fittin
g line」的error做检定?
4. Logistic regression中的Deviance:
Logistic regression中的Deviance,其类比於Linear regression中的MSE(SSE),因此原
则上若Deviance越小,则模型的解释力越好(不知道我这样认知是否正确?)
非常谢谢各位大大的指点。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 39.8.133.223
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1540454530.A.955.html
1F:→ andrew43: 3. 单因子ANOVA为例,各组资料减去各自的平均就是残差。 10/25 16:22
我知道有这个,但是好奇的是我那样的认知是否正确QQ(ANOVA中检定error变异数同质可
以等价於检定k个母体是否变异数同质),又或是我被书误导了,又或是我是个白痴QQ,因
为时间有点着急(但并非作业或考试)因此才上来问。
※ 编辑: a22735557 (39.8.133.223), 10/25/2018 16:29:59
※ 编辑: a22735557 (39.8.133.223), 10/25/2018 17:33:50
2F:推 xiangying: 1.因为LRT所得到的拒绝域无法保证具有最大检定力,而mp 10/25 20:14
3F:→ xiangying: t umpt可以,所以情况允许的话不会用LRT。另外LRT的使 10/25 20:14
4F:→ xiangying: 用情形是1.当该检定不具有最大检定力时2.除了虚无假设 10/25 20:14
5F:→ xiangying: 与对立假设中有兴趣讨论的参数外,母体还有其他未知的 10/25 20:14
6F:→ xiangying: 参数。 10/25 20:14
7F:→ xiangying: N-P lemma常用於mpt与umpt中 10/25 20:16
8F:→ andrew43: 4. 和R2一样,塞一堆没关系的自变数也能增加解释力。 10/26 01:36
9F:→ andrew43: 所以不总是越小越好。 10/26 01:37
10F:推 celestialgod: 3. 每组资料都是一样的变异数,不同平均值,所以检 10/26 08:18
11F:推 celestialgod: 定每组资料的变异数是否相等等同於检定残差变异数 10/26 08:18
12F:推 celestialgod: 回归分析会要求检验残差是因为残差才是独立同分配, 10/26 08:19
13F:推 celestialgod: 所以三大假设都检验残差即可,不然变异数均值性看y 10/26 08:19
14F:推 celestialgod: 其实无不妥,但是常态就不能看y,因为每一个y的平均 10/26 08:20
15F:推 celestialgod: 值不同,非同分配 10/26 08:20
16F:推 garrrick: 2. 没有error是因为我们承认参数(固定的值不是随机变 10/30 12:26
17F:→ garrrick: 数)的某种转换会是covariates的线性组合,然後对於任 10/30 12:26
18F:→ garrrick: 何模型来说,一般都会允许一定程度的共线性,不能有共线 10/30 12:26
19F:→ garrrick: 性条件太严格了这会导致模型无用武之地 10/30 12:26