作者amberclover (年纪大了就是这样)
看板Statistics
标题[问题] 检定残差不呈常态
时间Sat Nov 18 01:46:02 2023
在做正式分析前,我想先检测资料是否符合回归分析的基本假设
如果我判读没错,目前资料符合下面假设
1.自变项与依变项呈线性 2.残差保持独立性 3.残差呈同质性
但是残差的常态检定没有过,呈现显着
上网找了很久,没有找到残差非常态时该如何处理
(已用k-s检定样本呈常态分配)
请问有比较建议的处理方式吗?
或是我在哪可以找到说明or教学?
感谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.116.20.146 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1700243165.A.20D.html
1F:→ locka: 好奇问个,有可能残差独立却非常态吗? 11/18 02:26
2F:→ yhliu: 当然可能误差项非常态。(不是残差,但误差项是不可观测的 11/18 07:31
3F:→ yhliu: 只能用观测到的残差代替。不过,残差其实相互有负相关及变 11/18 07:33
4F:→ yhliu: 异数不等的问题。)检定常态性,是把残差当误差来看待,用 11/18 07:35
5F:→ yhliu: q-q plot 观察,或做 W 检定,或 K-S 检定。 11/18 07:37
6F:→ yhliu: 对於误差项非常态分布的处理:如果是线性模型(回归模型) 11/18 07:38
7F:→ yhliu: 如果样本数相当大,可以引用中央极限定理於回归系数的推论, 11/18 07:40
8F:→ yhliu: 或者针对其真正的分布导出 MLE 及回归系数之推论。回归模型 11/18 07:42
9F:→ yhliu: 之比较也是回归系数推论。广义线性模型(link=identity)即是 11/18 07:44
10F:→ yhliu: 采用的是最大概似估计及概度比检定。但如果只知非常态而不 11/18 07:46
11F:→ yhliu: 知正确分布,又不想用普通最小平方法,那可能需要用非参数 11/18 07:48
12F:→ yhliu: 化方法,也就是无母数方法。 11/18 07:49
13F:推 a22735557: 除非违反的很夸张,例如skewness kurtosis 差很多或是 11/18 08:50
14F:→ a22735557: 不明显满足empirical rule,不然通常还好,原因同楼上 11/18 08:50
15F:→ a22735557: 大大说的,residual 本身其实变异数就不同质等等 11/18 08:50
16F:→ a22735557: 我是建议不要用K-S直接下结论,因为这个检定其实蛮难 11/18 08:52
17F:→ a22735557: 不显着的,他的要求很严格,差一点点就可能会不显着 11/18 08:52
18F:→ locka: 感谢2楼大大说明!我知道残差(亦或误差)是可能非常态分布, 11/18 09:48
19F:→ locka: 但想问的是残差有可能在「已知独立」的情况下但却「非常态 11/18 09:48
20F:→ locka: 」吗?(以前都以为只要独立就一定会是常态分布…)有点想不 11/18 09:48
21F:→ locka: 明白,再请大大解惑,谢谢>"< 11/18 09:48
22F:→ amberclover: 感谢大大说明,为了这个超级烦恼. 再次感谢 11/18 10:17
23F:→ Pieteacher: Boxcox transform 11/18 19:40
24F:→ yhliu: 比如说 logistic 回归,Poisson 回归,前者每个观测值不是 11/19 09:33
25F:→ yhliu: 0 就是 1, 後者观测值是计数资料,与回归曲线之间就群体模 11/19 09:35
26F:→ yhliu: 型而言有误差,就样本值而言有残差。残差因为回归线就是这 11/19 09:36
27F:→ yhliu: 些资料去 fit 的,所以相互有相关;误差则是观测值与群体回 11/19 09:38
28F:→ yhliu: 归函数之间的差,观测值相互独立,误差只是各观测值减去一 11/19 09:40
29F:→ yhliu: 个理论上的期望值,当然还是相互独立,但这些误差怎麽可能 11/19 09:42
30F:→ yhliu: 常态分布?更别说要假设它们是 i.i.d. 常态。事实上如线性 11/19 09:43
31F:→ yhliu: 模型的 "误差是 i.i.d. 常态" 只是一个分析者设立模型时的 11/19 09:45
32F:→ yhliu: 假设,这假设是否为真有时候需要检验,这就是残差分析的项 11/19 09:46
33F:→ yhliu: 目之一。残差是群体模型误差项的替代或估计,因此从各种残 11/19 09:48
34F:→ yhliu: 差图可以看出很多东西,如回归函数适当否?误差变四是否为 11/19 09:50
35F:→ yhliu: 常数?误差项是否符合原假设的常态?有没有离群点?是否有 11/19 09:51
36F:→ yhliu: 些影响点需要特别注意。关於误差常态性的检查,通常看 qq图 11/19 09:53
37F:→ yhliu: W 检定与 qq图密切关联,至於 S-K 检定,其实它比较适合用 11/19 09:55
38F:→ yhliu: 在不需估计参数的资料,Box-Cox 转换虽然可能改善误差项的 11/19 09:56
39F:→ yhliu: 态使其较趋对称也较接近常态,但也改变了回归函数式及相加 11/19 09:58
40F:→ yhliu: 性结构,但如果样本不是太小,残差显示误差项分布不是太偏 11/19 10:01
41F:→ yhliu: 则关於回归系数的推论,t 程序,F 程序就不用太担心。 11/19 10:02
42F:→ yhliu: 前面 误差项变异数 打成 误差变四 . 11/19 10:06
43F:推 locka: 谢谢yhliu大大!非常清楚!! 11/19 11:47