作者andrew43 (讨厌有好心推文後删文者)
看板Statistics
标题Re: [程式] SPSS的多元线性回归
时间Fri Aug 23 15:13:41 2019
问题有点多,我先粗略简单回答。
※ 引述《Aerisleu (aa)》之铭言:
: [软体程式类别]:SPSS
: [程式问题]:多元回归的自变项选择问题
: [软体熟悉度]:新手
: [问题叙述]:
: 我有5个自变项 1个应变项 不确定各个IV跟DV的关系所以先跑相关矩阵
: 线性相关矩阵时IV1跟DV的相关系数0.04 ANOVA表的P-value>0.05
: 但以Compound跑回归 相关系数就变成0.89 P-value=0.000
: 想请问:
: 1.
: 因为目标是要建多元回归分析
: 在跑线性的时候将IV1加入跟不加入的R^2变化很大
: 是不是应该要把IV1先平方再跑线性多元回归
: 这样是对的方向吗
「在跑线性的时候将IV1加入跟不加入的R^2变化很大」
这句话只是说IV1对DV的影响可能不小,但,是不是线性关系则不一定。
不过你最前面谈到IV1跟DV可能是非线性关系,则确实可以考虑采用二次式,
但至少也要把IV1的一次方也保留。IV1预先中心化也可能是必要的。
你也可以检视partial residual plot推测各IV对DV在多元回归中的表现。
: 相关系数应该要选取大於0.5的再去尝试排列组合?
通常没有这条法则。有统计意义的自变数不一定表示它与DV高度相关。
选IV有很多SOP,教科书通常有完整描述。
: 2.比如说IV1跟IV2线性相关系数达0.41 IV2跟DV的相关系数达0.31
: 那麽因为要避免Omitted Vairables Bias IV1跟IV2不适合同时加入多元模型?
0.41并不算高,图中看来也还好,初步应该不必有这项顾虑。做回归诊断时再察查。
: 3.在跑两两IV线性的时候 有没有建议的R^2标准来筛选自变项
: 要不然有时候R^2<0.5 但非线性相关系数超高的 大於0.6
: 这时候该怎麽解释好呢 (线性回归都低)
我不明白你这里是问怎麽挑IV还是怎麽挑回归式的型式。
後者的话,还是画些partial residual plot看看。
简单线性回归的R2就是二变数的线性相关的平方,留意一下。
这里说的非线性相关系数实际上是什麽?
: 4.大家如何诠释跑线性回归的相关系数与非线性回归相关系数差异过大的情况?
: 非线性回归相关系数 (绿:Compound,橘:Logistic,黄:Quadratic)
: https://imgur.com/OfxlIjN
: 线性相关系数表
: https://imgur.com/O3nkS5c
这表示IV和DV的关系非常可能是非线性的,例如A和D的关系很不线性。
非线性回归相关系数实际上是什麽?
图中哪个变数是你目标中的DV其实你可以直说,虽然用推敲的也能看出来。
: 5.若试想比较两个多元回归模型
: D=aA+bC+cE R^2=0.728
: C=aA+bB+cD R^2=0.891
: 这时候是不是可以说 以自变数ABD预测C比起另一组合预测D来得准确有效?
: 还是说两组应变数不同不能相比
只看R2是可以如此描述,特别是刚好二个回归式都有一样多的自变数。
留意这没有统计推论,且二个回归式也经过诊断才行。
不过,实质上这有意义吗?
我的预测身高公式比你的预测体重公式还准,啊?
: 问题有点杂 还烦请统计高手回答解惑 感谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 60.248.222.1 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1566544424.A.88A.html
※ 编辑: andrew43 (60.248.222.1 台湾), 08/23/2019 15:25:15