作者QooHo (Qooo)
看板Statistics
标题[问题] 非线性的相关系数
时间Mon Mar 28 14:40:34 2016
想请问大家如果有多个自变数(a.b.c.d)与一个依变数y
只知道a跟y之间有幂次关系,
不确定b.c.d跟依变数有没有相关的情形之下
有没有办法以相关性检定的方式进行选取?(得知哪项关系不密切予以剔除)
因为看到Pearson的相关系数不适用於非线性
所以不知道该怎麽检定各变数之间如果是非线性的相关性
目前想了几种,但不确定可不可行或是有没有更好的方法
1.先找a.b.c.d跟y之间的关系
经过Box-Cox变数转换变成线性模式再做相关性分析
不过担心b.c.d不会影响y或是找不出关系
2.只针对确定关系的a进行变数转换,其他变数则回归时陆续放入看R-square变化
可是又怕其他变数没转换过放进去不能看出关系
3.不看相关系数大小,只看相关系数的显着性
不确定在非线性的情形下显着性能不能表示它们有相关
麻烦大家了 谢谢!
另外想请问看课本写说回归模式大部分都假设残差是常态分配
这样如果画出来之後发现是负卡方分配 代表的意义是什麽?
谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.239.158.231
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1459147237.A.D72.html
1F:推 Pieteacher: Kendall tau! Sepearman corr 03/28 14:42
谢谢你的回答!!查了一下手边的参考书籍对於这两种都写得很简略><
想问一下他说适用於两个变数都是定序变数,是对变数x与y的"次序"应用的相关系数公式
不太清楚所谓定序变数与次序的意思,是指各资料点间距不一定要相同吗(非线性)
另外spearman相关系数公式内的等级差所代表的意思是什麽呢?
不好意思看不太懂书上统计描述的用语 有点不能理解这三者之间的差异
※ 编辑: QooHo (36.239.158.231), 03/28/2016 17:49:06
2F:→ andrew43: 你可以看一下英文维基百科。 03/28 21:25
谢谢你的建议 有看过也再查了一遍 现在比较看得懂了 应该是我搞错rank的意思了
虽然还是不太清楚为什麽公式这样算就能看出他的相关性QQ
※ 编辑: QooHo (36.239.158.231), 03/28/2016 23:31:06