作者QooHo (Qooo)
看板Statistics
標題[問題] 非線性的相關係數
時間Mon Mar 28 14:40:34 2016
想請問大家如果有多個自變數(a.b.c.d)與一個依變數y
只知道a跟y之間有冪次關係,
不確定b.c.d跟依變數有沒有相關的情形之下
有沒有辦法以相關性檢定的方式進行選取?(得知哪項關係不密切予以剔除)
因為看到Pearson的相關係數不適用於非線性
所以不知道該怎麼檢定各變數之間如果是非線性的相關性
目前想了幾種,但不確定可不可行或是有沒有更好的方法
1.先找a.b.c.d跟y之間的關係
經過Box-Cox變數轉換變成線性模式再做相關性分析
不過擔心b.c.d不會影響y或是找不出關係
2.只針對確定關係的a進行變數轉換,其他變數則迴歸時陸續放入看R-square變化
可是又怕其他變數沒轉換過放進去不能看出關係
3.不看相關係數大小,只看相關係數的顯著性
不確定在非線性的情形下顯著性能不能表示它們有相關
麻煩大家了 謝謝!
另外想請問看課本寫說迴歸模式大部分都假設殘差是常態分配
這樣如果畫出來之後發現是負卡方分配 代表的意義是什麼?
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.239.158.231
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1459147237.A.D72.html
1F:推 Pieteacher: Kendall tau! Sepearman corr 03/28 14:42
謝謝你的回答!!查了一下手邊的參考書籍對於這兩種都寫得很簡略><
想問一下他說適用於兩個變數都是定序變數,是對變數x與y的"次序"應用的相關係數公式
不太清楚所謂定序變數與次序的意思,是指各資料點間距不一定要相同嗎(非線性)
另外spearman相關係數公式內的等級差所代表的意思是什麼呢?
不好意思看不太懂書上統計描述的用語 有點不能理解這三者之間的差異
※ 編輯: QooHo (36.239.158.231), 03/28/2016 17:49:06
2F:→ andrew43: 你可以看一下英文維基百科。 03/28 21:25
謝謝你的建議 有看過也再查了一遍 現在比較看得懂了 應該是我搞錯rank的意思了
雖然還是不太清楚為什麼公式這樣算就能看出他的相關性QQ
※ 編輯: QooHo (36.239.158.231), 03/28/2016 23:31:06