作者qazsd (珍惜當下)
看板Statistics
標題[程式] R語言找兩變數之間是否有顯著關係
時間Wed Jun 21 11:49:00 2017
[軟體程式類別]:
R
[程式問題]:
統計
[軟體熟悉度]:
新手
[問題敘述]:
現有員工資料,欄位有年資(例如 3.5年)及是否在職中(A:在職中,T:已離職)
及其他許多欄位。
想找出員工大多待多久就離職?例如年資為3.5到4.0之間的離職率最高(T的數目最多),
或是哪個國家的離職率最高?
想請問R程式該怎麼寫比較好?
[程式範例]:
資料表格式如下:
ID Name StayYears Status Country
1 John 3.5 T USA
2 Mary 2.1 A USA
3 Ben 1.7 T French
4 Kevin 3.2 T India
5 Cindy 2.6 A French
6 Jack 3.9 A USA
7 Peter 1.3 A India
8 Andy 2.7 T French
9 David 0.8 A India
10 Nick 1.1 A USA
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.124.165.66
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1498016944.A.69B.html
※ 編輯: qazsd (59.124.165.66), 06/21/2017 11:49:50
1F:推 shirley7483: 也遇到類似問題,提出我的作法,還請大家指正。連續 06/21 15:18
2F:→ shirley7483: 對類別變數的相關性,可用oneway ANOVA,再用post-ho 06/21 15:18
3F:→ shirley7483: c細看各組差異;類別對類別變數,以你的例子,是否在 06/21 15:18
4F:→ shirley7483: 職是二元變數,應也可用oneway ANOVA。R的寫法可參 06/21 15:18
6F:→ celestialgod: 把待的時間當成存活時間,離職表示死亡,未離職為 06/21 22:37
7F:→ celestialgod: 設限資料 06/21 22:37
8F:→ celestialgod: 去估計給定變數下的平均存活時間 06/21 22:38
9F:→ celestialgod: 不知道會不會太難Orz 06/21 22:38
10F:→ celestialgod: 這樣應該可以跑cox-model~~ 06/21 22:38
11F:→ celestialgod: 至於R怎麼寫,找一下吧,我覺得idea有了,程式不難 06/21 22:40
12F:推 ases60909: 可以用Survival 這個package 06/22 16:51