作者qazsd (珍惜当下)
看板Statistics
标题[程式] R语言找两变数之间是否有显着关系
时间Wed Jun 21 11:49:00 2017
[软体程式类别]:
R
[程式问题]:
统计
[软体熟悉度]:
新手
[问题叙述]:
现有员工资料,栏位有年资(例如 3.5年)及是否在职中(A:在职中,T:已离职)
及其他许多栏位。
想找出员工大多待多久就离职?例如年资为3.5到4.0之间的离职率最高(T的数目最多),
或是哪个国家的离职率最高?
想请问R程式该怎麽写比较好?
[程式范例]:
资料表格式如下:
ID Name StayYears Status Country
1 John 3.5 T USA
2 Mary 2.1 A USA
3 Ben 1.7 T French
4 Kevin 3.2 T India
5 Cindy 2.6 A French
6 Jack 3.9 A USA
7 Peter 1.3 A India
8 Andy 2.7 T French
9 David 0.8 A India
10 Nick 1.1 A USA
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 59.124.165.66
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1498016944.A.69B.html
※ 编辑: qazsd (59.124.165.66), 06/21/2017 11:49:50
1F:推 shirley7483: 也遇到类似问题,提出我的作法,还请大家指正。连续 06/21 15:18
2F:→ shirley7483: 对类别变数的相关性,可用oneway ANOVA,再用post-ho 06/21 15:18
3F:→ shirley7483: c细看各组差异;类别对类别变数,以你的例子,是否在 06/21 15:18
4F:→ shirley7483: 职是二元变数,应也可用oneway ANOVA。R的写法可参 06/21 15:18
6F:→ celestialgod: 把待的时间当成存活时间,离职表示死亡,未离职为 06/21 22:37
7F:→ celestialgod: 设限资料 06/21 22:37
8F:→ celestialgod: 去估计给定变数下的平均存活时间 06/21 22:38
9F:→ celestialgod: 不知道会不会太难Orz 06/21 22:38
10F:→ celestialgod: 这样应该可以跑cox-model~~ 06/21 22:38
11F:→ celestialgod: 至於R怎麽写,找一下吧,我觉得idea有了,程式不难 06/21 22:40
12F:推 ases60909: 可以用Survival 这个package 06/22 16:51