作者weiwei1110 (威威)
看板Statistics
标题[程式] R 虚拟变数设定问题请教
时间Wed Jun 15 10:47:21 2016
[软体程式类别]:
R
[程式问题]:
跑多元回归时的虚拟变数设定问题
[软体熟悉度]:
新手以上一点点
[问题叙述]:
目前正在建立一个有关flyingV募资平台的回归模型
依变数 Y = (每笔专案的)实际募资金额/目标金额
其中有几组自变数X是虚拟变数,如
1.不同专案类别(category):共有九种→设计、科技、社会...等
2.是否有早鸟优惠(earlybird):共有两种→有或无
3.专案发起月份(month):共有12种→12个月
但我用factor来代替虚拟变数,所以我的回归模型大概如下:
model <- lm(y ~ X1+...+factor(category)+factor(earlybird)+factor(month)+...)
想请问如果设factor的话,R会自动把这几个变数判断为虚拟变数吗???
还是需要设dummy variable才行???
目前看起来好像是能够执行,但是很怕一切都是我的误会OAQ
附上其中一组model的回归结果
http://imgur.com/oMTDF8M
有爬过文跟估狗过,但是找不太到相关资讯
所以只好劳驾各位专业的大大帮忙了 > <
谢谢!!!
--
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.112.25.100
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1465958847.A.1E5.html
※ 编辑: weiwei1110 (140.112.25.100), 06/15/2016 10:53:01
※ 编辑: weiwei1110 (140.112.25.100), 06/15/2016 10:53:19
1F:→ celestialgod: 转成factor後,R会把factor variable转成dummy 06/15 11:01
2F:→ celestialgod: 你跑的结果看起来是对的 06/15 11:01
3F:→ weiwei1110: 谢谢c大,我这几天都在确认这件事,终於放下心中大石! 06/15 15:04
4F:推 Pieteacher: 但是R 预设是 treatment coding! 要注意 如果要用 su 06/15 20:27
5F:→ Pieteacher: m coding or helmet coding 就要设定一下 06/15 20:27
6F:→ Wush978: data.frame中的factor型态在跑lm的时候会自动转成dummy 06/16 18:57
7F:→ Wush978: variable。细节可以参考model.matrix 06/16 18:57
9F:→ Wush978: 相关资料 06/16 18:58
10F:→ weiwei1110: 很谢谢P大跟W大提供的资料!感谢再感谢!XD 06/17 11:49