作者easy212028 (easy212028)
看板Statistics
标题[问题] year dummy & industry dummy
时间Fri Apr 11 15:35:46 2014
其实我对於dummy variable一直不是很了解
下午爬了前面的文章,算是了解了dummy,是要设一个对照组去做比较的
但是我现在有一个问题是
我被要求要在原本的回归式中加入year dummy 和industry dummy
去控制year 和industry的影响
但我不太理解这是要怎麽做,做完之後又应该怎麽解释?
我的资料年度是从1998-2012,industry是依据北美NAICS二位数去做分类从11-91
那要我做dummy的意思是将每一个年度和每一个产业都设一个dummy,
然後代入方程式中吗?
例如我现在的方程式是
y=x+control
y是应变数,x是自变数,control是多个控制变数的简化表示
要再加入year dummy和industry dummy的意思是让方程式变这样吗?
y=x+control+y1998+....y2012+industry11+.....industry91
如果是这样dummy variable的要求不是要用n-1个吗?
那我应该要去掉1998年的,还是2012年的呢?
industry也是同样的问题,要去掉哪一个呢?
这样跑完後的回归系数结果要怎麽解释?
我真的有认真爬了版上的文章,也在网路上蒐寻过,
但都没有找到我要的答案,所以在此po文
希望版上有人可以为我解答?
或者如果有人知到哪里有资讯可以让我自己去看我也愿意去翻查资料
谢谢!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.112.25.105
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/Statistics/M.1397201750.A.7BF.html
※ 编辑: easy212028 (140.112.25.105), 04/11/2014 15:36:58
1F:→ andrew43:去掉哪个,哪个就成为基准点,按你需求做就可以了。 04/11 19:08
2F:→ easy212028:我试着放入了year dummy,1998-2012总共14个年度,我放 04/11 19:12
3F:→ easy212028:了13个dummy进去,但是却出现其中一个有共线性问题,我 04/11 19:13
4F:→ easy212028:查过,dummy产生共线性应该是dummy trap的关系,但是我 04/11 19:14
5F:→ easy212028:确实有删掉一个dummy了,为什麽还是有共线性问题? 04/11 19:14
6F:→ easy212028:不知道有没有人知道这样要怎麽办? 04/11 19:15
7F:→ yhliu:15个年度14个虚拟变数, 再加行业别, 再加其他控制变数, 还有 04/12 04:27
8F:→ yhliu:主要的解释变数, 这模型未免太复杂了! 有几笔资料?足够估计 04/12 04:28
9F:→ yhliu:这麽多项的系数?计算上不会因误差的传播而失真吗? 04/12 04:29
10F:→ easy212028:是老师突然跟我说要加入年度和行业dummy进去控制的,我 04/12 11:04
11F:→ easy212028:也不确定是不是就是这样加 04/12 11:05