作者wearytolove (夺真书生A.W.)
站内R983220PA
标题[讨论] 社科统C14.4
时间Fri Nov 27 17:38:18 2009
C14.4,也就是讨论商业特许区EZ对失业率宣告的关系,与E13.8的比较
我在回去想了很久以後,发现我们之前的讲法不太对,所以po出来大家讨论一下
E13.8中,一开始式子为log(eclms)=θt + Bezit + ai + uit
而C14.4的式子为log(eclms)=Ci*t + Bezit + ai + uit
这两个有什麽差异呢?
θt的意思代表说,在80~88年中,全部地区失业率都会有某种上升,
因此θt代表的是不同年里,全部地区失业率平均数的差异
而Ci*t代表是说,这个式子认为,每一个地区都会有某一种特性
这种特性会随着时间越变越严重
ai代表的是,每个地区都有某一种特性
这种特性在不同年间的影响会是一样的
假如画张表的话,可以这样解释....
对资料的假定 │ 不随时间变化 │ 会随时间变化
────────┼───────┼───────
不随地区变化 │ β0 │ θt=d81+d82+....
────────┼───────┼───────
会随地区变化 │ ai │ Ci*t
────────┼───────┼───────
举个例
θt可能是全国平均经济成长率,也就是全国各地都上升这样的量
ai可能是当地生活习惯,例如说A地的人喜欢工作4年出去玩1年
因此失业率永远比其它地方低20%
ai=20%
Ci可能是当地人口净增加量,例如A地每年都会增加5%的人,B地持平
第二年後A地就比B地多10%的人,三年就15%....
而或许这净增加量中就会有固定比例β*Ci*t的人失业
这个表格也许可以解释为什麽E13.8跟C14.4(ii)会有所不同
E13.8只把θt跟ai放进式子里,代表说他只测量可能因地变或因时变的值
使用F.D.之後,随地变的ai消失,剩下θt以d81 d82 ....来代表不同年的平均差异
此时资料探讨的是ez变化量对失业率变化量的影响
已被解释的是每一年的总体平均差异θt,再依△ez把资料分成忽然有ez,持平,忽然没ez
然後来计算这三组资料的平均差异,就是β1
这样无法被解释到的,就是假如有存在Ci*t,他将会成为跑完回归的intercept
也就是本来的θt中将会包含Ci的平均值,而β1则可能会被Ci-Mean(Ci)影响
举例来说,也许经济明明很差,θt>0,但是因为各地平均净人口量都在下降
因此失业人口也变少,只用θt来看反而是负的,因为变θt+Mean(Ci)
也就是d81,d82....的系数会比较不准,而β1被影响的较小,
除非Ci-Mean(Ci)与ez有correlated
C14.4(ii)则是把Ci*t与ai放进去,代表说他测量因地变的值,或因时地而固定增加的量
先使用F.D.之後,ai消失,而Ci*t剩下Ci
此时资料探讨的是ez变化量对失业率变化量的影响
已被解释的是每一地每年的固定变化量Ci,再依△ez把资料分成忽然有ez,持平,忽然没ez
此时无法被解释到的,就是平均变化量θt,θt的平均值会被加到Ci中
会这样说,是因为假如各地都是增加Ci,那麽每年整体会增加ΣCi,因此必包含θt平均值
此时再做fixed effect,Ci就被消掉了
没有被考虑到的,就是每年不同的增加量θt-Mean(θt)的值,可能会影响ez
举例来说,可能有一年θt-Mean(θt)大於零,正好当年有ez较多,则β1就变大了
这也使得用这式子算出来的β1比较不精确
因此,C14.4(iii)又多加了时间变数,则是把每年不同的增加量θt-Mean(Ci)的值也考虑
这样新的ez中,就不会包括Ci*t,也不会包括θt,也不会包括ai
算出来的就是纯粹△ez与△log(eclms)之间的关系了
(假设没有其它新变数应考虑,u~N)
以上一些意见,欢迎同学们更进一步讨论!
虽然我觉得这样写应该没什麽人看得懂,因为我自己也看不太懂...Orz
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.112.150.172
※ 编辑: wearytolove 来自: 140.112.5.19 (11/27 22:58)
※ 编辑: wearytolove 来自: 140.112.5.19 (11/27 23:17)
1F:推 lingary:天书.....翻译米糕使用中 11/28 05:10
2F:推 LoveSeverus:看不太懂+1 XDDD 11/28 22:07
3F:推 lingary:我又看懂了一点惹....谜题已经完全解开了(头背後一条白线) 11/30 05:39