[转录]我常用到的stata命令（三）

时间Thu Nov 18 20:49:45 2010

我常用到的stata命令：（续）大量的虚拟变数往往是根据某个已知变数的取值生成的。比如，在某个回归中希望控制每个观察所在的社区，即希望控制标记社区的虚拟变数。社区数目可能有成百上千个，如果用上次的所说的方法生成就需要重复成百上千次，这也太笨了。大量生成虚拟变数的命令如下； ta （变数名）, gen(（变数名）) 第一个括弧里的变数名是已知的变数，在上面的例子中是社区编码。後一个括弧里的变数名是新生成的虚拟变数的共同首码，後面跟数位表示不同的虚拟变数。如果我在这里填入 d，那麽，上述命令就会新生成d1，d2，等等，直到所有社区都有一个虚拟变数。在回归中控制社区变数，只需简单地放入这些变数即可。一个麻烦是虚拟变数太多，怎麽简单地加入呢？一个办法是用省略符号，d*表示所有d字母开头的变数，另一法是用破折号，d1-d150表示第一个到第150个社区虚拟变数（假设共有150个社区）。还有一种方法可以在回归中直接控制虚拟变数，而无需真的去生成这些虚拟变数。使用命令areg可以做到，它的语法是 areg （被解释变数）（解释变数）, absorb（变数名） absorb选项後面的变数名和前面讲的命令中第一个变数名相同。在上面的例子中即为社区编码。回归的结果和在reg中直接加入相应的虚拟变数相同。生成变数的最後一招是egen。egen和gen都用於生成新变数，但egen的特点是它更强大的函数功能。gen可以支援一些函数，egen支援额外的函数。如果用gen搞不定，就得用egen 想办法了。不过我比较懒，到现在为止只用用取平均、加和这些简单的函数。有的时候资料情况复杂一些，往往生成所需变数不是非常直接，就需要多几个过程。曾经碰到原始资料中记录日期有些怪异的格式。比如，1991年10月23日被记录为19911023。我想使用它年份和月份，并生成虚拟变数。下面是我的做法： gen yr=int(date) gen mo=int((data-yr*10000)/100) ta yr, gen( yd) ta mo, gen( md) 假设你已经生成了所有需要的变数，现在最重要的就是保存好你的工作。使用的命令是 save空格（档案名），replace。和前面介绍的一样，replace选项将更新你对资料库的修改，所以一定要小心使用。最好另存一个新的资料库，如果把原始库改了又变不回去，就叫天不应叫地不灵了。 --

※ 发信站: 批踢踢实业坊(ptt.cc) ◆ From: 140.120.95.44

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

NCHU-AE98 板

[转录]我常用到的stata命令（三）

热门看板

赞助商连结