作者BugEater (无庸)
看板Statistics
标题Re: [程式]SAS利用巨集水平合并多个档
时间Thu Jan 15 07:54:51 2015
我一般的做法是这样的
首先把所有file的名字列出来
(应该有很多方法,我都是直接进入dos界面使用dir命令
然後copy出所有的files的名字)
然後利用excel,把它们和有次序的macro variable联系起来
例如这样
%let file1=TX2007Jan1;
%let file2=TX2007Jan3;
...
%let file1000=TX2015Jan14;
这样就可用使用Loop来顺序读取所有file
如下,
%macro mergefile;
PROC DATASETS library=work; DELETE total temp;RUN;
%do i=1 %to 1000;
PROC IMPORT OUT= temp
DATAFILE= "D:\test\&&file&i.."
DBMS=DBF REPLACE;
GETDELETED=NO;
RUN;
data temp;
set temp;
filename=&&file&i..;
keep filename post_code RASTERVALU;
run;
PROC DATASETS; APPEND base =total new = temp force;RUN;
%end;
%mend;
%mergefile;
这样你就有了一个file包括所有资料,里面的variable filename包括了年月日
你需要什麽就用相应的function来获取就可以,或者你要transpose data也可以
用proc datasets 的append的时候要小心,相同variable的format要一致
否则会有问题,要小心检查。
※ 引述《ctn912 (雨儿)》之铭言:
: --------------------------------------------------------------------
: [软体程式类别]:
: SAS9.3
: [程式问题]:
: 资料处理
: [软体熟悉度]:
: 中(3个月到1年)
: [问题叙述]:
: 目前我有五年份的档案(DBF档),数量大约一千多个,每个档案以日期命名,
: 因为不是每一天都有档案所以数字并不连续。
: 每一个档案内都只有一个变数RASTERVALU
: 例如一月份档名:TX2007JAN1、TX2007JAN3、TX2007JAN11、TX2007JAN15...
: 我想用macro将所有的档案读入,修改变数名称(改为日期)再合并。
: 由於档名的数字不连续,所以结果会将原本没有的档案也建立在资料库,
: 使用merge在合并时就发生没有读取到变数而发生错误不能合并。
: 在版上看过有人写 PROC DATASET 的巨集来做,
: 虽然之後试了force option有强制并在一起但是除了共同栏位外其余都成了缺失值。
: 所有程式语法如下。
: 因为我第一次试写macro语法,估勾很久还是不知道如何解决,还请版友指教。
: 谢谢大家^^
: [程式范例]:
: %macro import (n);
: %Do i=1 %to &n;
: PROC IMPORT OUT= WORK.temp2007JAN&i
: DATAFILE= "D:\test\ck0701&i"
: DBMS=DBF REPLACE;
: GETDELETED=NO;
: RUN;
: data TX2007JAN&i;
: set temp2007JAN&i;
: keep post_code RASTERVALU;
: if RASTERVALU>0 then TX2007JAN&i=RASTERVALU;
: run;
: data A.TX2007JAN&i;
: set TX2007JAN&i;
: TX2007JAN&i=RASTERVALU;
: drop RASTERVALU;
: run;
: %end;
: %mend;
: %import (28);
: -------------------------------------------------------
: %macro merge ;
: PROC DATASETS library=A; RUN;
: %do i=1 %to 28;
: proc sort data=TX2007JAN&i; by post_code;
: PROC DATASETS; APPEND out =tm data=TX2007JAN&i force;
: RUN;
: %end;
: %mend merge ;
: %merge by post_code;
: -----------------------------------------------------------------------------
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 76.85.174.10
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1421279701.A.E79.html
1F:→ BugEater: filename=&&file&i..;应该爲filename="&&file&i.."; 01/15 09:03
2F:→ ctn912: 上网查了之後才对macro variable有点概念,我试跑这段语法 01/16 15:48
3F:→ ctn912: 大概可以了解了,感激不尽 01/16 15:50
4F:→ BugEater: 我要补充一点,在%do i=1 %to 1000;的後面,需要加上 01/17 10:16
5F:→ BugEater: PROC DATASETS library=work; DELETE temp;RUN; 01/17 10:17
6F:→ BugEater: 否则可能会有问题。这是因爲每个file在import之後 01/17 10:18
7F:→ BugEater: 都会overwrite temp这个file,问题是如果某个file,例如 01/17 10:19
8F:→ BugEater: file100在import的时候失败,这时候temp就还仍然是第 01/17 10:20
9F:→ BugEater: 99个file,然後再被append到total里面去,相当於file99 01/17 10:21
10F:→ BugEater: 被append了两次,而你可能没有发现这个问题,使得後面 01/17 10:22
11F:→ BugEater: 的分析可能出错。由於问题很严重,所以我要补充这一点。 01/17 10:23
12F:→ ctn912: 感谢协助与指导,我已经顺利跑出来了^^ 01/19 21:03