作者lohas501 (wiikobe)
看板Statistics
標題[程式] SAS刪除多家年份不齊全之公司
時間Wed Apr 8 21:14:02 2015
[軟體程式類別]:sas
[軟體熟悉度]:低(1~3個月)
[問題敘述]:
各位大大,小弟想請教資料整理的問題,因為我的資料需要一家公司完整2005年01月至
2013年12月,共9年期間的資料,但某些公司存在年份可能會是2004年01月至2008年12月
,我該如何剔除年份不完整的公司?
原資料呈現(片段部分)
公司 year month
1 2005 01
1 2005 02
. . .
. . .
1 2008 01
. . .
1 2013 11
1 2013 12
2 2004 01
. . .
. . .
2 2005 01
. . .
2 2008 12
我目前想到的做法是計算一家公司的總月份區間,例如1公司年分為2005/01-2013/12,總
區間極為9*12=108個月,因此新增一欄為1代表該公司是擁有九年完整資料,而2公司則是
2004/01-2008/12,共有60個月份,並增設為0,然後可利用if then delete的語法刪除為
0的資料,但目前卡在前面的code不會寫,希望各位大大能夠提點小弟。
完成資料應該為下列情形,之後即可利用if then delete的做法刪除2公司
公司 year month r
1 2005 01 1
1 2005 02 1
. . . 1
. . . 1
1 2008 01 1
. . . 1
1 2013 11 1
1 2013 12 1
2 2004 01 0
. . . 0
. . . 0
2 2005 01 0
. . . 0
2 2008 12 0
若提問不夠詳細,我會再加以補充,還望各位大大海含小弟第一次發文。
------------------------------------------------------------------------
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.115.87.220
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1428498844.A.FF8.html
1F:推 chien533: 用proc freq算每一家公司有幾筆資料,結果用ods output 04/10 04:22
2F:→ chien533: 另存出來,然後用一個data step做一個dummy讓frequency= 04/10 04:23
3F:→ chien533: 12的公司為1, 反之為0,最後把這比數據存回原始數據,用 04/10 04:24
4F:→ chien533: 一個if-then把dummy=0的刪除即可。 04/10 04:25
5F:→ chien533: 厄...寫完才發現你自己已經寫了類似的方法...囧> 04/10 04:26