作者tew (咖啡王子)
看板Statistics
標題Re: [程式] SAS 部分相同資料合併問題
時間Wed Oct 18 21:32:14 2017
※ 引述《loser3o0 (loser3o0)》之銘言:
: 大家好,
: 我的資料長這樣,是網頁分析資料,有三個欄位,
: SessionKey是拜訪cookie的key值,區分不同拜訪網頁者,
: PageName是觀看頁面名稱
: Step是依時間排序的觀看次序,
: SessionKey PageName Step
: 1 A 1
: 1 A 2
if nagename=lag(pagename) then delete;
: 1 B 3
: 1 A 4
: 1 A 5
: 1 C 6
: 1 C 7
: 2 A 1
if this is C you will delete, so failed
i believe the following code would work
data yourdata;
set yourdata;
if nagename^=lag(pagename) then output;
if sessionkey^=lag(sessionkey) then output;
run;
data yourdata;
set yourdata;by sessionkey;
retain newstep 0;
newstep=newstep+1;
if first.sessionkey then newstep=1;
run;
: 2 B 2
: 2 B 3
: 3 A 1
: 3 C 2
: 3 C 3
: 因為常常在相同頁面觀看,我想將資料壓縮成
: SessionKey PageName Step NewStep
: 1 A 1 1
: 1 B 3 2
: 1 A 5 3
: 1 C 6 4
: 2 A 1 1
: 2 B 2 2
: 3 A 1 1
: 3 C 2 2
: 時序觀看相近的PageName合併成一筆資料(取最前面那一筆),再重新排次序,
: nodupkey好像不行 會把 這兩筆都刪掉,但是我只是要把相近的刪除,
: SessionKey PageName Step
: 1 A 4
: 1 A 5
: 起問各位先進有處理這樣的資料的經驗嗎
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 183.234.130.198
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1508333538.A.498.html
1F:推 loser3o0: 感謝回應您的寫法跟我類似加深我的信心感恩 10/19 22:24