作者engfen (Christoph)
看板R_Language
標題[問題] 請教如何將下列的資料塞入上一列?
時間Tue Dec 11 14:02:08 2018
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
新手
[問題敘述]:
我有近3萬筆資料要分析,我拿到原始數據是純文字檔,
這個純文字檔,用固定行距來區隔資料,
但如果處置代碼過長,會自動換行到下一行
如下圖所示(圖例是已用excel先切開欄位)
https://i.imgur.com/XRn6MwQ.jpg
請問 我如何撰寫程式,將自動換行的處置代碼,
加回至上一行的處置代碼末端
並同時刪除自動換行的那一行資料?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.217.186.78
※ 文章網址: https://webptt.com/m.aspx?n=bbs/R_Language/M.1544508130.A.1DC.html
1F:→ obarisk: 有換行符號?完全固定長度?完全固定長度就直接用長度吃 12/11 15:40
2F:→ engfen: 沒有換行符號 12/11 16:33
3F:→ engfen: 如何吃? 主要要前面欄位都空白,所以是計算空白數後,回 12/11 16:36
4F:→ engfen: 加回去嗎? 12/11 16:36
5F:→ andrew43: 先把一小部份的純文字資料貼上來看看,敏感資料蓋掉。 12/11 16:48
6F:→ andrew43: 可以貼在pastebin.com 12/11 16:49
已經照你意思貼了
https://pastebin.com/gEz0cnbc
基本上是很零亂的資料,過去都用SPSS和excel來處理資料,不過用R來清資料很困難
7F:推 Edster: 有點看不懂, 把原本的樣子跟希望的樣子都分別傳上試試. 12/11 22:54
8F:→ locka: o大意思應該是問處置代碼那欄是不是長度超過63個字元就換行 12/12 07:49
9F:→ locka: (001到VAL共63個字元)原PO可以觀察看看換行有沒有規則 12/12 07:52
10F:→ locka: 每63個字元或是每8個逗號就換行...之類的,找到類似規則後 12/12 07:55
11F:→ locka: 再加入判斷式處理 12/12 07:55
格式長這樣
https://i.imgur.com/DpSCMqZ.jpg
※ 編輯: engfen (180.217.168.168), 12/14/2018 10:57:12
※ 編輯: engfen (180.217.168.168), 12/14/2018 10:58:09
13F:→ andrew43: 不過之後你若要處理原始完整文字檔還有很多工作要做。 12/14 11:44
14F:→ engfen: 謝謝我試試看 12/14 17:12