作者yaowei2010 (yaowei)
看板R_Language
标题[问题] input data (非mxn)
时间Thu Oct 23 19:10:48 2014
[软体熟悉度]:
新手(没写过程式,R 是我的第一次)
[问题叙述]:
input一个一开始行数不均的csv的data
[程式范例]:
我知道这问题有点蠢
但因为这个data它有1.5 GB
Excel打开到一半就挂了 还失去後面的一部分资讯
想说用R开并整理资料
没料到这笔资料是长这样的(在Excel看到前半部分资料)
例如:
xxx
xxx
xxx xxx ←这些xxx我都不要
xxx xxx
xxx xxx
Name ID A B C D ←从这行开始以下才是我要的资料
a b c d e f
g h i j k l
.
.
.
可是因为不是mxn 标准dataframe的格式 (假设我要的资料是m x n)
R loading进去之後就整个乱掉了 变成 k x 2
也就是我资料全部变成2个column全乱掉...
但我没办法开启excel把不要的部分删掉
请问这该怎麽办QAQ
有什麽好建议 或挽救的整理方式
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.112.211.93
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/R_Language/M.1414062650.A.30C.html
1F:→ Wush978: 你如果知道前面不需要的资料的行数,可以用skip掉 10/23 20:37
2F:→ Wush978: 请使用skip这个参数 10/23 20:37
3F:推 andrew43: skip=列数 10/23 20:39
4F:→ yaowei2010: 感谢!!!! 10/23 21:03
5F:推 Edster: 你可以用 Notepad++ 或 Notepad2 打开大的csv, 修改档案. 10/24 21:55
6F:→ gsuper: read.delim("",skip=10) 这样应该可以 10/25 00:26
7F:→ gsuper: 另一种方式是用 scan("",what="character") 但这需要会写 10/25 00:27
8F:→ gsuper: 程式才能做後续处理 10/25 00:27
9F:推 kenshin528: read.table的时候 fill=TRUE看看 10/25 14:44