作者celestialgod (天)
看板R_Language
标题Re: [问题] 如何读入多个CSV档
时间Thu Jan 14 17:37:42 2016
※ 引述《clansoda (小笨)》之铭言:
: 最近在Coursera上面自己学习R语言,可是碍於过去没写过程式也没人能讨论
: 因此问的问题很浅显希望大家见谅
欢迎常来讨论^^
: 我现在遇到一个老师给的习题,要我们读入332个CSV档案来写出算平均数的
: Function,我目前是用list.file这个函数先将所有CSV档案弄成一个list
: 那应该就会有一个list有332个vector,我想用for函数读CSV档
: 我写成for (i in 1:length(kk)) {read.csv("D:/kk[[i]].csv")->item}
" " 里面一定是字串,你里面放变数,他也不会跑出来
要那样做只能:
eval(parse(text = paste0("D:/", kk[[i]])))
但是我并不推荐用eval的作法 我在MATLAB板每次都会强调eval is evil!
所以下面示范一个比较好的方式做处理
: KK是list的名称 这样如果i为一她应该会读list的第一项叫做001.csv的档案
: 这是我自己的想法,可是拿去跑之後会显示 Error in file(file, "rt") : cannot open the connection In addition: Warning
: message:
: In file(file, "rt") :
: cannot open file 'specdata/kktix[[i]]': No such file or directory
: 不知道版上有没有大大可以纠正我的写法跟观念。
: [软体熟悉度]:
: 请把以下不需要的部份删除
: 新手(没写过程式,R 是我的第一次)
csv_files <- list.files()[grepl('\\.csv', list.files())] # 抓出.csv结尾的档案
csv_tables <- vector('list', length(csv_files))
for (i in seq_along(csv_files))
csv_tables[[i]] <- read.csv(csv_files[[i]])
如果你的档案不是在工作目录可以这样改:
files <- list.files('path/to/csv', full.names = TRUE)
csv_files <- files[grepl('\\.csv', files)]
--
R资料整理套件系列文:
magrittr #1LhSWhpH (R_Language) http://tinyurl.com/1LhSWhpH
data.table #1LhW7Tvj (R_Language) http://tinyurl.com/1LhW7Tvj
dplyr(上) #1LhpJCfB (R_Language) http://tinyurl.com/1LhpJCfB
dplyr(下) #1Lhw8b-s (R_Language)
tidyr #1Liqls1R (R_Language) http://tinyurl.com/1Liqls1R
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.109.74.87
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1452764266.A.A7D.html
1F:推 clansoda: 想请问list不是比vector还算大一阶吗 为什麽mode可以是 01/14 18:46
2F:→ clansoda: list 这样的用意又在哪里呢? 01/14 18:46
list跟vector应该没有什麽阶层关系
vector是同类型资料的集合,list是不同类型资料的集合
要讲的话,list包含vector比较合理,我记得没错的话list是vector of pointers
每一个pointer指向一个object
vector是函数,我只是利用这个函数create一个有n个elements的list
mode可以设为list是manual写的,我也不会解释(摊手
3F:推 clansoda: 感谢大大 我还有好几个问题 01/14 19:15
4F:→ obarisk: 其实不用eval啊,用paste0补路径也可以 01/14 19:15
所以我下面有说eval不好,让他往下看XD
5F:→ clansoda: 第一行 虽然我没学过grepl但是自己摸几次大概也看得懂在 01/14 19:15
6F:→ clansoda: 在写什麽 01/14 19:15
7F:→ clansoda: 我写到for (i in seq(csv_files) 那边 我有加1: 01/14 19:16
seq跟seq_along是不同的东西,seq是创造数列,所以通常要起点跟终点
seq_along是沿着物件走,所以如果x是长度n,seq_along(x) 就是1~n的整数
8F:→ clansoda: 但是这个写法是错的 请问in seq_along就已经是代表1到 01/14 19:16
9F:→ clansoda: 该list的长度了吗 01/14 19:17
10F:→ clansoda: 现在遇到的问题是print出来的结果确实是所有的CSV档集合 01/14 19:17
11F:→ obarisk: 代表把变数直接放到i 01/14 19:17
12F:→ clansoda: 但是我想要合并成一个dataframe不知道该如何下手 01/14 19:17
13F:→ clansoda: 直接rbind好像不是正确的解 01/14 19:18
do.call(rbind, csv_files)
14F:→ obarisk: 我回错@@ 01/14 19:18
没事XD
※ 编辑: celestialgod (140.109.74.87), 01/14/2016 19:27:44
15F:→ clickhere: is.vector(list()); is.list(vector()) 01/15 09:25
16F:→ clickhere: list是vector. 反之则否. 01/15 09:27