作者ToastCheng (ToastCheng哥)
看板R_Language
标题[问题] 读取csv档的小问题
时间Fri Jan 16 14:42:29 2015
[问题类型]:
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
[软体熟悉度]:
新手(没写过程式,R 是我的第一次)
[问题叙述]:
我主要是想问read.csv(或read.table)在什麽情况下会出问题,
在参数的设定上是不是只要sep有先注意是""还是","、quote有
时要设成""之外,其他都只是读取档案的偏好而不影响能不能读取成功~?
会有这个问题是因为在网路上看到交大的课程,好奇点了作业2
http://ghuang.stat.nctu.edu.tw/course/bigdata14/homework.asp
有一个csv档,我成功地用download.file(url,destfile,method="curl")
下载下来(在电脑也能直接开启)
但是用read.table或read.csv却一直出错,
但开启其他csv档却没问题(参数都用一样的)
[程式范例]:
> read.csv("/Users/Toast/Desktop/coursera R/FiveCities2.csv")
结果:
错误在make.names(col.names, unique = TRUE) :
无效的多位元组字串於 '<b6>m<c2><ed><a5><ab><b0><cf>'
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 122.118.40.10
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1421390552.A.D5C.html
1F:→ ty854697: 我试的结果是因为encoding是big5才会有这样的错误,可以 01/16 15:05
3F:→ ty854697: ata_import_and_export/import_data.html 01/16 15:06
4F:→ obarisk: "string,"string2",这种就会出问题 01/16 15:13
5F:→ ToastCheng: 感谢ty大,我成功用readline+for loop将它换成utf8重 01/17 03:11
6F:→ ToastCheng: 开了,不过好复杂阿@@,以後遇到big5编码只能这样解决 01/17 03:11
7F:→ ToastCheng: 吗 01/17 03:11
8F:→ Wush978: 可以先用命令列工具把档案转成utf8 01/17 03:58
9F:推 obarisk: read.csv(fileEncoding='big5'),不过有可能会掉字 01/17 07:37
10F:→ ToastCheng: 感谢~晚点来试试 01/17 15:17
11F:→ ToastCheng: 原来是fileEncoding...一开始一直改encoding="big5" 01/17 22:06
12F:→ obarisk: 在read.xxx的函式里,encoding是输出的编码 01/18 07:15
13F:推 autum134679: 感谢大家,我完成了~~~ 01/19 02:14