作者disney82231 (小刀会序曲)
看板R_Language
标题[问题] 读取CSV档英文部分乱码
时间Wed Apr 4 20:26:12 2018
[问题类型]:
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
[软体熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
读取CSV档时,总共只有两行,第一行原名称是HUMERUS,第二行是CODE
但读进去第一行名称变成UMERUS,H变成中文乱码,第二行正常。
想请问为甚麽会这样呢?
CSV档是xls档转成的,会是因为这个原因吗?
如果是该怎麽办,第一次遇到英文乱码变成中文的..
谢谢
[程式范例]:
test<-read.table("CASE.csv",sep=",",header = T,encoding="big5")
test<-read.table("CASE.csv",sep=",",header = T,encoding="UTF-8")
test<-read.table("CASE.csv",sep=",",header = T)
以上三个都试过了..
[关键字]:
读档 英文 乱码 CSV
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.226.45.84
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1522844775.A.30A.html
1F:→ celestialgod: 用notepad++去看编码吧 04/04 20:32
2F:→ celestialgod: 另外还可以用显示所有字元去看是否有其他字元 04/04 20:32
编码是UTF8 BOM档首,字元全都是CRLF
read.csv("CASE.csv",header=T,sep=",",fileEncoding = "UTF-8-BOM")
改成这样就可以了!!!感谢大大
3F:→ eric500g: csv档打开是乱码吗? 04/04 20:41
不是耶 打开是正常的没有乱码
※ 编辑: disney82231 (36.226.45.84), 04/04/2018 21:53:24
※ 编辑: disney82231 (36.226.45.84), 04/04/2018 21:56:47
4F:推 andrew43: 所以应该又是BOM害的。 04/04 22:00
5F:→ obarisk: 真想拿有bom的档案来试试,R不是implictly把BOM干掉了 04/04 22:31