作者john5601 (HTC ONE年不变)
看板R_Language
标题[问题] 汇入txt读档问题
时间Sun Sep 6 18:21:52 2015
[问题类型]:
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
[软体熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
目前是有大量的txt档需要读入跑分析,但发现一直有部份档案是读入不了的
抓出两个档案 一个读入有问题 一个没有 不知道能不能请大大们帮测试看看哪里有问题
20150101_02_passtag.txt 是正常可读入的
20150101_03_passtag.txt 是无法读入的
我都是用 read.table(file = file1,encoding="ASCII",sep="\t")
编码部分都测过没有问题
无法读入的档案 若是我把 sep="\t" 去掉 变成以下这样
http://imgur.com/kIv06Ky
正常读入的档案应该像这样
http://imgur.com/rjqeQBP
文字档连结:
https://www.dropbox.com/sh/bjud8jbnqg2gpu8/AAAxmwEeUvTkAGKEJcWNHBe7a?dl=0
[程式范例]:
简单读档的程式码
http://pastebin.com/R4b93eht
[环境叙述]:
R version 3.2.0 (2015-04-16)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 7 x64 (build 7601) Service Pack 1
[关键字]:
汇入档案 txt 分隔符号
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.117.71.217
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1441534924.A.7B9.html
1F:→ andrew43: 你把 ?read.table 里 Arguments seq 一节看一下。 09/07 01:33
2F:→ andrew43: typo... 是 sep 那一段 09/07 01:34
3F:→ andrew43: 另外,这种内容的档案,我会选用用 readLines() 09/07 01:37
5F:→ celestialgod: 你的档案里面都没有\t 建议用readLines就好 09/07 09:15
6F:→ john5601: 谢a大s大 09/07 14:09
7F:→ john5601: c大 那篇文我搜寻不到欸 09/07 14:09
8F:→ john5601: 有找到了! 09/07 14:11
9F:→ john5601: 请问如果用readlines读入 09/07 14:19
10F:→ john5601: 还是能够把整篇文章丢分析吗 09/07 14:20
11F:→ celestialgod: 读进去只是一个字串,应该可以分析吧 09/07 14:29
12F:→ john5601: 所以只是改成逐行读入 09/07 15:43
13F:→ john5601: 然後读进来的还是该txt的所有内容吗? 09/07 15:44
14F:→ celestialgod: 全部 09/07 16:28