作者: wanson (望生) 看板: R_Language
标题: [问题] jiebaR 针对文字档处理
时间: Sun Sep 11 04:17:05 2016
请问一下
他的教学网站中提到"./temp.dat"
可以load 档案进去
以下是他的说明
支持对文件进行分词:
cc["./temp.dat"] ### 自动判断输入文件编码模式,默认文件输出在同目录下。
## segment( "./temp.dat" , mixseg )
英文说明
You can pipe a file path to cut file.
cutter <= "./temp.dat" ### Auto encoding detection.
## OR segment( "./temp.dat" , cutter )
很奇怪的是我自己怎样尝试都无法成功
这是我自己的目录
setwd("C:/SASMACRO/data/F2+Blank")
mixseg <= "./temp.dat"
另外我如果使用read_table 去读取txt档案,如果档案内只有简单的几个字
读档可以成功
但如果档案有点大,而且一开始很多分行
就会失败
例如下列的档案 (temp.txt)
https://www.dropbox.com/s/wdwgk8t64xgrlu9/temp.txt?dl=0
怎样也都无法读进去
想请教一下版上的高手
谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.112.211.164
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1473538629.A.489.html
※ 编辑: wanson (140.112.211.164), 09/11/2016 04:29:40