作者blacktea12 (sss)
看板R_Language
标题[问题] R 断词问题!!
时间Mon Feb 12 18:51:23 2018
[软体熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
我有个档案要做中文文字断句,使用UTF-8 codeing读入之後一直出问题
我也看不太懂R的error状态想跟我说什麽
[档案类型] <csv档>
名称
舒爽卫生纸 12X6包
好神脱
舒爽厨房纸巾
年菜预购礼盒
...
[程式码]
df1<-read.csv(file=...)
jiebar.worker<-worker()
seg<-segment(df1$名称,jiebar.worker)
[显示的错误码]
Argument 'code' must be an string!!!!!!!!!!!!!!!!
[结论]
所以..我该怎麽办? 我把资料用toString之後会变成乱码...
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 61.219.187.60
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1518432685.A.4AA.html
1F:推 PoChieh: as.character 02/12 19:38
2F:推 eric500g: read.csv预设会把文字转成factor,可用stringsAsFactors 02/12 19:44
3F:→ eric500g: = FALSE设定成不会转 02/12 19:44