作者sinkome (涛哥)
看板R_Language
标题[问题] R程式 文字处理(同义字转换)
时间Sun Oct 19 12:19:23 2014
[问题类型]:
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
[软体熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
目前我有一份文字档在Corpus中
> inspect(new_data)
<<VCorpus (documents: 1, metadata (corpus/indexed): 0/0)>>
[[1]]
<<PlainTextDocument (metadata: 7)>>
still call happening
since first downloaded ios 8 now
(上面文件内容是经过stripWhitespace、removePunctuation等步骤而已)
然後我想自己定义一个
出现(happening,issue,occurence)归类为 happen
出现(ios 8,ios 802, ios 8.0.2)归类为 ios8
因此当
happening 会转换成 happen
ios 8 (中间含有空白) 会转换成 ios8
我试过wordnet package Synonyms,
但是我只会查询同义字,不会抓出来转换,
而且我比较倾向自己定义同义字。
想很久都不知道该如何写?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.224.46.112
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/R_Language/M.1413692365.A.31D.html
※ 编辑: sinkome (36.224.46.112), 10/19/2014 12:20:02