作者piercelin (pierce)
看板R_Language
标题[问题] NLP英文文章处理
时间Sat Mar 10 22:38:43 2018
[问题叙述]:
大家好,最近在练习用R跑NLP,目前处理英文文章,在断词方面我想使用自己的
词库进行断词,例如文章中"My name is Pierce",正常断词会断在空格处变成"My" "name"
"is" "Pierce",但我想使用自己的词库让断词变成:"My name" "is" "Pierce"。
目前Google关键字name entity recognition已经搜寻过,试过openNLP package,
但都没有办法达到我想要的效果(使用自己的词库进行断词),请问其他有经验的大大有
什麽解决的办法吗?
[环境叙述]:
R version 3.4.2 (2017-09-28)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows >= 8 x64 (build 9200)
[关键字]:
NLP、断词、name entity recognition
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.173.18.45
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1520692726.A.69A.html