作者opu456 (....)
看板DataScience
标题[问题] 英文text 去除冗余字
时间Thu May 24 17:17:37 2018
大家好
我现在想做English 的text mining 找keyword
而text 中常常有一堆if, the ... 这些较没有意义的单字 目前我是自己创一个字典自己放
进去自己觉得较没意义的单字 不过感觉可能会漏掉 或是较没效率
所以想请问大家 是否有较好的建议 谢谢!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 223.137.93.240
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1527153460.A.317.html
1F:→ andy920262: NLTK stopwords 05/24 17:46
2F:推 EGsux: 推楼上 stopwords就是你要的 05/24 19:18
3F:→ opu456: 谢谢 解决了! 05/25 02:50