作者empireisme (empireisme)
看板R_Language
标题[问题]字串处理和断字
时间Mon May 25 12:20:17 2020
两个问题
1.
我有断好的词汇
sample 像是
text=c(105-,
81.-.----.,
出入口,
象具,
排气管,
30.11.,
当外,
推动策略,
球根花卉,
常态化差异植生指标,
碟片,
大且,
输美量,
高雄139号)
我想要把那些纯数字 或是 数字配合乱码的index抓出来
但是不可以抓出 高雄139号这种例子
请问我该怎麽抓
简单来说保留 纯中文 或是中文加数字
2.
另外一个问题 我有一个句子 我叫做林小明来自清华统计所
想问该怎麽把这个句子里面的每个字 都存在一个向量
向量的第一个位置 = 林
第二个位置= 小
以此类推
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 211.72.221.179 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1590380419.A.07A.html
1F:→ andrew43: strsplit("asdf林小明", "")[[1]] 05/25 12:32
2F:→ empireisme: 谢谢 05/25 19:08
3F:推 andrew43: 问题1用grep抓字母与符号应该就够了 05/26 08:45
4F:推 Gjerry: 可以考虑排除纯英文的字串可能会比较容易 05/26 16:31
5F:→ Eliezer0402: 研究生写作业啊 06/07 10:33