作者HenryLin123 (HenryLin123)
看板MATLAB
标题[其他] 读取含有逗号等标点符号的CSV档
时间Mon Jun 12 23:09:55 2017
我有一个.CSV档格式如下
id tags text
0 ABC DEF ghj,dd.
1 OKG RRF dd!xx?aa, bb cd.
如果我想要把text里面的标点符号全部删掉,然後一个一个单字读取的话该呼叫何种函数?
或着我先开excel把标点符号都先去掉吗?
另外想问如果每行数量不一的话,函数要怎麽打,目前我查到用textread,但是不确定该怎麽用才对。
感谢各位了。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.112.243.32
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/MATLAB/M.1497280197.A.6C2.html
1F:推 sppmg: mat2cell(s,1,diff([0,find(s==','),numel(s)])) 06/13 03:22
2F:→ sppmg: 很无聊的试了一下,s是逗点分隔字串,输出为cell阵列 06/13 03:23
3F:→ HenryLin123: 感谢 我等等试试看 06/13 19:12
4F:推 sppmg: 类似功能的还有split, strsplit ,不过要注意一下支援的版 06/13 21:50
5F:→ sppmg: 本。find也可以改用regexp做更灵活的搜寻 06/13 21:50
6F:推 Yugaa: 楼主加油~ 06/15 00:50
7F:推 chocopie: 行数数量不一可google countlines.pl, 06/15 23:07
8F:→ chocopie: 但你的状况比较像是栏数数量不一。 06/15 23:07
9F:→ chocopie: 这我就不知道怎麽解了, 06/15 23:09
10F:→ chocopie: 一般都是想办法在ETL阶段先把资料弄整齐。 06/15 23:09