作者FacetheFaith (己立立人己达达人)
看板Soft_Job
标题[请益] 该怎麽分割字串才好 (赠P币)
时间Mon Dec 3 17:48:03 2018
请教一下版上大大们 (若成功解答则赠送P币200)
有一栏位可能有输入值如下情况1:
'21481705020021 9 21481705020026 10 21481705020034 11'
其'21481705020021 9', '21481705020026 10', '21481705020034 11'各为一组值
彼此以tab键分隔
该栏位也可能有输入值如下情况2:
'723L04 123L00 131KYW'
其'723L04', '123L00' '131KYW'各为一组值
彼此以空白键分隔
倘若以tab键来分割情况1的字组,则在遇到情况2的字组就行不通
反之亦然, 倘若以空白键来分割情况2的字组,则在遇到情况1的字组就行不通
想请问有没有一个通用的写法可以用在以上两种情况?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.170.193.241
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1543830485.A.F52.html
1F:推 flyfoxy: 遇到tab或空白 就切 12/03 17:50
2F:→ sowrdking: sed -e 's/^[ \t]*//' 12/03 17:51
3F:→ sowrdking: 空白跟tab可以取代成你要的字元就可以罗 12/03 17:51
4F:推 sherees: 什麽语言啊 12/03 17:52
5F:推 t64141: 看起来问题点是: 空格有时是资料内容,有时是分隔字元? 12/03 18:00
6F:→ t64141: 资料有规律吗?例如5位数的资料用空格当分隔字元,其他情 12/03 18:05
7F:→ t64141: 境用tab作为分隔字元; 如果有规律就可以先用tab切,然後判 12/03 18:05
8F:→ t64141: 断各组资料格式是否符合规则,若不符则预设将空格视为分隔 12/03 18:05
9F:→ t64141: 符号,反之亦然 12/03 18:05
10F:→ dreamnook: regexp? 12/03 18:08
11F:→ v420746k: 情况二的字元大小是20。如楼楼上大大说的先用tab切,再 12/03 18:19
12F:→ v420746k: 对每一个index检查大小是否为20,是的话就在针对这个ind 12/03 18:19
13F:→ v420746k: ex用空格切。 12/03 18:19
14F:→ t64141: 假设有规则,再配合其他大大说的regex来验证会更简洁 12/03 18:27
15F:→ MOONY135: 正则? 12/03 18:43
16F:→ pttuser2266: If find tab then .. else ... 12/03 18:53
17F:推 justben: str.split(/\s{1,}/) 12/03 18:56
18F:推 abc0922001: 正规化 12/03 19:13
19F:推 chocopie: 我会先判断分组再处理regex 12/03 19:23
20F:推 ripple0129: 不就是有tab用tab切,没tab用空白切吗,范例太少没看 12/03 19:26
21F:→ ripple0129: 到难点 12/03 19:26
22F:→ alog: 方法1 先对资料来源做归类 再根据归类後的结果用对应的处理 12/03 20:24
23F:→ alog: 方式 策略就是这样 / 方法 2 将资料的 tab 跟 space 转换成 12/03 20:24
24F:→ alog: 其中之一 再进行处理 / 方法 3 直接在 regexp 直接下条件包 12/03 20:24
25F:→ alog: 含 tab跟space做切割 只要你的程式有支援 12/03 20:24
26F:→ alog: 但我还是要说 如果你的资料极度重要且变化大 就别傻傻的直 12/03 20:25
27F:→ alog: 接用方法2跟3 12/03 20:25
28F:→ alog: 应该要先厘清完整规律 同时做时就拿资料来验证把你预期外的 12/03 20:26
29F:→ alog: 早出来 12/03 20:26
30F:→ alog: 找* 不建议直接用一个方式想要省全部 12/03 20:27
31F:→ sachung28: regex 指定数字重复次数啊 大不了分二次扫档抓字组 12/03 21:40
32F:→ qrtt1: 生资料的一方,为什麽不能好好地给一种格式就好@@? 12/03 21:43
33F:→ Murasaki0110: 看有没有tab不就分出来了? 12/03 21:44
34F:嘘 B99303079: 2 12/03 22:08
35F:推 yiefaung: 直接split依元素个数if 12/03 22:57
36F:推 giacch: [\d ]{16,}|\w{6} 12/04 01:39
37F:推 exeex: scanf %d 12/04 14:51
38F:推 gmoz: 先分类 12/04 16:16
39F:→ ron1220: 先用tab切看能不能切出东西,有切出东西=状况1;没有的 12/04 19:56
40F:→ ron1220: 话=状况2。状况1就直接捞值;状况2的话就再用空白切一次 12/04 19:56
41F:→ ron1220: 。 12/04 19:56
42F:推 Csongs: 正规表示法 处理就好了@@ 12/04 23:38
43F:推 GoGoJoe: 看white space切出几个字串,就能分出第几个case,在将字 12/07 20:40
44F:→ GoGoJoe: 串组成你要的型式! 12/07 20:40