有string如下,大致上就是允许「年月日」这样的顺序,
有时可以没有年,有时可以没有日,但若是「年-日」
就应拆分成两个日期。
我乱try 了一下,不太写的出来,最像样的如下。但「4年」
竟然抓不到,所以是错的。6年7日也没分开。
import re
string = '1月 1日 2年 2月 2 日 3年3月 4年 5年5月 6年 7日'
match = re.findall('([\d\s]+年)*([\d\s]+月)*([\d\s]+日)*', string)
print(match)
执行结果
>>>
[('', '1月', ' 1日'), (' 2年', ' 2月', ' 2 日'),
(' 3年', '3月', ''), (' 5年', '5月', ''),
(' 6年', '', ' 7日'), ('', '', '')]
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.136.83.16
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1469975924.A.007.html
※ 发信站: 批踢踢实业坊(ptt.cc)
※ 转录者: ggirls (114.136.83.16), 07/31/2016 23:25:29
※ 编辑: ggirls (114.136.83.16), 07/31/2016 23:36:28
2F:→ mars90226: 你用*而不是?,所以4年跟5年那个一起match了 08/01 01:38
3F:→ mars90226: ([\d\s]+年)?([\d\s]+月)?((?<!年)[\d\s]+日)? 08/01 01:45
4F:→ mars90226: 这样应该可以 08/01 01:46
5F:→ ggirls: 谢谢。用*有点不适合。另一个要求是6年 7日应该要拆成两组 08/01 02:25
6F:→ ggirls: 日期,有办法做到吗? 08/01 02:25
7F:推 mars90226: 我这个就可以拆成两组了,你拿去试试看? 08/01 22:48
8F:→ mars90226: 就是在"日"那一组加了前面不能是"年"的条件 08/01 22:48
9F:→ ggirls: 抱歉,之前漏看了你加了这个条件。的确是可以拆成两组了。 08/02 09:29
10F:→ ggirls: 目前在看有没有可能不要比对出空的结果。例如 08/02 09:31
11F:→ ggirls: (' 6年', '', ''), ('', '', ''), ('', '', '7日'), 08/02 09:31
※ 编辑: ggirls (42.72.25.216), 08/02/2016 09:35:03
12F:→ ggirls: 我用 Python3.4。 08/02 09:35
※ 编辑: ggirls (42.72.25.216), 08/02/2016 11:45:55
13F:推 mars90226: 这部分应该不太行,大部分处理regex capturing都是有 08/02 16:40
14F:→ mars90226: ()就会分配一个变数给他,不管有没有抓到 08/02 16:40
15F:→ mars90226: 当然我不太熟Python,有可能有特定method可用 08/02 16:41
16F:→ ggirls: 6年 7日 间的 ('','',''),在年月日後再加入\s*?就可以避 08/02 17:55
17F:→ ggirls: 开,只是最後还是会产生一组空的。最後还是要全部删一遍, 08/02 17:55
18F:→ ggirls: 没什麽意义。 08/02 17:56
19F:→ ggirls: 你的解法算全面了。现在还在看s25的解法,有点卡关,呵。 08/02 17:58