有string如下,大致上就是允許「年月日」這樣的順序,
有時可以沒有年,有時可以沒有日,但若是「年-日」
就應拆分成兩個日期。
我亂try 了一下,不太寫的出來,最像樣的如下。但「4年」
竟然抓不到,所以是錯的。6年7日也沒分開。
import re
string = '1月 1日 2年 2月 2 日 3年3月 4年 5年5月 6年 7日'
match = re.findall('([\d\s]+年)*([\d\s]+月)*([\d\s]+日)*', string)
print(match)
執行結果
>>>
[('', '1月', ' 1日'), (' 2年', ' 2月', ' 2 日'),
(' 3年', '3月', ''), (' 5年', '5月', ''),
(' 6年', '', ' 7日'), ('', '', '')]
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.83.16
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Python/M.1469975924.A.007.html
※ 發信站: 批踢踢實業坊(ptt.cc)
※ 轉錄者: ggirls (114.136.83.16), 07/31/2016 23:25:29
※ 編輯: ggirls (114.136.83.16), 07/31/2016 23:36:28
2F:→ mars90226: 你用*而不是?,所以4年跟5年那個一起match了 08/01 01:38
3F:→ mars90226: ([\d\s]+年)?([\d\s]+月)?((?<!年)[\d\s]+日)? 08/01 01:45
4F:→ mars90226: 這樣應該可以 08/01 01:46
5F:→ ggirls: 謝謝。用*有點不適合。另一個要求是6年 7日應該要拆成兩組 08/01 02:25
6F:→ ggirls: 日期,有辦法做到嗎? 08/01 02:25
7F:推 mars90226: 我這個就可以拆成兩組了,你拿去試試看? 08/01 22:48
8F:→ mars90226: 就是在"日"那一組加了前面不能是"年"的條件 08/01 22:48
9F:→ ggirls: 抱歉,之前漏看了你加了這個條件。的確是可以拆成兩組了。 08/02 09:29
10F:→ ggirls: 目前在看有沒有可能不要比對出空的結果。例如 08/02 09:31
11F:→ ggirls: (' 6年', '', ''), ('', '', ''), ('', '', '7日'), 08/02 09:31
※ 編輯: ggirls (42.72.25.216), 08/02/2016 09:35:03
12F:→ ggirls: 我用 Python3.4。 08/02 09:35
※ 編輯: ggirls (42.72.25.216), 08/02/2016 11:45:55
13F:推 mars90226: 這部分應該不太行,大部分處理regex capturing都是有 08/02 16:40
14F:→ mars90226: ()就會分配一個變數給他,不管有沒有抓到 08/02 16:40
15F:→ mars90226: 當然我不太熟Python,有可能有特定method可用 08/02 16:41
16F:→ ggirls: 6年 7日 間的 ('','',''),在年月日後再加入\s*?就可以避 08/02 17:55
17F:→ ggirls: 開,只是最後還是會產生一組空的。最後還是要全部刪一遍, 08/02 17:55
18F:→ ggirls: 沒什麼意義。 08/02 17:56
19F:→ ggirls: 你的解法算全面了。現在還在看s25的解法,有點卡關,呵。 08/02 17:58