作者z101924512 (grapefruit623)
看板RegExp
标题[问题] 抓取文章段落
时间Thu Apr 12 13:50:50 2012
/*
听说注明使用的语言、环境
*
问题有可能较容易被解决...
*/
使用语言:python
<doc>
文章段落一
</doc>
<doc>
文章段落二
</doc>
如何用正规表示式针对tag「个别」取出段落一与二
像是/<doc>.*</doc>/会忽略中间的</doc> <doc> 会同时抓到段落一与二
不知道要怎样写才行,才能正确配对tag
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.121.80.138
1F:推 LPH66:.*? 这是常见问题了 关键字 greedy match 04/12 14:14
2F:→ z101924512:以解决~感谢 04/15 00:29