作者pinkisme ()
看板RegExp
标题Re: [问题] 抓标签内容的问题
时间Wed Jun 11 01:51:02 2008
※ 引述《pinkisme ()》之铭言:
: 目前在抓标签内容遇到一些问题
: 比方说一个html内容某部分是下面这样
: <div>
: this is div1
: <div>
: this is div2
: </div>
: <div>
: this is div3
: </div>
: </div>
: 请问该如何写才能分别抓出div2和div3呢?
: 谢谢。
有照推文给的方式去抓,不过後来发现有点小问题,
因为网页内容有某些部分在div後面还有别的tag
比如说
<div>
1
<div>
<p>2
</div>
<div>
<p>3
</div>
4
</div>
有把推文的pattern更改去试
不过还是抓不出来orz
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.115.223.231
1F:推 CyberSnoopy:<div>([^(?:<div>)]*)</div> 06/12 10:01