作者ppcat (忙碌)
看板RegExp
标题[问题] 多层 html tag 的比对问题
时间Wed Dec 10 00:24:28 2008
请问各位前辈
假如网页中出现的 pattern 如下:
<div>中文
<div id="iWantThisDiv">内容
<div>其他内容
</div></div>无关紧要
</div>
主要就是有多层的 tag 出现
可是想要抓到 <div id="iWantThisDiv"> 里面的全部内容
目前写成 <div id="iWantThisDiv">([\s\S]+)</div>
会抓出 "内容<div>其他内容</div></div>无关紧要"
还是不太对 冏>
不知道有没有更好的解法
先感谢各位哩 m(_ _)m
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 122.121.200.95
1F:→ supertitler:tag内不要再有tag 12/10 02:33
2F:→ ppcat:html 不是我写的阿 冏> 我只是要爬内容~"~ 12/10 10:31
3F:→ supertitler:..........又看错了,请忽略我(泣) 12/10 11:12
4F:→ giacch:<div id="iWantThisDiv">([^<]+)</div> 12/10 11:25
5F:→ bigair:楼上的抓法没办法符合原PO要求 ~_~ 12/10 11:49
6F:推 SKL:/<div id="iWantThisDiv">((<.+?>.*?<\/.+?>|.)*?)<\/div>/s 12/13 05:26
7F:推 cutecpu:推楼上,超强! 12/15 08:11
8F:→ ppcat:感谢各位哩~~ 12/15 19:20