作者ppcat (忙碌)
看板RegExp
標題[問題] 多層 html tag 的比對問題
時間Wed Dec 10 00:24:28 2008
請問各位前輩
假如網頁中出現的 pattern 如下:
<div>中文
<div id="iWantThisDiv">內容
<div>其他內容
</div></div>無關緊要
</div>
主要就是有多層的 tag 出現
可是想要抓到 <div id="iWantThisDiv"> 裡面的全部內容
目前寫成 <div id="iWantThisDiv">([\s\S]+)</div>
會抓出 "內容<div>其他內容</div></div>無關緊要"
還是不太對 冏>
不知道有沒有更好的解法
先感謝各位哩 m(_ _)m
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 122.121.200.95
1F:→ supertitler:tag內不要再有tag 12/10 02:33
2F:→ ppcat:html 不是我寫的阿 冏> 我只是要爬內容~"~ 12/10 10:31
3F:→ supertitler:..........又看錯了,請忽略我(泣) 12/10 11:12
4F:→ giacch:<div id="iWantThisDiv">([^<]+)</div> 12/10 11:25
5F:→ bigair:樓上的抓法沒辦法符合原PO要求 ~_~ 12/10 11:49
6F:推 SKL:/<div id="iWantThisDiv">((<.+?>.*?<\/.+?>|.)*?)<\/div>/s 12/13 05:26
7F:推 cutecpu:推樓上,超強! 12/15 08:11
8F:→ ppcat:感謝各位哩~~ 12/15 19:20