作者knuckles (那克斯)
看板RegExp
標題Re: [問題] 抓取的內容不符 新手發問
時間Mon Nov 21 14:18:49 2011
※ 引述《o500521 (poet)》之銘言:
: 使用php 內建的模擬perl
: 我的目標要抓 取一個網站的html
: ------------------以下是html------------------
: 不知道大大們會怎麼處理這問題謝謝各位願意閱覽的人
: 一直不太懂正規表示法的精隨
: 謝謝~大家
先學一下怎麼問問題吧
你的問題可以精簡成這樣:
------------------以下是html------------------
...</div><h1>字串1</h1><div>...</div><div class="aff">
<h3 class="label">Source</h3><p>字串2</p></div>
<div class="abstr"><h3>Abstract</h3><p>字串3</p></div>
----------------------------------------------
使用 preg_match_all("|<[/h3><p]>(.*)</[p></div>]+>|U", $P_string, $P_dd);
抓到
字串2 字串3
但想要的是
字串1 字串3
至於該怎麼做才對,因為你的問題太偷懶,害我看了半天才看懂你問什麼
所以我不想回答,看有沒有其他人想回吧
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 111.248.5.208
1F:推 o500521:謝謝你 11/21 17:56