作者DarkKiller (System hacked)
看板PHP
标题Re: [请益] 正规化表示法撷取html
时间Wed Nov 23 16:51:52 2011
※ 引述《o500521 (poet)》之铭言:
: ------------------以下是html------------------
: ...</div><h1>字串1</h1><div>...</div><div class="aff">
: <h3 class="label">Source</h3><p>字串2</p></div>
: <div class="abstr"><h3>Abstract</h3><p>字串3</p></div>
: ----------------------------------------------
: 使用preg_match_all("|<[</h1><p>]>(.*)[</p></div>]+>|U", $P_string, $P_dd) ;
: 抓到
: 字串2 字串3
: 但想要的是
: 字串1 字串3
: 研究一下 发现我还是没办法解决正规化表示法的问题
: 谢谢大家耐心的阅览...
要不要用其他工具?
如果是 parsing HTML,可以用 DOMDocument:
$htmlDom = new DOCDocument();
$htmlDom->loadHTML($HtmlString);
$h1 = $htmlDom->getElementsByTagName('h1')->item(0);
$p = $htmlDom->getElementsByTagName('p')->item(0);
echo $h1->nodeValue;
echo $p->nodeValue;
==
不是很确定能不能动,凭印象与 manual 打出来的...
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 210.242.135.97