作者knuckles (那克斯)
看板RegExp
标题Re: [问题] 抓取的内容不符 新手发问
时间Mon Nov 21 14:18:49 2011
※ 引述《o500521 (poet)》之铭言:
: 使用php 内建的模拟perl
: 我的目标要抓 取一个网站的html
: ------------------以下是html------------------
: 不知道大大们会怎麽处理这问题谢谢各位愿意阅览的人
: 一直不太懂正规表示法的精随
: 谢谢~大家
先学一下怎麽问问题吧
你的问题可以精简成这样:
------------------以下是html------------------
...</div><h1>字串1</h1><div>...</div><div class="aff">
<h3 class="label">Source</h3><p>字串2</p></div>
<div class="abstr"><h3>Abstract</h3><p>字串3</p></div>
----------------------------------------------
使用 preg_match_all("|<[/h3><p]>(.*)</[p></div>]+>|U", $P_string, $P_dd);
抓到
字串2 字串3
但想要的是
字串1 字串3
至於该怎麽做才对,因为你的问题太偷懒,害我看了半天才看懂你问什麽
所以我不想回答,看有没有其他人想回吧
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 111.248.5.208
1F:推 o500521:谢谢你 11/21 17:56