作者kornelius (c9s)
看板RegExp
标题Re: [问题] preg_match_all抓取所有<div>....</div>
时间Sat Jul 25 21:25:45 2009
请用 Perl 的 Web::Scraper 模组 :p
http://search.cpan.org/dist/Web-Scraper/lib/Web/Scraper.pm
就可以做到 tree structure 的 parsing
只需要给定 css selector 即可
当然也有 xpath 做 selector 的後端。
※ 引述《X700 (X700)》之铭言:
: ※ 引述《grassboy2 (活力花俏草儿仔政﹞O花俏)》之铭言:
: 我也有问题和这位仁兄相似,但是我想做的就是巢状时要如何正确抓资料呢?
: 如下的例子:
: <div class="test">
: <div>我是大巢
: <div>我是小巢</div>
: </div>
: </div>
: 希望可以抓到div class="test"内的资料:
: <div>我是大巢
: <div>我是小巢</div>
: </div>
--
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 113.61.194.203
※ 编辑: kornelius 来自: 113.61.194.203 (07/25 21:26)
1F:推 othree:Perl真是什麽都有XD 07/27 16:07
2F:推 lg31cm:不过事实上perl的regex用法最为变态XDDDD 07/28 00:47
3F:推 arrack:perl包山包海 07/30 19:52
4F:→ MOONRAKER:It's PERL that rocks the world 08/11 17:59