作者herculus6502 (herculus6502)
看板Perl
标题Re: [问题] 从html档抓连结
时间Sun Oct 11 20:36:27 2009
※ 引述《pancala (sam)》之铭言:
: ※ 引述《pancala (sam)》之铭言:
: : 今天要从资料夹里满满的html档中,抓pdf的连结出来
: : 可是一直没有成功
: : 想请问各位,我要改哪里啊?
: : (啊,太久没有碰perl了)
: : #!/usr/bin/perl -w
: : for $file (<*.htm>) {
: : print "$1\t$2\n" if /href\s*=\s*"(\w+\/+\w+-\w+\.pdf)">(.+)\<\/a>/i $file ;
: : }
: 自己回自己
: 原来这样就可以
: perl -ne 'print "$1\t$2\n" if
: /href\s*=\s*"(\w+\/+\w+-\w+\.pdf)">(.+)\<\/a>/i' *.htm
已经解决了的话就算了
有个lwp也不错用
你这个写法叫one-liner,在某些人的眼中满邪恶的
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 221.181.145.81