作者krist99 (只爱Calvin Klein)
看板perl
标题Re: [问题] 一段抓网页的程式
时间Thu Oct 21 10:16:10 2004
※ 引述《littleshan (我要加入剑道社!)》之铭言:
: ※ 引述《krist99 (只爱Calvin Klein)》之铭言:
: : use LWP::Simple;
: : use HTML::Parse;
: : use HTML::Element;
: : use URI::URL;
: : $html = get $ARGV[0];
: : $parsed_html = HTML::Parse::parse_html($html);
: : for (@{ $parsed_html->extract_links((“a”)) }) {
: 是"a"
: 不是“a”
: 後者是全型符号
谢谢^^~~orz
: : $link = $_->[0];
: : $url = new URI::URL $link;
: : $full_url = $url->abs($ARGV[0]);
: : print “$full_url\n”;
: : }
: : 请问为什麽没办法run??
: : perl get.pl http://neural.cs.nthu.edu.tw/jang
: : Unrecognized character \241 at get.pl line 7.
: : 不懂错误讯息的意思??不认得第七行的字元\241???
: : 另外请问要怎麽改成把网址就放在第五行??
: : 而不要执行的时候在下参数??
: : 谢谢^^
: $html = get "http://xxx.xxx.xxx/";
我知道get後面要接url
可是下面for回圈那边要怎麽改呢??
可以麻烦解释for回圈吗??看不太懂~~感激不尽~~
--
http://www.wretch.twbbs.org/album/krist ^^"
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 218.162.197.151
1F:推 littleshan:下面的for不用改吧 140.112.30.54 10/22