作者charleshu (Analog Engineer)
看板Perl
标题Re: [问题] 抓取完整网页(包含css、icon 小图)
时间Sun Jul 18 21:22:15 2010
※ 引述《BLUBLU (the sight of the eyes)》之铭言:
: 请问一下
: 以往我在抓网页时
: 都是用 WWW:Mechanize 及 LWP::Simple 模组
: 但都只抓下HTML的原始码
: 若我想做到,可以抓下完整的网页
: (包含css、Icon 网页上的小图示)
: 就像用浏览器 另存新档存成 (网页,完整 *.htm;*.html)
: 的方式一样(会有一资料夹存上述那些图形、css元件)
: 请问还要搭配什麽才可以做到呢 ?
: 麻烦请提示一下 感谢阿 <(_ _)>
1. Parse 网页上的 CSS 与 ICON 等所有你想抓下来的东西的Tag内容.
2. 因为你已经把它们Parse好了, 所以用它们的URL把它们download下来.
3. 若你需要修改 html档来link下载後的档案, 就修改它们的 link到local file
--
Do not depend on others without effort...
当我年轻时,请教别人问题时常听到上面那句话. 当时心里偶而会有些小小抱怨.
当时间过去,我偶而会想到上面那句话, 心中十分感谢当初告诉我那句话的人.
当发现问题时,最有价值的不是问题的答案,
而是找到解决的方向,并在努力的过程里具备解决问题的能力.
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 221.169.217.133
1F:推 BLUBLU:感谢感谢 ~~ 我试试看喔 ! 07/19 14:14