作者jeremy007 (linux蓝海帝国)
看板Linux
标题Re: 如何保留网页的内容
时间Sat Jul 12 14:58:14 2008
※ 引述《jeremy007 (linux蓝海帝国)》之铭言:
: 大家好
: linux console mode 底下有什麽方式可以保存网页的内容呢 ?
:
: ex: www.foo.bar/page.htm
: 假设此网页每天更新内容
: 我要如何抓取此网页的所有内容 (类似 IE 的 .mht 封存)
:
: 我要如何将 page.htm 的内容 (包含图片) 存在一个资料夹里面 ?
: 谢谢 !!
:
: --
:
※ 发信站: 批踢踢实业坊(ptt.cc)
: ◆ From: 61.216.176.123
推 kedy:档名都固定的话..就把他照日期tar 起来吧XD 07/12 14:12
我把需求换个方式说明;
page.htm 的内容为 一些文字说明, 一张图片 以及一个超连结
我要把资料抓下来, 好让我离线浏览
$ wget www.foo.bar/page.htm
这样我会得到一个 page.htm 的单一档案,
离线开启时可以看到文字说明,
但是图片是无法浏览的 (因为我没有将图片抓下来)
我的问题是我要如何将
网页上的文字说明以及单一层的 jpg 图片抓下来呢 ?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.216.176.123