作者danny0838 (道可道非常道)
看板Browsers
标题[-GC-][-Fx-] 网路剪贴簿 + 封存网页检视器
时间Wed Jul 12 23:45:52 2017
网路剪贴簿 (Web ScrapBook) 0.7.0
https://github.com/danny0838/webscrapbook
进入连结後在最下面 See also: 可看到下载连结
传统套件
ScrapBook X 的 WebExtension 重制版,
支援 Chromium 系列浏览器(Chrome, Opera, Vivadi, ...)
以及 Firefox PC 版(Android 尚待官方提供新 API)。
功能是高度保真的撷取网页,支援多种撷取设定,支援四大类储存方式:
1. 一般下载:将网页及参照的资源下载到同一资料夹
(Chrome 建议关闭「下载每个档案前先询问储存位置」,否则会一直跳视窗)
2. htz:把网页及参照的资源用 zip 压缩成一个 htz 档案
3. maff:类似 htz,可以把一或多个网页压成一个 maff 档案(目前只实做单一网页)
4. 单一 html:使用 data URI 技术把参照资源储存到单一网页里,
较新的浏览器理论上都能正常开启,但较占空间且档案大时效能差或无法开启。
htz 和 maff 用支援 zip 的软体解压缩即可用浏览器开启,
或者安装以下套件用浏览器检视。
封存网页检视器 (Web Archive Viewer) 0.4.0
https://github.com/danny0838/webarchiveviewer
进入连结後在最下面 See also: 可看到下载连结
安装後可以用浏览器检视 .htz 及 .maff 格式的网页封存档案。
支援 Chromium 系列浏览器(Chrome, Opera, Vivadi, ...)
以及 Firefox PC 和 Android 版。
Chromium 可直接用浏览器开启检视此类档案。
Firefox 因为官方限制无法支援,但可以点击工具列图示进入检视页面,
再选择封存档案开启。
未来有空会考虑支援 .epub, .mht, .chm 等网页封存格式。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.243.231.103
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Browsers/M.1499874355.A.E94.html
※ 编辑: danny0838 (111.243.231.103), 07/12/2017 23:47:34
1F:推 kaoh08: 封存成档案太赞啦 07/13 08:05
2F:推 abram: 疑 没有人想做封存为pdf档的吗 07/13 15:27
封存是指保存原来的格式和功能,
所以全萤幕撷图、复制到 word、存成 PDF 之类都不叫封存。
而且许多 PDF 软体会支援虚拟印表机,
基本上用虚拟印表机列印就能输出 PDF 了。
※ 编辑: danny0838 (111.243.231.103), 07/13/2017 21:21:59
3F:推 kaoh08: 支援mht的程式不多啊 想当初我也爱把网页存成mht 07/15 04:33
4F:→ kaoh08: 毕竟抓原网页档实在太零散了 07/15 04:34
我个人不是很推 mht,原因有几:
1. 虽然是 RFC 标准,但支援的浏览器不多,且每个浏览器实作都不太一样,
A 浏览器存的 mht 到 B 浏览器常有格式跑位。
2. 内容方面,纯文字储存成编码过的格式,二进位档案则储存成 base64,
导致体积大幅增胖。
3. 由於 2,除非使用少数专门软体,mht 档很难还原成原始的网页内容及附件,
而不容易修改内容或做其他应用。
不过如果技术可行,有时间还是会考虑实作。
※ 编辑: danny0838 (111.243.212.114), 07/15/2017 21:32:05
5F:推 kaoh08: 能单档封存的选项只有IE的mht了 那是个我还在用IE的年代啊 07/16 00:11