Browsers 板


LINE

网页剪贴簿 (WebScrapBook) 0.34.0 https://github.com/danny0838/webscrapbook 进入连结後在 Readme 下面的 Downloads: 可看到下载连结 前情提要:请在本版搜寻 ScrapBook 最近的重点更动(0.19.* → 0.34.0): * 套件名称更名为 WebScrapBook(之前是 Web ScrapBook)。 * 大幅改善介面,比如那一坨拉库的撷取选项现在可以按「?」显示详细说明; 按住 Ctrl 选取多个分页可一起撷取,手机版可直接撷取目前分页,等等。 * 大幅重构及改善程式码架构,让未来更容易扩充。 不过有个小代价是为了使用超好用的 async/await, 最低支援版本提高至 Firefox 52/Chromium 55(以前是 Fx 48/Chr 49)。 * 由於 AMO 对安全性的坚持(还等了夭寿久...), 最终放弃在内建封存网页检视器支援 JavaScript。 不过反过来说之前的方式的确也不是长久之计, 加上需要撷取 JavaScript 且撷取後能用的机会本来很微小, 暂时就先这样吧。 之後预计又会有大改版,这里做个小报告顺便徵询一些意见: WebExtension 不支援许多关键功能(比如存取档案系统), 因此若要 WebScrapBook 有像传统 ScrapBook X 那些强大的功能, 在系统安装辅助程式是必要的。 这议题摆了非常久,细节就不多说,之前的讨论可参考这里: https://github.com/danny0838/webscrapbook/issues/2 目前的规画是用 Python 写一个後端程式, 情况顺利的话以後使用 WebScrapBook 的方法大概像这样: 1. 在系统上安装 Python 3.5+ (用不用管理员权限装都可以) 2. 在系统上安装 WebScrapBook 後端程式的 Python 套件 (一般来说到命令列输入 pip install webscrapbook 就可以完成) 3. 在命令列进入想当资料库的资料夹(假设叫做 D:\scrapbook), 输入 wsb config 之类的初始化命令完成初始化, 会自动建立一个 .wsb 资料夹存放设定档和启动脚本。 4. 初始化完成後, 以後执行 D:\scrapbook\.wsb\serve.py 就会自动启动後端程式架起伺服器, 伺服器架起来就可以用浏览器存取 D:\scrapbook, 假设伺服器「网站」位址设定在 http://localhost:8080/, 就到 WebScrapBook 选项把剪贴簿位址设定为 http://localhost:8080/, 之後 WebScrapBook 撷取网页就会自动传到伺服器, 也会有按钮可直接进入後端资料库的首页, 可以用浏览器直接查看撷取资料列表,或开在侧栏。 伺服器还可以设定成开放外界存取(得先会设定防火墙及路由器就是), 以後人在外面可以用手机的 WebScrapBook 把资料直接存到电脑。 5. 後端程式还可以提供其他功能: * 完整支援 .htz/.maff 压缩格式, 进入伺服器网址浏览这些档案就和看一般网页一样。 * 基本的档案操作:增删资料夹及档案、上传档案、资料夹打包下载等。 * 和本地系统整合:可从浏览器把档案用本地程式启动,或开在档案总管里。 * 编辑功能:编辑文字档、 编辑网页(包括旧 ScrapBook X 的萤光笔、划线等都能做到)、 编辑 Markdown 笔记(储存後可直接看 HTML 输出)等等。 * 如果已经有架 Apache 或其他伺服器, 可以用 WSGI 转接到这个後端伺服器; Python 非常模组化,有心的话也可以写另一个程式调用 webscrapbook 模组。 * 後端程式本身也提供一些命令列工具,大概会包括几个功能: * 转档:比如从旧版 ScrapBook X 及 WebScrapBook 汇入资料库 * 建置全文搜寻索引 * 输出成静态网站(以便整批丢到手机上看,或架到 GitHub Page 等等) 其他目前打算做的一些改变, 可能会影响过去使用 ScrapBook X 或 WebScrapBook 的习惯, 若有什麽想法请不吝提出: * 资料结构调整:为了让资料更简洁更好组织,预计把以往 ScrapBook X 的架构: <scrapbook>/scrapbook.rdf <scrapbook>/search.html <scrapbook>/data/<资料档> <scrapbook>/tree/<索引档> 或 WebScrapBook 索引器的架构: <scrapbook>/data/<资料档> <scrapbook>/tree/<索引档> 改成像这样: <scrapbook>/.wsb/<设定档> <scrapbook>/.wsb/server/<伺服器快取档等等> <scrapbook>/.wsb/tree/<索引档> <scrapbook>/<资料档> 简而言之就是以後 webscrapbook 後端程式产生的都统一丢在 .wsb 资料夹里。 * 拿掉目前的索引器: WebExtension 套件的功能毕竟很难像 Python 程式那样完整, 要维护两套也很麻烦,乾脆拿掉。 会冲击到的主要是想要索引功能又不想安装後端程式的人, 以及手机版(虽然手机版的索引功能本来就很难用), 不晓得有没有版友是这种人?XD * 拿掉储存成单一 HTML 页面的功能: WebScrapBook 原始目的是网页的长久保真封存, 单一 HTML 页面虽然方便, 但有很多地方会失真或失效、档案会变肥、也不容易用其他程式转档, 不是长久封存的理想选择。 之後後端程式应该会加入转存成单一 HTML 页面的功能, (技术上以往 ScrapBook X Converter 能做的所有事後端程式都能做到, 只是要时间写,而且可能是从命令列执行,介面没那麽友善) 想把撷取的资料再另存成单一 HTML 网页分享给别人还是可以, 只是就不再提供直接从浏览器套件储存成单一网页的选项。 -- 《终结内容农场》浏览器套件 Chrome: http://bit.ly/CFTGC (桌机 & Android 手机) Firefox: http://bit.ly/CFTFx 真相1: http://bit.ly/CFTss1 真相2: http://bit.ly/CFTss2 详细介绍:http://bit.ly/CFTinfo --
QR Code



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.243.226.152
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Browsers/M.1551372978.A.492.html ※ 编辑: danny0838 (111.243.226.152), 03/01/2019 01:10:27
1F:推 DCG: 如果只是单纯撷取网页(部份或整页)为 HTZ, 03/01 09:10
2F:→ DCG: 以後改版也要安装後端程式才能用吗? 03/01 09:11
3F:→ danny0838: 封存页面检视器会保留 03/01 10:24
4F:推 sate5232: 如果管理功能能有以往般强大,要安装後端也没问题 03/08 21:52
5F:推 DCG: 试了一下,新版的 reddit 好像无法正常储存,例如: 03/11 20:09
6F:→ DCG: https://pse.is/FHGU9 03/11 20:09
7F:→ DCG: 看到的是这样:https://i.imgur.com/gSr36rQ.png 03/11 20:11
8F:→ DCG: 整页储存变成这样:https://i.imgur.com/sgBKYqD.jpg 03/11 20:11
9F:推 DCG: 试着把脚本或其他元素选储存也一样,无法正常显示 03/11 20:18
10F:推 DCG: 改储成 HTML,也一样无法正常显示 03/11 20:25
Reddit.com 的问题是样式无法顺利撷取, 这牵涉到一些复杂的问题, 以後有空才能做完整的处理。 暂时的解决方案是用撷取原貌, 就能让样式正常呈现。 ※ 编辑: danny0838 (111.243.221.189), 03/12/2019 22:15:50
11F:推 aiwheat: 储存页面时,会另外跳出的一个视窗处理,然後又跳出一个 03/13 19:58
12F:→ aiwheat: 视窗,让人选择下再到自己电脑里,这两个部份可以不要显 03/13 19:59
13F:→ aiwheat: 示出来吗?另外储存所有分页时,可以让人选择要哪些分页? 03/13 20:00
撷取页面跳出的视窗大概不会改, 因为目前 WebExtension 架构没办法弄一个彼此独立能随时在出状况时显示讯息 、且使用者能随时喊卡中止的 Worker,开新视窗已经是目前能想到的最佳方案。 至於撷取完成後跳出选择储存位置的视窗, 撷取选项「储存撷取资料至:」不要设定成「独立档案」就不会有了。 (这部分之後可能会变,细节参见 http://bit.ly/2HAZFBh※ 编辑: danny0838 (111.243.217.246), 03/15/2019 01:04:09







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:BabyMother站内搜寻

TOP