作者danny0838 (道可道非常道)
看板Browsers
标题[-Fx-][-GC-] 网页剪贴簿 (WebScrapBook) 0.80
时间Mon Oct 12 23:36:30 2020
网页剪贴簿 (WebScrapBook) 0.80
https://github.com/danny0838/webscrapbook
这是传统 Firefox 附加元件 ScrapBook X 的後继版本,
主要功能是忠实
撷取网页及
管理、加注、编辑、全文搜寻。
跨平台支援 Fx > 57 、Chromium 系浏览器,
及以二者为核心的行动版浏览器,如:
- Firefox for Android
(79 版架构更新无法支援,官方说以後再研究,暂时只能降版)
- Kiwi browser
- Yandex browser
与 ScrapBook X 对照新功能可参见:
https://bit.ly/39JD1B5
前情提要:
https://bit.ly/2SK2NiE
继上次在本版报告後主要更新如下(0.65.0 → 0.80.1):
*
行内注解和
自由注解功能都做好了。
* 後端伺服器加入
全文索引器、资料检测器及汇入、汇出、转档工具。
全文索引效能有感提升,尤其是大部分页面未更动不须重扫的情况
(实测某大本剪贴簿,旧版更新索引约 60~80 秒,新版 3~8 秒)
现在在撷取或编辑页面後会自动更新该页面的全文索引,几乎不用再
每隔一段时间就人工更新索引了。
资料检测器可以很快扫出目前资料有哪些问题,并附有自动修正功能,
(修正时会自动建立差异备份)
汇入、汇出就是方便把资料转到不同的剪贴簿。目前只实做了命令列
工具(由於 WebExtension 禁止存取本机档案,无法直接指定以任意
目录用於汇入汇出,目前还没想到怎麽在浏览器套件端实做,还待大
家集思广义orz)
转档工具目前支援传统 ScrapBook X 和 WebScrapBook 剪贴簿格式
互转(鼓励跳槽意味XD),未来计画支援更多格式,至於具体要支援
什麽,以下开放许愿...
虽然这两项看起来不多,但做起来累死人了QQ
应该差不多可以出 1.0 版惹(?)
--
《终结内容农场》浏览器套件
Chrome:
http://bit.ly/CFTGC
Firefox:
http://bit.ly/CFTFx (桌机 & Android 手机)
真相1:
http://bit.ly/CFTss1
真相2:
http://bit.ly/CFTss2
详细介绍:
http://bit.ly/CFTinfo
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.164.23.235 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Browsers/M.1602517002.A.15B.html
※ 编辑: danny0838 (1.164.23.235 台湾), 10/12/2020 23:39:20
1F:推 sdbb: 好用推10/13 01:38
2F:推 lecheck: 已收藏 感谢10/13 07:51
3F:推 hsparrot: 好用的神器,原本懒得装server所以一直用waterfox+旧版10/14 11:31
4F:→ hsparrot: ,某天闲闲装了server後马上跳槽不回头10/14 11:31
感谢支持。
有点好奇你是看上了新版的哪几点功能才跳槽,有没有空说一说?
之後生文案的时候或许可以多强调一下XD
我也觉得要装server真的很麻烦,但是webextension架构如此,不得不屈服QQ
5F:推 DCG: 请问,如果把新版xpi里面的JSZip,替换成旧版(0.52.1)里的10/14 12:44
6F:→ DCG: JSZip(打开压缩档覆盖过去),是否就不用清理记忆体缓冲区10/14 12:47
7F:→ DCG: ,恢复以前的储存速度?10/14 12:48
理论上是吧,但是改内容会导致套件签章无效而无法安装,要再想办法处理。
如果在意这样的速度差异,就只好折腾一下罗XD
另外,我个人没观察到太明显的效能差异,或许这和硬体效能也有关系,
如果电脑方便升级的话也许升一升就能解决一切XD
※ 编辑: danny0838 (1.164.23.235 台湾), 10/14/2020 16:42:35
8F:推 MK47: 会有同步到Android的功能吗?10/14 20:58
你想同步什麽?
如果是指套件的选项设定,都是由浏览器的同步功能决定的,
目前看起来Firefox是不会把电脑版的套件设定和手机版的同步,
Chrome手机版根本不能装套件,不必问这个XD
如果浏览器不提供选项同步,又有转移选项的需求,
可以汇出选项,把汇出档放到手机,再汇入手机版的套件即可。
如果是指撷取的资料,别说手机了,连电脑同步到电脑都没有XD
不过如果是架後端伺服器使用,那一般来说不用特别同步,
不管几台电脑手机都连进同一个後端伺服器就可以了。
※ 编辑: danny0838 (1.164.23.235 台湾), 10/15/2020 00:54:34
9F:推 Altair: 推推10/16 10:45
10F:→ MK47: 我是想问抓的资料 看来好像不行10/16 14:25
WebScrapBook 本身不提供,
不过如果只是想同步静态资料档,
有个方法是 ScrapBook 目录和云端同步(比如 Dropbox),
Android 上用 FolderSync 之类的工具把 Dropbox 的东西同步到手机上。
不过现在很多手机浏览器都不能直接浏览本地的网页档了,
(可以浏览但是会进入沙盒模式,图片、超连结等都没有)
可能还要装个 Android 上的本地伺服器才能用。
※ 编辑: danny0838 (1.164.31.63 台湾), 10/16/2020 14:53:58
11F:推 hsparrot: 我跳槽的理由,除了-能在新浏览器上使用-这个必然的优点10/16 21:33
12F:→ hsparrot: ,另外就是「撷取助手」,像我常上特定网站去抓小说下来10/16 21:33
13F:→ hsparrot: 转ePub,能预先处理掉部分版面格式问题还蛮方便的10/16 21:33
14F:推 hsparrot: 话说能许愿强化「撷取助手」吗? 像是能覆写「撷取」选10/16 21:36
15F:→ hsparrot: 项里的设定;还有撷取完後执行自订本地端命令(酱我就能10/16 21:36
16F:→ hsparrot: 自动化执行脚本程式来玩弄抓下来的档案啦)10/16 21:36
这答案我还满意外的,本来想说撷取助手这玩意一堆落落长的叙述应该不会
有人认真看待吧XD
覆写撷取选项可以做到,但有一些限制,主要是有些选项在执行撷取助手之
前就做过处理,之後又会再做一些处理,一旦覆写可能会导致不一致。
0.82.0 版先加了覆写撷取选项及一些除错强化,毕竟目前最大的缺陷之一
是很难除错,导致要写出可用的助手极其困难。
其实理想上最好是能直接跑 JavaScript,但是浏览器套件一堆安全性限制,
目前还找不到方法,所以才做成这副德性,这样做其实很多基本功能其实是
难以提供的,比如一些简单的数学和字串运算...
至於撷取完执行本地命令可能很困难,首先,浏览器套件本身有安全限制,
不可能直接执行本地脚本,至於透过後端伺服器去跑伺服器上的脚本,理论
上可以做到,但会有很多安全疑虑要处理。
有能力写脚本的话,我建议可以考虑直接扩充或 import PyWebScrapBook
去捞特定范围的网页(网址、撷取时间等等)处理,处理後可以加上某个
item metadata 或在网页里加上某个自订属性值避免重复处理,这可能比等
我写出这功能更实际也更灵活一些。
※ 编辑: danny0838 (1.164.31.63 台湾), 10/17/2020 21:49:19
17F:推 wumins: 好厉害,期待新版本功能愈来愈完善10/19 04:15
18F:推 hsparrot: python只啃过一点还好几年没摸都忘光光了XD,其实自己手 10/20 12:20
19F:→ hsparrot: 动执行脚本处理本地档也过得去,毕竟不是天天没事拿着10/20 12:20
20F:→ hsparrot: WSB到处去砍站那种大用量10/20 12:20
那你的本地脚本用什麽程式语言?XD
如果不是 Python,就没办法直接接 API 读资料列表,
不过也是有一些比较简单的方法,
比如先开一个新的 ScrapBook 专门抓要处理的页面,
抓完用脚本处理完後再汇出汇入到正式的 scrapbook。
21F:推 zhtw: 推 用很久了!10/21 12:18
※ 编辑: danny0838 (114.136.60.45 台湾), 10/23/2020 13:28:22