作者danny0838 (道可道非常道)
看板Browsers
标题Re: [问题] 请问有无从response撷取特定档案的套件?
时间Sat Sep 2 04:18:50 2017
※ 引述《puni (世足赛指定零嘴)》之铭言:
: 标题: [问题] 请问有无从response撷取特定档案的套件?
: 时间: Tue Aug 29 09:48:36 2017
:
:
: 不好意思打扰一下
:
: 最近想找这样一个套件
:
: 可以设定特定的档案类型(或档案名称) e.g. *.jpg *.flv
:
: 然後网页在载入的时候 如果侦测到有这样的档案被下载回来
:
: 就会自动把档案复制到指定的资料夹中
:
:
: 应该不算很复杂的功能 但不太知道该下什麽关键字来找 @@
:
: 因此请求大家帮忙 谢谢各位!
:
: --
:
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 210.71.217.252
: ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Browsers/M.1503971319.A.7E1.html
: → t7yang: 写爬虫(针对某些网站)或写套件应该都可以做到 08/29 10:36
: → t7yang: 套件开发线上读书会已经成立,欢迎加入一起研究 08/29 10:36
: → puni: 谢谢t7yang大 我是可以自己刻啦 但可否提供相关的资源连结? 08/29 14:10
: → t7yang: GC的puppeteer有response事件,应该可以做到 08/29 16:20
: → t7yang: webextension的部分也有webRequest.onCompleted 08/29 16:20
: → t7yang: 可以抓到response的结果(应该,没细看) 08/29 16:21
技术上来说,webRequest.onCompleted 只能取得 response header
而无法取得response body,
不过我们可以根据 URL 和 header 重新发一次 XMLHttpRequest 取得内容,
一般来说浏览器会尽可能尝试重复使用 cache 的内容,
不过可能有例外(比如网站禁止 cache),
并且重复连线是少不了的。
是故,如果你只是要能够下载东西,可以办到,
如果你要求的是在不产生新连线的前提下侧录下载的东西,那做不到。
此外,WebExtension 只能把档案放到浏览器设定的下载资料夹,
可以设定放到子资料夹,但无法选择任意资料夹。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.243.212.5
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Browsers/M.1504297133.A.BC7.html