作者johnny9667 (大八)
看板Linux
标题[问题] 怎麽用网路爬虫下载这些档案?
时间Thu Aug 10 19:27:37 2017
想请问一下 我想要下载这些档案
http://i.imgur.com/zmI0XPv.png
https://goo.gl/sw8vTR
我只是想下载这些档案 网路爬虫可以吗
大概怎麽用?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 101.13.96.22
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Linux/M.1502364460.A.1EB.html
1F:→ CP64: 基本上就 下载网页 -> 用选择器找出所有连结 -> 下载档案 08/10 19:35
2F:→ CP64: 这个算简单 只要用支援 css selector 的 html parser 就好做 08/10 19:38
3F:→ johnny9667: 楼上是说用网路爬虫吗? 08/10 19:40
4F:→ CP64: 网路爬虫平常做的事不就这样吗 08/10 19:41
5F:→ johnny9667: 我没用过不知道@@ 08/10 19:45
6F:→ armpaul: RFC 我下了一堆都没看 08/10 19:57
7F:→ johnny9667: 我是不得不看 08/10 19:59
8F:→ sppmg: wget -r -np -k $url 08/10 20:33
9F:推 hijkxyzuw: apt install rfc-doc ## debian 都帮你包好了 08/11 00:46
10F:→ hijkxyzuw: ^rfc-doc^doc-rfc 08/11 00:47
11F:→ soem: firefox -> DownThemAll addon 08/12 15:20
12F:推 OrzOGC: 我是抓网页然後用regexp抓出list再用wget抓 08/12 17:05