Python 板


LINE

手机排版请见谅!!!! 是这样的如题 小弟最近想写一个爬虫自动更新程式 程式有以下目的 例如: 我今天爬观光局网站 将全部景点资讯爬下 过了一个月後观光局多了10个新的景点 我可以透过这个程式让爬虫自动执行 并把这10个新的景点爬下来 请问这个程式是我需要另外再写一个 还是我可以在python做出一样目的? 另外就是我该从哪一方面的资讯去起手? 谢谢 --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 49.158.107.59
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1537346188.A.14C.html
1F:→ gmccntzx1: 你都说了「找了很多资料不太容易吸收」,何不试着讲出09/19 16:44
2F:→ gmccntzx1: 哪些部份不懂?09/19 16:44
3F:→ gmccntzx1: 将那些不了解的部份整理成问题发上来问,让大家帮你厘09/19 16:45
4F:→ gmccntzx1: 清观念,这样才能学到东西。09/19 16:45
5F:→ gmccntzx1: 不然找了资料给你,大家怎麽知道哪些是你「容易吸收」09/19 16:46
6F:→ gmccntzx1: 的呢?09/19 16:46
7F:→ gmccntzx1: https://git.io/vFLQg -> 顺便学着怎麽提问09/19 16:48
8F:推 cutekid: 推楼上 g 大分享的「提问的智慧」09/19 16:58
9F:→ WENroger: 感谢指教 应该说不知哪里起手09/19 21:32
※ 编辑: WENroger (49.158.107.59), 09/19/2018 21:50:01
10F:→ gmccntzx1: 讲明确一点,是不知道怎麽写爬虫还是不知道怎麽做到让 09/19 22:18
11F:→ gmccntzx1: 爬虫定时更新? 既然你都说了有找资料,先试着说说看你 09/19 22:18
12F:→ gmccntzx1: 对哪个部份不了解到不知怎麽起手? 09/19 22:19
13F:→ gmccntzx1: 过於笼统的问题,别人也很难回答 09/19 22:20
14F:→ WENroger: 不知道怎麽让爬虫做到自动更新,像是网路上提到scrapy可 09/19 22:37
15F:→ WENroger: 不可以做到这个目的?另外就是先前资料都是汇入excel做 09/19 22:37
16F:→ WENroger: 整理再汇入资料库,这样子的步骤会不会影响爬虫的自动 09/19 22:37
17F:→ WENroger: 更新? 09/19 22:37
18F:→ gmccntzx1: 关於自动更新,先给你些关键字: cron job, scheduler 09/19 22:44
19F:→ gmccntzx1: 利用这些工具/函式库去做定期执行爬虫的工作 09/19 22:45
20F:→ gmccntzx1: 当然,新旧资料的整合就要看你自己怎麽处理 09/19 22:45
21F:→ gmccntzx1: 关於第二个问题,你说的先将资料汇入 excel 整理後再 09/19 22:49
22F:→ gmccntzx1: 汇入资料库这部份,请问是手动的吗? 09/19 22:49
23F:→ gmccntzx1: 如果你写的爬虫部份包含将资料抓下来後写进资料库,那 09/19 22:50
24F:→ gmccntzx1: 麽当要抓取的资料量和处理时间会多到你手动处理後再汇 09/19 22:51
25F:→ gmccntzx1: 修正:会多到和你手动整理资料并汇入的动作起冲突时, 09/19 22:52
26F:→ gmccntzx1: 那就当然会影响。 09/19 22:53
27F:→ gmccntzx1: 所以这点你就要考虑: 09/19 22:53
28F:→ gmccntzx1: 1. 舍弃手动去整理资料的方式,用程式自动化这部份。 09/19 22:54
29F:→ gmccntzx1: 2. 如果资料非得经过人工处理,那爬虫就写好只负责将 09/19 22:55
30F:→ gmccntzx1: 资料抓下来。剩下处理资料和汇入资料库的部份,就由自 09/19 22:55
31F:→ gmccntzx1: 己处理。 09/19 22:55
32F:→ gmccntzx1: 关於这两部份,如果有实作上不懂的细节,你可以整理好 09/19 22:58
33F:→ gmccntzx1: 再上来发问,相信会有更专业的人可以帮到你。 09/19 22:58
34F:→ WENroger: 感谢g大耐心的解答 未来有不懂的地方还要烦请g大多多解 09/19 23:00
35F:→ WENroger: 惑 非常感谢! 09/19 23:00
36F:推 gmccntzx1: 不会,我仅能帮到这点程度而已。以後发问时尽量说明 09/19 23:07
37F:→ gmccntzx1: 详细一点,如果是程式实作的问题,可以照着 SSCCE 或 09/19 23:08
38F:→ gmccntzx1: MCVE 的规范描述问题,通常能让别人更快了解并帮助你。 09/19 23:10
39F:→ gmccntzx1: 好的提问不仅可以帮助自己,也能让助人者有收获,未来 09/19 23:12
40F:→ gmccntzx1: 也有机会帮助到其他遇到相同问题的人。加油! 09/19 23:12
41F:推 rexyeah: gm真的很有耐心的仔细回答 09/19 23:32
42F:→ WENroger: 好的 非常感谢g大! 09/19 23:50
43F:推 MCDDD: g大真的猛!! 09/21 21:53
44F:推 innona: 推g大 09/24 01:15
45F:→ cancelpc: 楼主是要练习写爬虫,还是有需要?若是需要的话,去查查 09/25 07:38
46F:→ cancelpc: 是否有 opendata 方式直接抓 09/25 07:38







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:BuyTogether站内搜寻

TOP