作者wallrose (墙玫瑰)
看板Python
标题[问题] 爬虫问题,关於网址不存在
时间Mon Oct 22 15:44:17 2018
爬虫新手请教,程式码结构如下:
import requests
url = '
http://www.abc.de.fg'
res = requests.get(url)
一般来说,res应该会回传一个status code
用来判断server的回应状态
目前写的爬虫,若该网址挂掉 or 不存在,
requests.get(url)
会直接喷一样的 ERROR,造成程式终止
而不会回传一个适当的status code
想问这是bug 还是 本来就这样设计?
还是要自己用try except做错误处理??
谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.130.138.229
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1540194260.A.7DF.html
1F:→ AndCycle: 网址不存在就没有server,没有server你哪来 status code? 10/22 17:08
2F:→ AndCycle: http status code 是对面 server 给的, 连不到就没有 10/22 17:10
3F:推 newton2009: Time out ? 10/22 17:48
4F:→ lajji: try except 10/22 21:12
5F:→ zo6596001: try except 10/22 22:15
6F:推 XperiaZ6C: 没东西要怎麽回传,用try-except吧 10/23 02:19
7F:→ nini200: 网路相关的一般都会加 try except 10/23 06:10