作者roga (任性)
看板PHP
标题Re: [请益]有关HTTP 999
时间Tue Dec 14 15:30:14 2010
※ 引述《ROCKIT (ROLL)》之铭言:
: 想要请问一些概念的问题,我尝试用php去抓网页
: 结果程式没写好,短时间内抓了太多次
: 会出现HTTP request failed! HTTP/1.1 999 Unable to process request at this time
: 这之後就被挡掉了,但是,为什麽我用浏览器去看还是可以看啊??
: 难道不是挡IP吗??
被挡掉不是只看 IP ,给些提示,
1. 你浏览有带 cookie 吗?每次 cookie 都一样吗?带过去的 cookie 够吗?
2. 你有带 referer 吗?每次 referer 都一样吗?
3. 存取的时间密集吗?存取时间是否规律?
4. 存取的资料内容类型相同吗?存取范围是否都是特定分类呢?
如果行为表现得就像机器人,会被挡掉也是很正常的不是嘛 :P
--
The Internet: where men are men, women are men, and children are FBI agents.
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 202.89.121.16
※ 编辑: roga 来自: 202.89.121.16 (12/14 15:31)
1F:推 ROCKIT:喔!!!果然还是有遗漏的,感谢你的回答^^ 12/14 21:46