作者leondemon (狗狗)
看板Python
标题Re: [问题] 有办法知道网页的建档时间吗?
时间Sun Jan 17 22:22:34 2010
请问一下 我读取网页回传的header後 获得以下资讯:
Date: Sun, 17 Jan 2010 14:17:57 GMT
Server: Apache-Coyote/1.1
Expires: Thu, 01 Jan 1970 00:00:00 GMT
Pragma: no-cache
Cache-Control: private,no-cache,no-store
Set-Cookie: JSESSIONID=63A83D55A84929DE013F7F129221D857; Path=/
Content-Type: text/html;charset=ISO-8859-1
Connection: close
Transfer-Encoding: chunked
这并没有Last-Modified的选项 这是否表示网页并不提供这样的讯息呢?
如果是这样 是否有其他办法可以确认是否更新?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 203.77.52.127
1F:→ monmo2:帮该网页做一个hash值。 可以用 hashlib 的 sha1 or md5 01/19 00:45
2F:→ monmo2:如果hash value 不同的话。就代表该网页已经更新过了.. 01/19 00:45
3F:→ Lucemia:原po应该是想只抓header来减少流量,但应该是做不到的 01/19 02:15
4F:→ leondemon:请问如果发出过多的请求 是否有可能会被对方封锁IP? 01/19 23:25
5F:→ leondemon:我说的请求是只有抓header的情况下.... 01/19 23:26
6F:→ AndCycle:这问题当然只有对方能回答 01/20 00:24
7F:→ wotupset:这种问题问咪图专家就对了 wwww 01/20 03:02