作者bmzz (告白当然要唱这首歌)
看板Python
标题Re: [问题] 关於抓取网页资料
时间Sun Jun 28 19:41:04 2009
※ 引述《lauer (Enjoy it)》之铭言:
: 不好意思第一次想尝试抓网页资料
: 一般的网页知道怎麽去抓取,我是用最简单的 urllib.urlopen('..')
: 然後再找出我要的关键字
: 但是有的网页如果直接连的话
: 就会出现 "You do not have a session." 的讯息
: 请问这该如何解决呢?
: 麻烦大家了,谢谢!
可能用wireshark或是firefox去观察一下http的headers
通常是加个Referer就会过了
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.217.30.161
1F:推 lauer:谢谢解说~不过 不是很懂@@ Referer? 方便再多点资讯吗~ 06/28 20:00
2F:→ monmo2:所谓的Referer就是从一个url连过来的资讯。 06/28 23:07
3F:→ monmo2:若你从 A连到B。 则你把会A url referer资讯带着到B .. 06/28 23:08