作者jimmylin212 (JimmyG)
看板Python
标题[问题] 抓取浏览器的资讯
时间Thu Sep 2 14:52:54 2010
想请问有没有办法利用 python 来抓取浏览器的资讯
想要达成的目的是:
在浏览器的网址列当中打上网址→按下Enter→
传送到 python 当中分析 若有问题的话就不让使用者继续浏览该网页(跳出错误讯息之类)
若没有问题就让使用者继续浏览该网页
想请问 python 有办法做到这样吗?
又应该要使用哪些 library 呢?
感谢
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.67.154.253
1F:推 Cayley:看你想分析甚麽吧...而且我不懂为什麽分析完要传回浏览器 09/02 16:20
2F:→ Cayley:是可以用win32com抓住ie...不过不确定那是不是你要的 09/02 16:21
3F:→ jimmylin212:win32com 可抓住不同浏览器吗?抓到浏览器要连入哪个 09/02 17:28
4F:→ jimmylin212:URL 09/02 17:28
5F:→ blc:是要抓user agent string吗?自己开个httpd就可以抓了。 09/02 17:29
6F:→ jimmylin212:刚刚去查了下win32com 的函式,好像有类似绑定的功能 09/02 17:42
7F:→ jimmylin212:可以直接对应用程式作控制。请问 HTTPD 是什麽呢? 09/02 17:43
8F:→ yjc1:听起来像是要搞个 python proxy ? 09/02 19:34
9F:推 Cayley:Com server可以控制程式阿...至於哪些程式有开後门给Com 09/02 20:19
10F:→ Cayley:请查pywin... 09/02 20:19
11F:→ Cayley:不过...你还是没回答我...为什麽要"传回浏览器"@@? (不解) 09/02 20:20
12F:→ jimmylin212:其实想要分析之後发现有问题就不要让使用者继续浏览 09/02 22:48
13F:→ jimmylin212:该网页.所以我要去网路上下载 win32com 这个 API 吗? 09/02 22:49
14F:→ jimmylin212:看官网里面好像没有这个 API,还是我用错关键字了呢 09/02 22:49
15F:→ jimmylin212:谢谢你的回答! 09/02 22:49
16F:推 cobrasgo:你把use case完整叙述一下吧,看不太懂 09/02 23:15
17F:→ yjc1:... 就说架个 proxy 就好… 09/02 23:26
※ 编辑: jimmylin212 来自: 118.160.167.231 (09/03 01:15)
18F:→ jimmylin212:内文已做修改,想再不架 proxy 的环境下做到,谢谢 09/03 01:16
19F:→ jlovet:"不同的浏览器"你知道浏览器百百种嘛... 09/03 10:35
20F:→ jlovet:看起来是想要阻挡某些网站之类的... 09/03 10:35
21F:→ jimmylin212:其实能过滤IE,FF,GC,OPERA 就可以了 09/03 14:20
22F:→ Dannvix:用libpcap偷听浏览器的request,发现不合法就赶快送RST... 09/04 20:05
23F:→ Dannvix:(突然想到,这样好像在做单机版的 GFW 哈哈) 09/04 20:11