作者tren (窗外有蓝天)
看板Python
标题[问题] 抓取网页中的动态文字
时间Thu Jun 18 02:33:42 2009
※ [本文转录自 Perl 看板]
作者: tren (窗外有蓝天) 看板: Perl
标题: [问题] 抓取网页中的动态文字
时间: Thu Jun 18 02:12:26 2009
各位先进,
以下列网页为例,如果要撷取其中上卷的动态文字,
该用怎样的方法为佳呢?
http://www.dogpile.com/dogpile_other/ws/searchspy/rfcid=4101/rfcp=quickstart-4/_iceUrlFlag=11?_IceUrl=true
这些动态文字没有存在page source里.用lynx或w3m也没帮助因为用到javascript.
不知大家是否有这方面的经验可以分享?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 168.122.81.186
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 128.197.61.3
1F:→ blc:既然是js来的,那就拆js出来看它是从哪里抓内容。 06/18 16:38
2F:→ AndCycle:Firebug开下去一分钟就知道他是从哪里抓的了 ... 06/18 23:58