作者tren (窗外有蓝天)
看板Perl
标题[问题] 抓取网页中的动态文字
时间Thu Jun 18 02:12:26 2009
各位先进,
以下列网页为例,如果要撷取其中上卷的动态文字,
该用怎样的方法为佳呢?
http://www.dogpile.com/dogpile_other/ws/searchspy/rfcid=4101/rfcp=quickstart-4/_iceUrlFlag=11?_IceUrl=true
这些动态文字没有存在page source里.用lynx或w3m也没帮助因为用到javascript.
不知大家是否有这方面的经验可以分享?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 168.122.81.186
※ tren:转录至看板 Python 06/18 02:33
1F:推 imce:研究了半小时,只找到处理的网页,但是不知道参数要给哪些 06/18 10:46
2F:→ imce:如果是在win32底下处理,我应该会内镶IE来处理比较快 06/18 10:46