作者sunrise0406 (baker)
看板Python
标题Re: [问题] 抓取网页遇到的问题2
时间Thu Oct 7 15:28:01 2010
可以使用pattern定义出你要撷取资料的HTML结构,例
pattern_retrieval = ['html/body/table/tr/td']
把条件式写在handle_data里面
if "/".join(self._level_stack) in pattern_retrieval:
#储存资料
我有写过抓取google snippets的程式,
有问题可以mail给我
[email protected],互相讨论。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.113.166.81