作者sunrise0406 (baker)
看板Python
標題Re: [問題] 抓取網頁遇到的問題2
時間Thu Oct 7 15:28:01 2010
可以使用pattern定義出你要擷取資料的HTML結構,例
pattern_retrieval = ['html/body/table/tr/td']
把條件式寫在handle_data裡面
if "/".join(self._level_stack) in pattern_retrieval:
#儲存資料
我有寫過抓取google snippets的程式,
有問題可以mail給我
[email protected],互相討論。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.166.81