作者bwtalk (是黑是白)
看板Python
標題[問題] 用python做parse
時間Mon Jun 4 21:57:09 2012
之前沒學過python
google到的教學文章有範例 但卻不懂原理..
請問一下我今天假使要parse證交所的收盤價
http://0rz.tw/n8qLj
是要先自己分析網頁的原始碼 找出我要的資料在哪裡
然後再parse嗎?
原始碼長得像這樣子
http://ppt.cc/IhfX
請問該如何做parse
麻煩給點指導 謝謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.116.243.66
1F:→ mail6543210:基本上可搭配lxml,將html丟進去分析,然後用xpath娶你 06/04 22:17
2F:→ mail6543210:要的部分 06/04 22:17
3F:→ IAMPF:我都很笨的用urllib把整篇網頁抓下來再抓keyword把東西切開 06/04 22:39
4F:→ gozule:我也是抓證交所的資料,可以直接抓csv的檔案再parse比較簡 06/04 22:55
5F:→ gozule:單,不過要花點時間hack網址:) 06/04 22:55
7F:推 cobrasgo:我跟3樓一樣,懶的用工具了,反正parse起來不難 06/06 14:30
8F:推 flyakite:lxml, BeautifulSoup, Scrapy 06/23 07:58