作者ilay (說唱猜做玩)
看板Python
標題[閒聊] 這個要怎麼parse...
時間Wed Apr 18 09:16:43 2012
最近因為專案需求要取得某超商的門市位置資訊,所以找上了這個網站準備 parse..
http://emap.pcsc.com.tw/01.htm
打開後突然想到這東西不能用一般 parsing 靜態頁面的方式去做
他的關鍵資訊都要觸發 javascript 事件後才會出現
所以不太懂要從哪邊下手
不知道有沒有神人做過類似的事情可以指點一下~感謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 163.29.98.120
1F:推 shaopin:用該網站的api 04/18 09:24
2F:→ ilay:不太懂@@ 願聞其詳 04/18 09:27
3F:推 shaopin:你看他網站src裡的js都怎麼call xmlhttpreq 就照樣 04/18 09:30
4F:→ ilay:原來如此! 04/18 09:43
5F:→ ilay:結果看不太懂他的東西 囧 04/18 10:23
6F:→ legnaleurc:用 Firebug 之類的看它 network request 04/18 13:06
7F:→ gozule:scrapy不知道能不能做到 04/18 19:53
8F:→ bob123:我用chrome的console下js指令可以抓到資料但是用python 04/19 02:17
9F:→ bob123:(urllib2,cookie,json) 送req他竟然回使用者權限不足... 04/19 02:21
10F:→ bob123:不試了,等高手解完再來學習Orz... 04/19 02:24