作者iduhc (菠蘿麵包)
站內java
標題[問題] 網路爬蟲遇到javascript
時間Sun Jun 5 19:26:33 2011
目前不知道在html標籤中遇到javascript時要如何做處理
這邊是要做處理的網頁:
http://khh.travel/tw/spots/RecSpotList.aspx
當我用普通瀏覽器時,只要單純的按下"下一頁"的按鈕即可
可是到java上如何做???
目前已經能夠抽取出html原始碼中的 href="javascript:__doPostBack('First','')
請問各位大大接下來要怎麼做?
--------------------------------------------------------------------
我是想用java做處理而不是javascript或html語法,所以應該不算問錯版吧
ps1.我是想要得到類似我們按下一頁時所得到的頁面,
然後蒐集各個景點的資訊(這部份我已經完成了)
所以我的主要問題是在於如何做前往"下一頁"這個動作
ps2.當我按下一頁後為什麼出現的網址還是跟上一頁的一樣?
不過原始擋內容已經變了
這是javascript的效果嘛?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.116.130.25
1F:推 chchwy:問錯版了XD 06/05 21:17
2F:推 TaiwanXDman:JS 請去Ajax版唷XD 06/05 22:10
3F:推 caty1010:要parse的目標是什麼? 06/05 22:11
4F:→ iduhc:我是想用java去做處理而不是javascript 06/05 22:23
5F:→ iduhc:所以應該沒問錯吧 抖~~ 06/05 22:28
※ 編輯: iduhc 來自: 140.116.130.25 (06/05 22:45)
※ 編輯: iduhc 來自: 140.116.130.25 (06/05 22:48)
※ iduhc:轉錄至看板 Ajax 06/05 23:02