作者iduhc (菠萝面包)
看板Ajax
标题[问题] 网路爬虫遇到javascript
时间Sun Jun 5 23:02:27 2011
※ [本文转录自 java 看板 #1DwsViZw ]
作者: iduhc (菠萝面包) 站内: java
标题: [问题] 网路爬虫遇到javascript
时间: Sun Jun 5 19:26:33 2011
目前不知道在html标签中遇到javascript时要如何做处理
这边是要做处理的网页:
http://khh.travel/tw/spots/RecSpotList.aspx
当我用普通浏览器时,只要单纯的按下"下一页"的按钮即可
可是到java上如何做???
目前已经能够抽取出html原始码中的 href="javascript:__doPostBack('First','')
请问各位大大接下来要怎麽做?
--------------------------------------------------------------------
我是想要用java做处理
ps1.我是想要得到类似我们按下一页时所得到的页面,
然後蒐集各个景点的资讯(这部份我已经完成了)
所以我的主要问题是在於如何做前往"下一页"这个动作
ps2.当我按下一页後为什麽出现的网址还是跟上一页的一样?
不过原始挡内容已经变了
这是javascript的效果嘛?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.116.130.25
※ 编辑: iduhc 来自: 140.116.130.25 (06/05 23:05)
1F:→ bibo9901:看起来只是在後端接收post过来的值, 再秀资料而已. 06/05 23:29