作者iduhc (菠萝面包)
站内java
标题[问题] 网路爬虫遇到javascript
时间Sun Jun 5 19:26:33 2011
目前不知道在html标签中遇到javascript时要如何做处理
这边是要做处理的网页:
http://khh.travel/tw/spots/RecSpotList.aspx
当我用普通浏览器时,只要单纯的按下"下一页"的按钮即可
可是到java上如何做???
目前已经能够抽取出html原始码中的 href="javascript:__doPostBack('First','')
请问各位大大接下来要怎麽做?
--------------------------------------------------------------------
我是想用java做处理而不是javascript或html语法,所以应该不算问错版吧
ps1.我是想要得到类似我们按下一页时所得到的页面,
然後蒐集各个景点的资讯(这部份我已经完成了)
所以我的主要问题是在於如何做前往"下一页"这个动作
ps2.当我按下一页後为什麽出现的网址还是跟上一页的一样?
不过原始挡内容已经变了
这是javascript的效果嘛?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.116.130.25
1F:推 chchwy:问错版了XD 06/05 21:17
2F:推 TaiwanXDman:JS 请去Ajax版唷XD 06/05 22:10
3F:推 caty1010:要parse的目标是什麽? 06/05 22:11
4F:→ iduhc:我是想用java去做处理而不是javascript 06/05 22:23
5F:→ iduhc:所以应该没问错吧 抖~~ 06/05 22:28
※ 编辑: iduhc 来自: 140.116.130.25 (06/05 22:45)
※ 编辑: iduhc 来自: 140.116.130.25 (06/05 22:48)
※ iduhc:转录至看板 Ajax 06/05 23:02