作者neil7758 (Neil-lin)
看板java
标题Re: [问题] Java爬延迟加载的网页
时间Tue May 5 20:10:51 2015
※ 引述《bobyang79 (葱哥)》之铭言:
: 目前主要是想爬YouTube上的聊天室内容
: 目前看网页原始码感觉应该是可以爬的
: Youtube设计上内容一开始是"加载中..."
: 要过一段时间才会变成聊天室内容
: 但目前用Java或Jsoup去爬好像都会抓到网页一开始资料
: "加载中..."
: 不知道有没有办法做延迟读取之类的
: 有尝试过先connect後sleep(10000)再get
: 不过似乎还是不行
YouTube 留言是JavaScript 动态的,存网页下来是看不到动态资料你可以用selenium 套
件试试, 在用jsoup拆解html
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 122.116.235.208
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/java/M.1430827853.A.8A3.html