作者tomin (Schrödinger's cat)
看板Ajax
标题Re: [问题] 想请问有没有办法抓到动态的网页?
时间Thu May 27 00:19:57 2010
※ 引述《littlebear00 (bear)》之铭言:
: 我目前没有透过server端处理(看网页上的资料似乎要做proxy??...还不是很懂)
: : 最近再写project的时候碰到一个颇头痛的问题...
: : 我必须拿到一份"动态执行过"的网页原始码
: : 再对内部加以分析
跨网域…
你那没有server端处理 死一半
接下来就要看对方有没有/愿不愿意提供API(json,js)
有的话还有救 没有的话大概就掰了
: → littlebear00:惊! T大 你的意思是该不会load回来的js是未执行的? 05/26 21:43
load回来 你自己就会执行js吧 不过不是对方执行过的喔
假设你是要捉yahoo, 无名之类的动态网页
那些网页的"js" code或许是动态产生的
但js都是client下载後才被client执行的
若你要捉我使用yahoo一会儿後 变数i,j的值增加到99这种 你是捉不到的
有可能我误解你的意思了 如果你只是要捉原始档
捉动态网页、静态网页的方法是一样的
不过前提就是一开始说的 对方或你一定要有一方 多花一些功夫
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.122.30.140
1F:推 littlebear00:受教了 谢谢...看来我方向有点弄错 05/27 06:11