作者KawasumiMai (モウソウ×ボウソウ)
看板PHP
标题[请益] 如何取得靠jquery印出的html
时间Mon Aug 13 00:59:26 2012
其实不知道是不是这个问题
http://ecshweb.pchome.com.tw/search/v1/关键字
这几天在研究这个东西
不过单纯使用
$html=file_get_contents($url);
会印出空白的搜寻结果
看了一下回传结果
除了一些autocomplete以外
似乎搜寻的结果是靠jquery印出来的
另外还有一个base64.js的东西搞不太懂到底在转什麽码
是因为靠jquery印出来的部分得另外抓吗?
还是说值根本没有传过去?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.62.93.151
1F:推 Reylod:这样只是拿到html啊,javascript是靠browser evaluate的 08/13 09:39
2F:→ KawasumiMai:所以有什麽方法呢?如果是这样的话 08/13 09:46
3F:→ bibo9901:看他的js往哪个页面送出request, 照送就是 08/13 09:59
4F:→ bibo9901:以你的例子来说, 他会往/search/v1/?f=getItems送出查询 08/13 10:20
5F:→ bibo9901:的关键字(用post), 所以你也跟着做就好了. 08/13 10:21
6F:→ KawasumiMai:不是f=getWords? 08/13 10:33
7F:→ KawasumiMai:此外,有个PCHOMEUNIQID的cookie,那是必要的吗? 08/13 10:33
8F:→ KawasumiMai:找不到要连哪个php才能取得那个ID值 08/13 10:34
9F:→ KawasumiMai:喔喔,稍微有点头绪了 08/13 10:53
12F:→ KawasumiMai:依照第二张的内容,写第一张的code送POST 08/13 11:18
13F:→ KawasumiMai:不晓得为什麽没有任何回应的样子... 08/13 11:18
14F:推 poototo:base64是图片档的一种文字编码格式,可以直接包在src 08/13 13:04
15F:→ poototo:浏览器会去还原base64,但html档会很大 08/13 13:05
16F:→ CaptainH:origin, referer, user-agent...等等也一起加上 08/13 13:52
17F:→ CaptainH:有些人会在後台检查这些 08/13 13:52
※ 编辑: KawasumiMai 来自: 61.62.93.151 (08/13 14:51)
18F:→ KawasumiMai:经过强者大大提点...... 08/13 14:51
19F:→ KawasumiMai:就只是content没有加上http_build_query()的问题... 08/13 14:52
20F:→ KawasumiMai:pchome没有检查任何header.... 08/13 14:52