作者KawasumiMai (モウソウ×ボウソウ)
看板PHP
標題[請益] 如何取得靠jquery印出的html
時間Mon Aug 13 00:59:26 2012
其實不知道是不是這個問題
http://ecshweb.pchome.com.tw/search/v1/關鍵字
這幾天在研究這個東西
不過單純使用
$html=file_get_contents($url);
會印出空白的搜尋結果
看了一下回傳結果
除了一些autocomplete以外
似乎搜尋的結果是靠jquery印出來的
另外還有一個base64.js的東西搞不太懂到底在轉什麼碼
是因為靠jquery印出來的部分得另外抓嗎?
還是說值根本沒有傳過去?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.62.93.151
1F:推 Reylod:這樣只是拿到html啊,javascript是靠browser evaluate的 08/13 09:39
2F:→ KawasumiMai:所以有什麼方法呢?如果是這樣的話 08/13 09:46
3F:→ bibo9901:看他的js往哪個頁面送出request, 照送就是 08/13 09:59
4F:→ bibo9901:以你的例子來說, 他會往/search/v1/?f=getItems送出查詢 08/13 10:20
5F:→ bibo9901:的關鍵字(用post), 所以你也跟著做就好了. 08/13 10:21
6F:→ KawasumiMai:不是f=getWords? 08/13 10:33
7F:→ KawasumiMai:此外,有個PCHOMEUNIQID的cookie,那是必要的嗎? 08/13 10:33
8F:→ KawasumiMai:找不到要連哪個php才能取得那個ID值 08/13 10:34
9F:→ KawasumiMai:喔喔,稍微有點頭緒了 08/13 10:53
12F:→ KawasumiMai:依照第二張的內容,寫第一張的code送POST 08/13 11:18
13F:→ KawasumiMai:不曉得為什麼沒有任何回應的樣子... 08/13 11:18
14F:推 poototo:base64是圖片檔的一種文字編碼格式,可以直接包在src 08/13 13:04
15F:→ poototo:瀏覽器會去還原base64,但html檔會很大 08/13 13:05
16F:→ CaptainH:origin, referer, user-agent...等等也一起加上 08/13 13:52
17F:→ CaptainH:有些人會在後台檢查這些 08/13 13:52
※ 編輯: KawasumiMai 來自: 61.62.93.151 (08/13 14:51)
18F:→ KawasumiMai:經過強者大大提點...... 08/13 14:51
19F:→ KawasumiMai:就只是content沒有加上http_build_query()的問題... 08/13 14:52
20F:→ KawasumiMai:pchome沒有檢查任何header.... 08/13 14:52