作者Linux (Windows)
看板PHP
標題[請益] 用 curl 抓 ppt.cc 的圖片
時間Sun Jan 19 20:20:58 2014
最近需要做一個 爬 open graph 的功能
其中遇到 og:image 的網址是使用 ppt.cc 的圖片
我使用 curl 試著去抓取網址的圖片,結果都抓到該 ppt.cc 的網頁內容
但是如果將網址 放到 <img /> 標籤內,瀏覽器卻有可以 看的到圖片。
舉個例子好了...
假設 我要抓取
http://ppt.cc/[email protected] 這張圖片
如果我寫一個靜態 html 內容使用 <img src="
http://ppt.cc/[email protected]" />
用瀏覽器看到的是一張圖片
但是使用 curl 抓回來的卻是網頁檔案,檔案內容就像直接用瀏覽器開這個網址一樣
我大約知道 curl 就是模擬瀏覽器發出要求並取回內容
但是用 <img/> 的方法應該也是瀏覽器對該網站發出要求吧?
差別是? 還是說我 curl 應該怎麼設定參數才會對 >"<
希望板上大大們給我個提示方向或關鍵字的 >///<
--
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.230.183.54
1F:推 LaPass:試試看加上reffer我猜他們是看這個去判斷的 01/19 21:29
2F:→ Linux:感謝!!!!!! 真的可以耶!!! 感謝!!!! 01/19 22:13
3F:→ Linux:curl_setopt( $ch , CURLOPT_REFERER , $referer_url ); 01/19 22:13
4F:→ Linux:加上這個就OK了! 01/19 22:13
5F:推 LaPass:恭喜 XD 01/20 08:22
6F:→ hans5300609:ID好妙www 01/23 02:06