作者soul810707 (louis)
看板PHP
標題[請益] php擷取網頁中script裡面的meta name
時間Sun Dec 27 20:28:35 2015
各位好,我查了許久就是找不到答案,還請大家指教。
我想要擷取mobile 01網頁原始碼中的 keyword,我用get_meta_tag一直失敗,但用Yah
oo的是可以的,所以程式應該沒錯,後來發現可能是因為 mobile01的keyword是在 scr
ipt裡面,但我不知道該用何種方法, 還請各位指導我方向。謝謝
--
Sent from my Android
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.9.91.63
※ 文章網址: https://webptt.com/m.aspx?n=bbs/PHP/M.1451219318.A.585.html
1F:→ secondDim: mobile 01 首頁的meta沒有在script裡面啊?12/27 22:12
2F:→ soul810707: 他的keyword 在script中12/28 08:44
※ 編輯: soul810707 (110.28.15.137), 12/28/2015 08:56:10
3F:→ secondDim: mobile01的meta看起來並沒有在script裡,與問題無關 12/28 09:32
4F:→ secondDim: 剛剛用爬蟲測試一下,好像是mobile01的server會檢查 12/28 09:32
5F:→ secondDim: user_agent,user_agent為空時會無法執行 12/28 09:32
6F:→ secondDim: 而get_meta_tags好像不會發送user_agent,導致mobile01 12/28 09:33
7F:→ secondDim: 沒有回應 12/28 09:33
8F:→ soul810707: 可否給我個方向,我不知道該怎做才能抓到keyword 12/28 09:43
9F:→ secondDim: get_meta_tags沒辦法處理user_agent,可以嘗試用curl 12/28 10:01
10F:→ secondDim: 將資料撈回來再處理。使用preg_match或其他方式找出met 12/28 10:01
11F:→ secondDim: a 12/28 10:03
12F:→ secondDim: 好像不能貼網址,不知道這樣說明可以嗎? 12/28 10:06
13F:→ soul810707: 我試試看,感謝解答 12/29 07:35