作者brandonron (假嗨)
看板PHP
標題[請益] php 爬取網頁內容[學習新手]
時間Wed Oct 23 13:52:24 2013
由於小弟以前都沒接觸過php語法,又迫於被人催促要快實現出結果
目前能力還是在基本的部分,以及如何連接資料庫並取出資料庫資料
想要爬取全台灣中油加油站的地址、7-11地址、與郵局地址放入資料庫中
但是中油(其他好像也有防扒)網頁有防爬取的功能,所以我這部分是存放成"htm"l方式
來試著爬資料的<title>。
以下網址內的商家地址是我想抓取的內容(似乎都得先將網頁另存成html檔)
中油的內容我想抓取各縣市的"縣市"跟"地址"的內容
中油:
http://www.cpc.com.tw/big5_bd/tmtd/station/searchstn-1.asp
7-11的內容我想抓所有縣市的"門市地址"的內容
7-11:
http://www.i-write.idv.tw/life/info/7-11/7-11.html
郵局的內容我想抓所有縣市的"局址"的內容
郵局:
http://www.post.gov.tw/post/internet/i_location/index.jsp?ID=1301
不知道版友能否提供我爬取範例,讓我邊參考邊學習,加快學習php爬網並實現出來
或是提供一個小小可運作的範例讓我了解並且揣測程式碼
感激不盡~
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.127.218.68
1F:推 LaPass:google: spider php 10/23 15:08
2F:→ LaPass:不過我不認為這個用php會比較快.... 10/23 15:09
3F:推 alpe:如果已經有寫好的程式, 不會比較慢拉, 但node.js爬真的方便 10/23 15:18
4F:→ alpe:尤其有selector可以用 10/23 15:19
5F:→ brandonron:node.js 我第一次聽到,我看一下是什麼好了 10/23 18:39
6F:→ brandonron:想問一下,Node.js的優勢是在哪?(與其他語言比較) 10/23 21:38
7F:→ brandonron:搜尋後發現有本書書名寫Google御用網頁語言 10/23 21:39
8F:→ brandonron:所以目前網頁語言的學習,各位會建議學Node.js跟HTML5? 10/23 21:41
9F:→ s540421:現學現用的話不建議用這種新興語言,一方面不穩定,客戶不 10/23 23:12
10F:→ s540421:見得允許你用這些東西,再說共同開發又是另一問題 10/23 23:13
11F:→ s540421:可以學起來備用,不過要出場還是需要學其他工具 10/23 23:13
13F:→ KC73:試試看 snoopy ~ 10/24 01:59
14F:→ danny8376:nodejs並不新 出來好幾年了 更別說不穩定 10/24 12:39
15F:→ danny8376:不過要說的話 對台灣這來說是外星科技就是www 10/24 12:40
17F:→ world294:nodejs 可以執行需 run 比復雜的 js 頁面嗎? 11/06 11:14