作者sbox1000 (Su River)
看板PHP
標題[請益] 請教php爬蟲爬分頁的方式
時間Sat Apr 1 18:47:06 2017
想擷取圖片的網址為
http://www.bsobs.com.tw/photos/index/y/2017/m//page/
目前這支程式可以跑出第一頁的圖片結果
如果要跑出所有分頁的結果我應該怎麼寫呢嗚嗚嗚
跪求高手救援,小弟只是新手阿阿~~~
<?php
//引入套件
require('C:\snoopy\Snoopy.class.php');
require('C:\phpquery\phpQuery\phpQuery.php');
//download url
$url = "
http://www.bsobs.com.tw/photos/index/y/2017/m//page/";
//模仿正常人
$snoopy->agent = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2)
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.118 Safari/537.36";
$snoopy->referer = "
http://www.bsobs.com.tw/photos/index/y/2017/m//page/";
//擷取HTML
$snoopy = new Snoopy();
$html = $snoopy->fetch($url)->getResults();
//篩選img class
phpQuery::newDocumentHTML($html);
$images = pq('.photos_mobile img');
foreach($images as $image){
preg_match_all("#(
http://images/babyphoto/\w+.JPG)#", $html,
$matches);//套用原圖網址
echo $image->getAttribute('src') ."<br>";
}
?>
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 211.75.138.247
※ 文章網址: https://webptt.com/m.aspx?n=bbs/PHP/M.1491043629.A.2C7.html
1F:→ JustGame: 2017/m//page/1 04/01 19:41
2F:→ JustGame: 2017/m//page/2 04/01 19:41
3F:→ JustGame: 以此類推應該就結束了吧 04/01 19:42
4F:→ sbox1000: 我知道啊啊啊啊,但就是不知道怎麼寫嗚嗚嗚嗚 04/02 01:43
5F:推 hareion08: 先在列表頁抓分頁那個標籤看最大值多少再用for迴圈跑 04/02 07:55
6F:→ hareion08: 分頁 04/02 07:55
7F:→ hareion08: 或while 要抓的內容=空時終止 04/02 07:56
8F:→ hareion08: 記得要sleep... 04/02 07:57