作者frsnic (路人)
看板RegExp
標題[問題] 有中文字怎麼抓阿
時間Fri Nov 19 00:31:22 2010
就是我要去抓博客x的書籍資料
假如我要抓他的作者那一欄
可是我的過濾條件裡有中文字 要怎麼弄阿 ~"~
因為是特定的中文字 一直搞不懂
ex: 差點忘記是PHP
$url = "
http://www.books.com.tw/exep/prod/booksfile.php?item=0010469473";
$text = iconv("big5", "utf-8",file_get_contents($url));
//網站原始碼
//<li>作者:<a href="
http://search.books.cof=author">艾倫.蘭格</a></li>
preg_match('/作者:<a.*>(.*)<\/a>/i', $text, $match);
--
我要抓"作者:<a ...>" 這兩個字後面的資料
也就是抓出"艾倫.蘭格"
可是抓不出來 =口=
--
主管主管!又有人下螢幕 主管主管!網友說不出貨要告 主管~有個叫明翰的訂了三億
DELL 訂單 DELL DELL 我們詐欺 DELL DELL ψQSWEET
工 ◥ 管 ◥ 工 ◥ 管 ◥ 工 ◥他媽的◤ 管
◤◎ ◎ 喔~~ ◤︶ ︶ ◤◎ ◎ So~? ◤︶ ︶ ◤◎ ◎ 快出貨呀!⊙ ⊙◥
◥ ◤ ◥ █◤ ◥ ◤ ◥ 3◤╯ξ
◥ ◤沒王法了◥皿 ◤
◥ ◥◥ (哈欠)◤ ◥◤ ◥ ◥◥ (煙~) ◤ ◥ ◤ ̄ ◥ ◥◥是不是?!(
◥ ◤ ◤)
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 118.161.244.53
1F:推 LPH66:呃 "作者"二字怎麼會在 / 的外面... 11/19 09:34
2F:→ LPH66:再說你也少了一個全形冒號 11/19 09:34
※ 編輯: frsnic 來自: 118.161.244.53 (11/19 10:08)
3F:→ frsnic:囧 抓到了 原來是我自己耍笨了 11/19 10:08
4F:推 No:囧 11/19 11:01