作者frsnic (路人)
看板RegExp
标题[问题] 有中文字怎麽抓阿
时间Fri Nov 19 00:31:22 2010
就是我要去抓博客x的书籍资料
假如我要抓他的作者那一栏
可是我的过滤条件里有中文字 要怎麽弄阿 ~"~
因为是特定的中文字 一直搞不懂
ex: 差点忘记是PHP
$url = "
http://www.books.com.tw/exep/prod/booksfile.php?item=0010469473";
$text = iconv("big5", "utf-8",file_get_contents($url));
//网站原始码
//<li>作者:<a href="
http://search.books.cof=author">艾伦.兰格</a></li>
preg_match('/作者:<a.*>(.*)<\/a>/i', $text, $match);
--
我要抓"作者:<a ...>" 这两个字後面的资料
也就是抓出"艾伦.兰格"
可是抓不出来 =口=
--
主管主管!又有人下萤幕 主管主管!网友说不出货要告 主管~有个叫明翰的订了三亿
DELL 订单 DELL DELL 我们诈欺 DELL DELL ψQSWEET
工 ◥ 管 ◥ 工 ◥ 管 ◥ 工 ◥他妈的◤ 管
◤◎ ◎ 喔~~ ◤︶ ︶ ◤◎ ◎ So~? ◤︶ ︶ ◤◎ ◎ 快出货呀!⊙ ⊙◥
◥ ◤ ◥ █◤ ◥ ◤ ◥ 3◤╯ξ
◥ ◤没王法了◥皿 ◤
◥ ◥◥ (哈欠)◤ ◥◤ ◥ ◥◥ (烟~) ◤ ◥ ◤ ̄ ◥ ◥◥是不是?!(
◥ ◤ ◤)
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 118.161.244.53
1F:推 LPH66:呃 "作者"二字怎麽会在 / 的外面... 11/19 09:34
2F:→ LPH66:再说你也少了一个全形冒号 11/19 09:34
※ 编辑: frsnic 来自: 118.161.244.53 (11/19 10:08)
3F:→ frsnic:囧 抓到了 原来是我自己耍笨了 11/19 10:08
4F:推 No:囧 11/19 11:01