作者newyellow (newyellow)
看板PHP
标题[请益] PHP preg_match_all 抓资料
时间Tue Sep 14 13:42:00 2010
最近刚接触正规表示这个东西
最近想做一个跟学校课程有关的系统
目前在做的是把课程资料抓下来
但却有一栏始终抓不到
网页网址:
http://tinyurl.com/2fhpyhy
教师那一栏怎麽抓都抓不到
(学校这个网页
资料库好像塞得不太乾净...一堆空格,用原始码检视很丑)
要抓的地方大概长像这样(网页原始码):
<td>
王伟霖
<br>WANG WEI-LIN
</td>
我是用 PHP 的 preg_match_all
去抓 /<td>(.*)<br>(.*)<\/td>/ 抓不到
甚至只抓 /<td>.*<\/td>/ 也抓不到老师这一栏
不知道是语法错还是什麽原因
请教各位高手了
谢谢
( 这篇有先贴在 RegExp 版,但因为那边人少,所以也在这里发问...希望没有违规 )
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.119.234.49
1F:→ xxxx9659:记得.不包括换行 把.*改成[.\r\n]*或是[.\\r\\n]* 09/14 14:19
2F:→ knuckles:或是使用 /<td>(.*)<\/td>/s 让.包括换行 09/14 14:27
3F:→ newyellow:原来如此,非常谢谢!! 我去试试看!! 09/14 14:34
4F:→ gamewolf:用phpQuery轻松快意... 09/14 16:59