作者akindpepe (丫布)
看板RegExp
标题抓取<a></a>的内容及href="'的内容
时间Wed Jul 8 12:08:34 2009
各位大大…小弟真的照着板上的都做过了…就是没办法
请各位大大教导一下小弟该怎麽做…
1.环境「PHP」
2.撷取内容
<h3 class="r">
<a class="l" onmousedown="return rwt(this,'','','res','1','AFQjCNH4AlwP5KXRZZa14uaQmRvUpW9hIg','&sig2=
U4uYfO-3lJqjx6zOjHITBQ')"
href="
http://briian.com/?p=5938"
realurl="
http://briian.com/?p=5938">
[教学] 什麽是Plurk「<em>噗浪</em>」? 如何使用扑浪?
</a>
</h3>
以上的内容是我搜寻GOOGLE得到某段的html
目前看来,我所需要的内容应该是在<h3><a>...</a></h3>里面
问题1:请问一下,我应该要怎麽在php里面撷取出来我需要的内容…
问题2:而且php遇到「"」不是要改成「\"」这样的话我直接用curl抓
网页内容的话,要怎麽改?
问题3:请问一下,要怎麽也把href="..."的网址撷取出来…
ps:小弟是php新手,正规表示法有看没有懂= = 请各位大大别鞭的太用力…
我是用 preg_match 这个函式来做的
如果可以的话,也请大大好心教一下小弟,正规法该怎麽下才能得到自己想要的内容
谢谢各位大大看完^^"
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 219.84.143.51