作者nfsong (图书馆我来了)
看板RegExp
标题[心得] HTML 取 tag内的text
时间Thu Jul 17 15:22:50 2014
因为最近需要取tag内的资料
<Cell>
<Data ss:Type="String">资料A</Data>
</Cell>
<Cell>
<Data ss:Type="String">资料B</Data>
</Cell>
match
资料A
资料B
爬文了一下好像板上的不太一样
找到了一个regex
(?<=
>).*(?=
<)
match >後面的字不包括>
match <前面的字不包括<
不过复杂的资料可能要在判断一下
--
nfsong 宅宅文书机
处理器: Intel Q9550 ES
主机板: Asus P5Q3 Deluxe
显示卡: CALIBRE GTX 460 1G
记忆体: Kingston DDR3-1333 4G
硬碟机: Hitachi 3.5" SATAII 500G
电 源: 全汉EVEREST 450W 模组化
机 壳: CoolerMaster CM690 advance(
Nvidia)
散 热: Aero HT-102
萤 幕: CHIMEI 22"*2
喇 叭: Altec Lansing ATP3
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.134.108.244
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/RegExp/M.1405581772.A.D0C.html
1F:推 lin1987www:还好用到多行模式,不然会取到换行xd 但这想法真不错:) 07/23 21:23