作者giacch (小a)
看板RegExp
标题Re: [问题] 抓html tag
时间Sat Nov 8 13:46:02 2008
※ 引述《yingwan (yingwan)》之铭言:
(略过...)
: 我用perl是这样写的:
: open(IN, $file) || die "can't read $file";
: @file = <IN>;
undef *TMP;
for(@file) {
$_ = $TMP . $_ if($TMP);
while(/<[^>]+>/) {
push(@TMP, $1) if(s/(<[^>]+>)//);
}
/(<[^>]+)/ ? $TMP = $1 : undef $TMP;
} @file = map { s/ >/>/; s/\n//; s/ +/ /g; $_ } @TMP;
: print "These are the opening tags:\n";
: foreach $line (@file){
: find_opening_tags($line);
(略过...)
加上那一段就会和结果一样了...
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 118.232.236.185
1F:推 yingwan:你太强了啦,感谢 11/09 08:09