本文主要是介绍HTML::Parser,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
解析HTML。本例为找出一个html文本中的所有图片的地址。(即IMG标签中的src)
子程序start中的“$tag =~ /^img$/”为过滤出img标签。
如果换为“$tag =~/^a$/”,即是找出所有的链接地址。
#!/usr/bin/perl use LWP::Simple;
use HTML::Parser; my $url = shift || "http://www.chinaunix.net";
my $content = LWP::Simple::get($url) or die("unknown url\n"); my $parser = HTML::Parser->new( start_h => [&start, "tagname, attr"], ); $parser->parse($content);
exit 0; sub start
{ my ($tag, $attr, $dtext, $origtext) = @_; if($tag =~ /^img$/) { if (defined $attr->{'src'} ) { print "$attr->{'src'}\n"; } }
}
这篇关于HTML::Parser的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!