作者tumc (HIHIHI)
看板Perl
标题Re: [问题]抓取 utf8网页
时间Wed Nov 28 20:00:37 2007
※ 引述《LiloHuang (相见不如怀念)》之铭言:
: ※ 引述《tumc (HIHIHI)》之铭言:
: : 请问一下,
: : 如何才能把抓下来的utf8网页,
: : 转变成big5的格式,
: : 直接用utf8存成文字档都是乱码
: #!/usr/bin/perl
: use Encode qw/encode decode/;
: use LWP::Simple;
: my $html = get 'http://www.kkbox.com.tw/';
: print encode("Big5", decode("utf-8", $html));
我用下面这段抓下来也是乱码,是用 activestate版本的perl 5.8.8
以前记得用相同电脑,用不同版本的perl,不会有这问题
但重安装xp後,重灌perl 5.8.8就不行
谁能解答为什麽会这样
use Encode qw/encode decode/;
use LWP::Simple;
open(CK, ">check.txt");
my $html = get '
http://www.kkbox.com.tw/';
print CK encode("Big5", decode("utf-8", $html));
close (CK);
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 122.124.14.99
1F:推 LiloHuang:非常正常...也没有乱码@@ 11/28 20:04
2F:推 imce:我觉得拉,乱码会不会是因为charset=utf-8这行造成的 11/29 08:59
3F:→ imce:如果把存下来的txt改htm打开後,就会变乱码 11/29 09:00