作者AAACCCEEE (茶)
看板Perl
标题[问题] 撷取网页面
时间Fri Feb 10 22:37:27 2012
请问一下
我是perl的新手~
爬了一下版 用了WWW:Mechanize来抓取yahoo的网页
抓yahoo!首页可以成功~
不过用
http://tw.search.yahoo.com/search?p=网页
抓搜寻 "网页" 的结果却无法抓到中文
英文可以正常显示~~
我也试过
print encode ("big5-eten",decode('utf-8', $mech->content));
但就是无法抓到中文=="中文的部份都被去掉~
是空白的 不是乱码...
搞了一个晚上了...有请高手指点一下
感谢
发现用Fx开yahoo search时是utf-8编码
换成我的程式就变成ISO-8859-1
这是什麽原因呢~~=="
--
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 114.37.49.98
1F:→ dryman:print encode("big5",$m->content);或把终端机编码改成utf8 02/11 09:48
2F:→ dryman:你的程式丢上去query的东西也要是utf8,另外user-agent可 02/11 09:49
3F:→ dryman:能也需要设定就是了 02/11 09:49