作者Atenp (偶数传奇)
看板Ajax
标题[问题] XMPHttpRequeset 抓取网页 内容乱码
时间Sun Dec 6 10:12:12 2009
想抓取某个 big5编码网页
然後parse网页
抓回来的中文是乱码
logoRequset_ = new XMLHttpRequest();
logoRequest_.open("GET", URL, true); //POST? GET?
logoRequest_.onreadystatechange = xxx;
logoRequest_.setRequestHeader("Content-Type", "application/x-www-form-urlencoded");
logoRequest_.setRequestHeader("Content-Type","big5");
//可以用big5吗 utf-8, utf-16 也没用
请问该怎麽解决呢?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 114.36.233.175
1F:→ weiyucsie:你header写法错了吧? 12/06 21:25
2F:→ weiyucsie:一般是text/html; charset=big5 12/06 21:25
3F:→ weiyucsie:咦 这边是发出request... 12/06 21:34
4F:→ weiyucsie:我知道如果在response header写那行,可能有用 12/06 21:41
5F:→ weiyucsie:但是request header的话,不太确定... 12/06 21:41
6F:→ Atenp:但是网页server 不是我的 response header 不能改 12/06 23:33
7F:→ Atenp:还是说big5网页的内容注定不能parse....>"< 12/06 23:34
8F:→ weiyucsie:就是网页也不是你写的? 12/06 23:36
9F:→ Atenp:对 囧 12/07 11:52
11F:→ wxyy:看一下 overrideMimeType() 这个可以解决.... 12/10 19:32
12F:→ weiyucsie:原来是XMLHttpRequest2 12/10 23:07