作者shadowjohn (某人睡醒就发文)
看板PHP
标题Re: [请益] curl抓回来的乱码问题
时间Tue Nov 18 11:06:34 2014
※ 引述《crossdunk (鲁来又鲁去)》之铭言:
: 是这样的
: 小弟最近在学curl,现在有个问题是
: 抓回来的东西出现确是乱码
: 我试过用别的编码方式,却都还是乱码
: 大概是像下面这样
: <a href="http://www.8591.com.tw/user-login.html">å·2 è2 ·åˆ°ç?</a>
: <a href="http://www.8591.com.tw/user-login.html">å·2 è3 £出ç</a>
: <a href="http://www.8591.com.tw/user-login.html">é2 è3 £å鄊: 我是以8591网站来做测试的
: 请问要如何知道他的编码是什麽来做转换呢?
: 我看他的表头是用UTF-8
: 我显示的方式也用UTF-8,却还是乱码
: 请各位先进给小弟一点指导
: 谢谢!
<?php
function utf8tobig5($str){
return mb_convert_encoding($str, 'BIG5', 'UTF-8');
}
$data =
file_get_contents("
http://www.8591.com.tw/wareList-sellList-22.html?searchServer=2031&searchType");
$data = utf8tobig5($data);
file_put_contents("a.txt",$data);
?>
产出来的a.txt在windows里用记事本看似乎ok~
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.134.48.253
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/PHP/M.1416279998.A.BE1.html
1F:推 crossdunk: 感谢您,测试後,存在txt是正常的(big5) 11/18 11:29
2F:→ crossdunk: 如果存在html就会是乱码,不论是big5或是utf8的编码 11/18 11:29
3F:推 crossdunk: 然後如果用phpquery 来抓我要的东西,存进txt後还是 11/18 11:37
4F:→ crossdunk: 乱码QQ 11/18 11:37
5F:推 InDer5566: 楼上 怎摩会呢???? 存进txt正常不是很OK吗@@ 11/20 20:36
6F:→ InDer5566: 不然你写一个display.html 读读看那个big的txt就好了 11/20 20:37
7F:→ InDer5566: 再把他转成utf8看看 哈哈 虽然我觉得应该不必要 11/20 20:37