作者jimshsu (jims)
看板PHP
标题[请益] 转换XML档案编码的问题
时间Thu Nov 30 11:19:41 2006
想请教各位一个问题
最近要处理一堆别人建立好的XML档
原先以为utf-8格式没问题
结果拿到资料就傻眼了~档案是utf-8没错
但是所有中文字都变成HTML-ENTITIES
ex:<title>鴛鴦湖森林</....
我原先要把资料读进mysql的
而且xml原始档还要可以让人阅读
因为有上千笔档案..所以我无法一个个从浏览器贴到剪贴簿
请问我要用什麽方式把中文转换成utf-8而且不影响xml的tag?
感激不尽
************************************测试结果
依造superGA建议--我试着这样做..
$xml_file = "big.xml";(//原始的XML档案.产生档案的软体把中文都变成"HTML-ENTITIES)
define("out","utf.xml");//输出档案
$xml_meta = new DomDocument;
$xml_meta->load($xml_file);
$t = html_entity_decode($xml_meta->saveXML(),ENT_NOQUOTES,"UTF-8");
$xml = new DomDocument;
$xml->loadXML($t);
$xml->save(out);
*****************************
结果...还是不行
上面程式我如果列印$t的结果..在浏览器是中文(因为浏览器自动转换了)
但是把那字串输出到档案..我用笔记本打开还是HTML-ENTITIES
请问我哪里写错了吗?~~为何html_entity_decode没有作用呢?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
1F:推 johnney:试试看用记事本另存新档选择编码为 utf-8 11/30 11:43
2F:推 superGA:html_entity_decode() 11/30 12:28
※ 编辑: jimshsu 来自: 134.208.7.229 (11/30 14:48)