作者weiclin (CC)
看板PHP
标题Re: [请益] MIME编码转换问题…
时间Sun Apr 10 10:25:43 2016
※ 引述《banana2014 (香蕉共和国)》之铭言:
: http://test.red-whale.com.tw/imap_utf8.phps
: 照理来讲上面应该要印出:
: 「高雄市政府线上即时服务系统通知(本信件系系统自动发送,请勿直接回覆)」
: 但是却印出一个不完整的字串:
: 「高雄市政府线上即时服**t统通知(本信件系系统*菾妗o送,请勿直接回覆)」
: (*代表印不出来的字)
: -------------------
: 请问如何解决以上问题?
: 谢谢
这个小小有趣, 你的原始程式是:
$k = "=?big5?Q?=B0=AA=B6=AF=A5=AB=ACF=A9=B2=BDu=A4W=A7Y=AE=C9=AAA=B0?="
. " =?big5?Q?=C8=A8t=B2=CE=B3q=AA=BE=28=A5=BB=ABH=A5=F3=ABY=A8t=B2=CE=A6?="
. " =?big5?Q?=DB=B0=CA=B5o=B0e=A1A=BD=D0=A4=C5=AA=BD=B1=B5=A6=5E=C2=D0=29?=";
echo imap_utf8($k);
字串被拆成三个 QP encoding, 第一个的长度是 21 Bytes
而 big5 一个字是双Bytes, 也就是你有一个字被拆到两个 QP encoding 去了
这其实不是什麽问题, 反正 decode 之後又会被黏回去了, 根本没影响
出问题的地方在於你把他转成 utf8 了...
"我猜" imap_utf8 应该是把个别 QP encoding 还原後, 先转成 utf8 再黏起来
所以你那被切开的半个字就回不去了
如果稍微调整一下, 把被切开的字归放到正确的位置
这样子就能够正确的印出你想要的东西了
注意你有单 Byte 的字元在里面, 所以没办法单纯根据奇数或偶数来判断
$ok = "=?big5?Q?=B0=AA=B6=AF=A5=AB=ACF=A9=B2=BDu=A4W=A7Y=AE=C9=AAA?="
. " =?big5?Q?=B0=C8=A8t=B2=CE=B3q=AA=BE=28=A5=BB=ABH=A5=F3=ABY=A8t=B2=CE?="
. " =?big5?Q?=A6=DB=B0=CA=B5o=B0e=A1A=BD=D0=A4=C5=AA=BD=B1=B5=A6=5E=C2=D0=29?=";
echo imap_utf8($ok);
那...总不可能每次都手动调整吧?
讲了这麽多理论, 就是要让你知道, 先还原成完整的 big5 字串再转 utf8 即可
$srcText = "";
$charset = "auto";
foreach(imap_mime_header_decode($k) as $v) {
$srcText .= $v->text;
$charset = $v->charset !== "default" ? $v->charset : $charset;
}
echo mb_convert_encoding($srcText, "UTF-8", $charset);
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 210.68.230.200
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/PHP/M.1460255145.A.54A.html
1F:推 MangoTW: 推专业解说 04/10 11:40
2F:推 banana2014: 非常感谢您,请问其它语言的编码也是用这种方法去分 04/10 13:25
3F:→ banana2014: 解并转成utf-8吗?真的很感谢您的回答! 04/10 13:25
4F:→ weiclin: 这应该是通用的方法喔,顶多再注意一下charset有没有变 04/11 00:00
5F:推 banana2014: 真心感谢 04/11 08:12