作者KawasumiMai (魔物を讨つ者)
看板PHP
标题[请益] 日文字串无法比对
时间Tue Oct 4 23:45:58 2011
如题
使用php抓取某html的html码进行资料切割跟撷取
由於来源网站的缘故
header的charset必须要EUC-JP
否则会乱码
接着抓取某资料是日文
echo的时候是那一串
结果当if($string=="日文")的时候
却又没有出现true的反应
原本以为是空白字元搞的鬼
因此使用echo substr从後面印出字串(负数)
并且得知一个日文字站了两个字元
宣告-14印出7个日文字,确认无误之後
再用if(substr($string,-14)=="七个日文字")
还是没出现true的反应
请问是哪里出了问题
编码的原因吗?
--
▼▼ ◥▇◣◣
▲◢◣▲ \ ╲ ◢◣▲ ◥█████◣ 川澄 舞
▲/‘ d▄▄▄◣ —
▲/‘ ─
◥██████▌ Kwawasumi Mai
▂▄▅▄■▄▄▄▄▄▆─
▼ ノ▅■ ───
▆██████
▇▆ ◢█▼ —
▇▆◢█▼ ──
◥██████ 力の覚醒.魔力放出
▲
▲ ▼▼ ◥██◤██▄
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.121.210.139
1F:→ davidou:要用ICONV试试看吗? 我只是随口提议的 10/05 00:04
2F:→ KawasumiMai:想写成php(死 10/05 00:05
3F:→ chrisQQ:编码不一样,你在 php 里面写得应该是 utf8 所以不相等? 10/05 00:20
4F:→ chrisQQ:1楼说得应该是说,先用 iconv 转成 utf8 之後在比对 10/05 00:20
5F:→ KawasumiMai:感谢楼上,真的有用QAQ 10/05 01:27
6F:→ KawasumiMai:$html = iconv('EUC-JP', 'UTF-8', $html); 10/05 01:28
7F:→ KawasumiMai:这样就解决了 10/05 01:28