作者KawasumiMai (魔物を討つ者)
看板PHP
標題[請益] 日文字串無法比對
時間Tue Oct 4 23:45:58 2011
如題
使用php抓取某html的html碼進行資料切割跟擷取
由於來源網站的緣故
header的charset必須要EUC-JP
否則會亂碼
接著抓取某資料是日文
echo的時候是那一串
結果當if($string=="日文")的時候
卻又沒有出現true的反應
原本以為是空白字元搞的鬼
因此使用echo substr從後面印出字串(負數)
並且得知一個日文字站了兩個字元
宣告-14印出7個日文字,確認無誤之後
再用if(substr($string,-14)=="七個日文字")
還是沒出現true的反應
請問是哪裡出了問題
編碼的原因嗎?
--
▼▼ ◥▇◣◣
▲◢◣▲ \ ╲ ◢◣▲ ◥█████◣ 川澄 舞
▲/‘ d▄▄▄◣ —
▲/‘ ─
◥██████▌ Kwawasumi Mai
▂▄▅▄■▄▄▄▄▄▆─
▼ ノ▅■ ───
▆██████
▇▆ ◢█▼ —
▇▆◢█▼ ──
◥██████ 力の覚醒.魔力放出
▲
▲ ▼▼ ◥██◤██▄
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.121.210.139
1F:→ davidou:要用ICONV試試看嗎? 我只是隨口提議的 10/05 00:04
2F:→ KawasumiMai:想寫成php(死 10/05 00:05
3F:→ chrisQQ:編碼不一樣,你在 php 裡面寫得應該是 utf8 所以不相等? 10/05 00:20
4F:→ chrisQQ:1樓說得應該是說,先用 iconv 轉成 utf8 之後在比對 10/05 00:20
5F:→ KawasumiMai:感謝樓上,真的有用QAQ 10/05 01:27
6F:→ KawasumiMai:$html = iconv('EUC-JP', 'UTF-8', $html); 10/05 01:28
7F:→ KawasumiMai:這樣就解決了 10/05 01:28