AndroidDev 板


LINE

※ 引述《tripleleft (連續中離)》之銘言: : 最近因為某些軟體的風波 : 所以想自己寫個連接PTT的軟體 : 目前的寫法是開一個新的Thread跑socket : socket = new Socket(host, port); : : 然後參考版上讀取的方法 : in = new BufferedReader(new InputStreamReader(socket.getInputStream())); : in.readLine(); : 不過編碼一直出問題 : (使用String S = new String(in.readLine().getBytes(),"BIG5");) : 所以把他拆開來讀取 : byte[] data = in.readLine().getBytes(); : for迴圈跑S+= Byte.toString(data[num]) + ","; : 然後把他印出來 : System.out.println(S); : 然後就發現只要遇到中文字或全形符號他的編碼就會變成-17 -65 -67(0xEF 0xBF 0xBD) : (甚至不是偶數的倍數到底是怎麼回事) : 想問問到底是我寫的問題有問題還是我編碼的方式不對 new String(in.readLine().getBytes(),"BIG5"); 這行看起來沒什麼問題,可能要直接把原始的 bytes 印出來才知道為什麼不能轉。 byte[] byteArray = new byte[] {(byte) 0xA4, (byte) 0xA4}; try { String s = new String(byteArray, "Big5"); System.out.println(s); System.out.println("length of s: " + s.length()); } catch (UnsupportedEncodingException e) { } 上面可以印出: 中 1 參考 Big5 的 spec http://bit.ly/1GNtEO0 雙色字需要特別處理。 以上面「中」的編碼 0xA4A4 為例, 高位字節 A4 與低位字節 A4 在 Big5 的定義區間, 因此 new String(byteArray, "Big5") 這行會拿 0xA4A4 去 Big5 碼表查對應的字。 而雙色字,如「」,當程式在解析 byte array 時, 遇到第一個 0xA4,因為 0xA4 不在 ASCII 編碼中, 且符合 Big5 的高位字節, 所以預期下一個 byte 會符合 Big5 的低位字節。 但是下一個 byte 是 0x1B (ESC), 這不符合低位字節, 此時就會跳進特別的處理, 容錯率高一點的話, 他可能會把 0xA4 0x1B 當成兩個不可視的字元, 結果就是整個 array 轉完後,不會有「中」這個字。 嚴謹一點來看,0xA4 0x1B 既不是合法的 Big5 編碼,也不是合法的 ASCII 編碼, 因此發生 exception 也是很合理的。 此外雙色字並不存在於 Unicode 中也是一個問題。 new String(byteArray, "Big5") 這行會轉兩次碼, 第一次去查 0xA4A4 是什麼字,查到是「中」之後, 要作為 String 放在記憶體中, 此時會再查一次「中」在 Unicode 的編碼是什麼, 並在 String instance 中存入該 Unicode 編碼。 另外 Byte.toString(byteArray[i]) 這樣看不到是什麼字很正常, 因為這樣只是把 byte 轉成 10 進位的數字再轉成字串而已。 這樣不會把 0xA4A4 當成一個字,只會當成 2 個 byte。 -- http://changyuheng.github.io/ http://murmuring-on-the-air.github.io/ --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.141.120.55
※ 文章網址: https://webptt.com/m.aspx?n=bbs/AndroidDev/M.1435324839.A.441.html ※ 編輯: changyuheng (220.141.120.55), 06/26/2015 22:22:09
1F:推 tripleleft: 我了解在文字中間插入顏色的問題 不過我看一下登入畫 06/28 22:07
2F:→ tripleleft: 面 那張下雨的圖片沒有在全行字元中間插顏色 06/28 22:07
3F:→ tripleleft: 我把byte轉成string是因為他都是亂碼 所以我想直接看 06/28 22:08
4F:→ tripleleft: 十進制的狀態是怎麼樣(十六進制我有困難XD) 才能分析 06/28 22:09
5F:→ tripleleft: 問題 後來就是我發問的 所有中文字都會出現-17-65-67 06/28 22:10
6F:推 tripleleft: 現在是打算用JSch走SSH 06/28 22:13







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Soft_Job站內搜尋

TOP