Linux 板


LINE

後來看懂了,說明放在最下面。 _____________________________________________________ 想寫一個小program,可以檢測某個ttf或otf檔(字型) 有沒有完整支援一段utf8編碼的字串 但我現在在看「fc-query xxx.ttf」出來的內容 在charset的部份,看起來是十六進位,但我沒辦法跟unicode編碼的十六進位 連結起來,以下是fc-query出來的部份片段 ﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ charset: 0000: ffffffff ffffffff ffffffff 7fffffff 00000000 ffffffff ffffffff ffffffff 0001: 0c0f000f 00000f00 000cf198 00003f00 00040000 00018003 1fffe000 03000000 0002: 00000000 00000000 00020000 00000002 00000000 00000000 02000e80 00000000 0003: 00000000 00000000 00000000 00000000 fffe0000 fffe03fb 000003fb 00000000 0004: ffff0002 ffffffff 0002ffff 00000000 00000000 00000000 00000000 00000000 然後我找到一篇文章,底下的解答有如何看是否有對應charset ﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ It shows the supported character ranges, although it doesn't which block it belongs to (you have to know which range belongs to which block). For example, the fourth column of 0000, which corresponds to U+0060 - U+007F, has a hex value of 7fffffff. This has a bit value of 0111 1111 1111 1111 1111 1111 1111 1111 , where the right most bit is U+0060, and the left most is U+007F. This means that U+007F is not supported in this font. ﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 但我還是不懂,他如何看出0000那行的第四欄是介於unicode編碼的U+0060 ~U+007F 那其他行跟其他欄是要如何跟unicode編碼對應? ﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 說明: utf8最廣泛的是1到3 byte,所以以3 byte來說,範例中的每一row(0000,0001,0002....) 的開頭(冒號左邊)代表3 byte中的前2 byte開頭,冒號右邊的八組column 代表剩下1 byte的16*16個尾數(ex. 0000 row 是從000000到0000ff) 所以每個column負責32個尾數,而如果把每個column decode 到二進位 就有32個二進位值,例如row 0000的第四欄7fffffff的二進位就是 0111-1111-1111-1111-1111-1111-1111-1111,這是從000060 ~ 00007f 代表000060到00007e都有這個字型,但最左邊的0(from 0111)代表00007f沒支援 沒錯,是從右邊數來,到左邊最大值,最右邊是000060,最左是00007f --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.133.16.181
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Linux/M.1467365097.A.F97.html ※ 編輯: hn12404988 (220.133.16.181), 07/01/2016 20:27:04 ※ 編輯: hn12404988 (220.133.16.181), 07/01/2016 22:47:34
1F:推 wgst88w: 那the right most bit's column of 1111~0110 之間是否也 07/02 09:23
2F:→ wgst88w: 屬於 U+0060 呢? 07/02 09:25
3F:→ EdwardGJLee: 安裝 fonttools/TTX dump 出 cmap table 然後去分析 07/02 10:46
4F:→ EdwardGJLee: 或自行寫個 python 小程式去判斷(用 fonttools)。 07/02 10:47
5F:→ EdwardGJLee: 或有安裝 fontforge 的話,寫個 fontforge script。 07/02 10:48
6F:推 wgst88w: 疑=.=?等等,冒號左邊 : 冒號右邊...你冒號是不是沒標! 07/02 14:43
7F:推 wgst88w: 痾~~看懂了ex. FFFF(前2byte):32個ff 是這樣吧,唉~~~~ 07/02 15:11
8F:→ EdwardGJLee: fc-query 對 charset 的判斷並不可靠。 07/02 15:37
9F:→ hn12404988: 對,後來我實際使用了幾個中文字檢查了幾個檔案 07/02 18:05
10F:→ hn12404988: 發現charset提供的資訊有一定機率的失誤 07/02 18:06
11F:→ hn12404988: 後來就使用freetype library來解決這問題了 07/02 18:06
12F:→ EdwardGJLee: 要用 c 寫的話,一些地方要自己刻。FT2 對字型操作 07/02 19:34
13F:→ EdwardGJLee: 相當陽春。 07/02 19:34







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Tech_Job站內搜尋

TOP