Linux 板


LINE

後来看懂了,说明放在最下面。 _____________________________________________________ 想写一个小program,可以检测某个ttf或otf档(字型) 有没有完整支援一段utf8编码的字串 但我现在在看「fc-query xxx.ttf」出来的内容 在charset的部份,看起来是十六进位,但我没办法跟unicode编码的十六进位 连结起来,以下是fc-query出来的部份片段 ﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ charset: 0000: ffffffff ffffffff ffffffff 7fffffff 00000000 ffffffff ffffffff ffffffff 0001: 0c0f000f 00000f00 000cf198 00003f00 00040000 00018003 1fffe000 03000000 0002: 00000000 00000000 00020000 00000002 00000000 00000000 02000e80 00000000 0003: 00000000 00000000 00000000 00000000 fffe0000 fffe03fb 000003fb 00000000 0004: ffff0002 ffffffff 0002ffff 00000000 00000000 00000000 00000000 00000000 然後我找到一篇文章,底下的解答有如何看是否有对应charset ﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ It shows the supported character ranges, although it doesn't which block it belongs to (you have to know which range belongs to which block). For example, the fourth column of 0000, which corresponds to U+0060 - U+007F, has a hex value of 7fffffff. This has a bit value of 0111 1111 1111 1111 1111 1111 1111 1111 , where the right most bit is U+0060, and the left most is U+007F. This means that U+007F is not supported in this font. ﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 但我还是不懂,他如何看出0000那行的第四栏是介於unicode编码的U+0060 ~U+007F 那其他行跟其他栏是要如何跟unicode编码对应? ﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 说明: utf8最广泛的是1到3 byte,所以以3 byte来说,范例中的每一row(0000,0001,0002....) 的开头(冒号左边)代表3 byte中的前2 byte开头,冒号右边的八组column 代表剩下1 byte的16*16个尾数(ex. 0000 row 是从000000到0000ff) 所以每个column负责32个尾数,而如果把每个column decode 到二进位 就有32个二进位值,例如row 0000的第四栏7fffffff的二进位就是 0111-1111-1111-1111-1111-1111-1111-1111,这是从000060 ~ 00007f 代表000060到00007e都有这个字型,但最左边的0(from 0111)代表00007f没支援 没错,是从右边数来,到左边最大值,最右边是000060,最左是00007f --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.133.16.181
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Linux/M.1467365097.A.F97.html ※ 编辑: hn12404988 (220.133.16.181), 07/01/2016 20:27:04 ※ 编辑: hn12404988 (220.133.16.181), 07/01/2016 22:47:34
1F:推 wgst88w: 那the right most bit's column of 1111~0110 之间是否也 07/02 09:23
2F:→ wgst88w: 属於 U+0060 呢? 07/02 09:25
3F:→ EdwardGJLee: 安装 fonttools/TTX dump 出 cmap table 然後去分析 07/02 10:46
4F:→ EdwardGJLee: 或自行写个 python 小程式去判断(用 fonttools)。 07/02 10:47
5F:→ EdwardGJLee: 或有安装 fontforge 的话,写个 fontforge script。 07/02 10:48
6F:推 wgst88w: 疑=.=?等等,冒号左边 : 冒号右边...你冒号是不是没标! 07/02 14:43
7F:推 wgst88w: 痾~~看懂了ex. FFFF(前2byte):32个ff 是这样吧,唉~~~~ 07/02 15:11
8F:→ EdwardGJLee: fc-query 对 charset 的判断并不可靠。 07/02 15:37
9F:→ hn12404988: 对,後来我实际使用了几个中文字检查了几个档案 07/02 18:05
10F:→ hn12404988: 发现charset提供的资讯有一定机率的失误 07/02 18:06
11F:→ hn12404988: 後来就使用freetype library来解决这问题了 07/02 18:06
12F:→ EdwardGJLee: 要用 c 写的话,一些地方要自己刻。FT2 对字型操作 07/02 19:34
13F:→ EdwardGJLee: 相当阳春。 07/02 19:34







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Soft_Job站内搜寻

TOP