作者HZYSoft (PCMan 2007)
看板EZsoft
标题Re: [心得] Unicode 补完计画 (UAO)
时间Sat Nov 3 10:52:12 2007
※ 引述《mstar (Wayne Su)》之铭言:
: : 推 sicao:请问有没有UTF-8跟unicode跟UTF-16等一干差别? 11/02 21:08
: Unicode:
: 前述的 U+xxxx 只是编号方式,实际的「编码」有很多,
基本上就是「一个 unicode 各自表述」
同一个 unicode 字元,实际使用时,可以用不同的编码方式来表示
: 目前常见的是 UTF8、UTF16、UTF32 几种
: UTF8:
: 这个编码方式的特色就是针对不同种类的字元使用不同的 byte 数
不正确,UTF16 也是使用不同 byte 数,只是大部份是 16 位元
加上 Windows 比较旧的版本也只支援固定 16 位元,造成很多人以为
UTF-16 或是 unicode 就都是 16 bits,固定 2 位元组,但这并不正确
UTF-8 真正的特色是,过去的 ANSI 程式不用做修改,可以直接相容 UTF-8
并且没有 byte order 问题,这两件事情才是他主要最重要的特色。
其他的 UTF16LE, UTF16BE 等都需要旧程式大幅度的修改
并且在不同平台上会有 byte order 的问题,所以不难看出 UTF-8 编码
为何会最受欢迎,并且被广为使用。
目前 Linux 系统上几乎都采用 UTF-8 编码,网页作者也喜欢用 UTF-8
但很不幸的是,微软的 Windows 系统全面都使用 UTF-16 LE
并且在 Windows 98 以前完全没有 UTF-8 的支援
即使到目前的 Vista 还是使用 UTF-16LE,而且仍然没有支援完整
所以 Windows 程式要支援 unicode,如果原先设计没考量到,会需要大幅度的修改
相形之下,Linux 下的软体几乎只需要细微的修改,都可以直接支援 UTF-8
--
个人网页:
http://pcman.sayya.org/ 上面有自画像及各种联络资讯
PCMan 全系列 BBS 连线软体
http://pcman.ptt.cc/ http://pcmanx.csie.net/
新酷音输入法 for Windows
http://chewing.csie.net/
IE Tab Firefox plugin/extension
http://ietab.mozdev.org/
PCMan 油画作品集:
http://www.wretch.cc/album/album.php?id=pcman&book=1
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 163.29.223.22
1F:推 albb0920:PCMan大耶....... 11/03 11:26
2F:推 roaerwang:好久不见的PCMan大耶…… 11/03 17:31
3F:推 alicekey:pcman这两个月都有发文阿,有没有这麽夸张.. 11/03 23:06