作者albyu ()
看板Korea
标题Re: [提问] 关於韩国的一些问题?
时间Thu Sep 28 12:08:47 2006
※ 引述《rnw (06年恋上宝儿(BOA))》之铭言:
: 想请问一下,"韩文"为何称是"最有系统的文字"?
: 它有系统在那里呢??解说越详细越好!!
: 谢谢!!
: 一个韩文字占电脑几个位元呢?? 谢谢!!
这和编码技术有关,不同的编码方式所占的位元组数不同
一般讨论编码多以「位元组 byte」为单位,而不用「位元 bit」(1 byte = 8 bits)
韩文所使用的字符集的标准一般依据韩国产业规格 KS X 1001 (旧称 KSC 5601)
这个字符集标准,包括了拉丁希腊字母、日文假名、基里尔字母、韩文,以及汉字
而韩文字符集所使用的编码则有相当多种:EUC-KR, ISO-2002, UHC, UTF-8 等等
Extended Unix Code 中的 EUC-KR 使用 2 个位元组来编码韩文
ISO-2002-KR 使用跳逸字元方式编码,韩文部分一样是使用 2 个位元组来编码
Unified Hangul Code (UHC) 为微软设计的韩文编码,又称 CP949,一样是 2 位元组
上述皆是以 2 位元组方式编码韩文,而下面的则是属於变动长度的编码方式
Johab (组合) 编码,这是利用韩文字母组合成字的特色设计的编码方式
一个韩文字最少必须有二个字母,最多可以由六个字母构成
所以 Johab 编码韩文最少 2 bytes,最多 6 bytes
而 UTF-8 则是 Unicode 的编码方式之一,是一种可变长度的编码法
UTF-8 编码最少是 1 byte,最多可达 6 bytes
而韩文在 UTF-8 的区间主要是在 2 ~ 4 个位元组之内
以上大约是在韩国主要使用的编码方式,而在朝鲜官方也有自己的标准
朝鲜国家规格 KPS 9566 定义朝鲜文的字符集的编码方式
KPS 9566 早先主要使用 EUC-JP 进行编码,2003 年新版本则直接以字符集顺序编码
基本上 KPS 9566 和韩国的 KS X 1001 差异不大,韩文编码所使用的位元组为 2 bytes
: 还有,韩国有十二生肖这种东西吗?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.109.19.235
1F:推 kt0819:高手,邦推~~ 09/28 12:47
2F:推 s50342:髹o专业 09/28 12:58
3F:推 shialin:哇~~好专业的感觉..完全看不懂@@ 09/28 20:13
4F:推 windcaps:推啊...推一整个看不懂! 囧啊! 09/28 22:25