作者polyhedron (古韵~zh.wikipedia.org)
看板TW-language
标题广韵全字表及输入法
时间Thu Sep 8 20:25:11 2005
(跟诸位繁体中文系统使用者说一下﹐因为有转码问题﹐
bbs上有些文本会让人很疑惑﹐这个说明以压缩包里面的为准。
另外我不确定这两个输入法是否适用於繁体中文的windows系统﹐
如果有人愿意试验﹐请把结果告诉我﹐不胜感激﹗)
本压缩包包括《广韵》字数据库、中古汉语全拼及三拼输入法。
下载地址为﹕
http://www.newsmth.net/bbscon.php?bid=203&id=41087&ap=8085
本压缩包含有以下文件﹕
*Readme.txt //本文
*广韵.xls //数据库﹐含拼音查询
*中古汉语拼音v1.23.txt //拼音方案介绍
*MOCQP.MB //中古汉语全拼v1.23版输入法码表
*MOCSP.MB //中古汉语三拼输入法v2.0码表
*MOCQP.txt //中古汉语全拼v1.23版输入法字表
*MOCSP.txt //中古汉语三拼输入法v2.0字表
*中古三拼方案v2.0.xls //中古汉语三拼输入法编码方案
*MOC.bmp //位图文件﹐20*20﹐16色
本数据包内所有内容可以自由复制、传播、修改﹐但禁止用於一切赢利目的。
===================广韵数据库凡例====================
1.广韵数据库由
[email protected]制作小韵﹐
[email protected]填充汉字并校对。本凡例由
[email protected]编写。
2.数据库以周祖谟着《广韵校本》(北京市中华书局﹐2004年6月第三版)为底本。因周氏在着作该书时﹐已以张士俊泽存堂本广韵为底本﹐并参校以傅氏双监楼及日本金泽文库所藏北宋刻本、黎刻古逸丛书本和曹刻楝亭五种本﹐故在制作数据库时﹐不再参校他本。
3.“序号”是各小韵在《广韵》中的总序号。
4.极个别小韵没有切语﹐而是以某韵声转的方式注明读音﹐或阙如﹐“切语”一栏中一律空缺不填。对於有误的切语﹐本数据库中不加说明﹐径改为正确的切语。
5.关於本数据库使用的字库﹕
A.为照顾尽可能多的使用者﹐本表字符集选用GBK字库﹐而未选用GB18030字库或更新的扩展字库。
B.对於GBK字库中没有的字﹐按如下的描述法描述(为方便起见﹐下文中举例所用字﹐均为GBK字库中的汉字﹐这些字在数据库中并不必此列描述法描述)﹕
a)凡GBK字库中没有的字﹐均用[ ]号括起。[ ]中是描述表达式﹐由偏旁字符和结构运算符组成。偏旁字符均采用GBK字库中的字符﹐包括GBK汉字与个别注音符号、日文片假名和全角制表符。如蚩=[ㄓ/虫]﹐ㄓ虽是注音符号﹐但因GBK汉字中没有形状类同的字﹐故也作为偏旁字符采用。
b)结构运算符有/﹐\﹐@﹐$﹐^﹐v﹐|﹐-﹐( )和{ }十个﹐均采用半角字符。另采用半角数字作为补充说明符。
c)如果两个或两个以上偏旁字符之间无结构运算符﹐表示这几个偏旁字符左右排列。如明=[日月]﹐萍=[艹/□平]﹐贺=[力口/贝]﹐嚣=[口口/页/口口]。
d)/表示上下关系﹐如花=[艹/化]。
e)\也表示上下关系﹐但其前後各偏旁字符中心纵笔上下要相连为一笔﹐如果=[田\木](区别於男=[田/力])﹔
f)@表示包围关系﹐包括全包围(围=[囗@韦])、下开口三包围(开=门@开)、上开口三包围(凶=[凵@乂])、右开口三包围(区=[匚@品])、左开口三包围(□=[□@一])、左上半包围(库=[广@车])、右上半包围(气=[气@米])、左下半包围(赶=[走@旱])、右下半包围、左右夹中(仅用於用臼代表像舆或盥上部的左右两部分字形﹐如舆=[臼@车/一/八]﹐盥=[臼@水/皿])、上下夹中(主要用於以衣为部首的字﹐如裹=[衣@果])等几种具体情况。但为直观起见﹐左右是“行”的偏旁和汉字不作为包围型看待﹐而是作为左右型看待﹐如衍=[彳□亍]﹐≠[行@□]。
g)$表示相互包围关系﹐如包=[□$巳](区别於旬=[□@日])。
h)A^B^C表示A和C分别位於B的左肩和右肩﹔AvBvC表示A和C分别位於B的左腋和右腋﹐A|B|C表示A和C分别位於B的左腰和右腰﹐如坐=[人^土^人]﹐茧=[艹/□v(□@|)v虫]﹐来=[人|木|人]。
i)用-表示剔除关系﹐如虍=[虎-几]﹔如果一个字中有几个相同部分﹐而只去掉其中一个﹐则再在剔除的偏旁字符後加上半角数字表示次序﹐如只=[祗-□3]﹔剔除後的偏旁如果能单独成字﹐要求尽量与原字音同﹐如垂=[棰-木]﹐≠[睡-目]。
j)对於以上方法都不能准确描述的复杂汉字﹐还可再用{ }括起说明语附在需要补充说明其字形的结构後面﹐如[邑{反}](表示此字字形与邑字左右相反)﹐[予{倒}](表示此字字形与予字上下颠倒﹐即旋转了180度)。在能够设置颜色的场合﹐还可以再把整个描述表达式连同[ ]号一同置为绿色﹐以示强调。
k)遇到由多个偏旁字符组成的汉字﹐上述符号可以混合使用﹐优先级顺序是﹕{ }﹐无结构运算符﹐-﹐^或v或|﹐@或$﹐\﹐/。需要改变优先级顺序时﹐用( )号。如荆=[(艹/开)□]﹐而荆=[艹/开□]。有时为直观起见﹐也可以使用额外的( )号。如荆也可以表示为[艹/(开□)]。
l)为严谨起见﹐形声字尽量分开音符和意符﹐如捌=[□别]﹐≠[拐□]。
m)在一个字有几种描述方法时﹐采用最短的描述表达式﹐如哉=[呋@口]﹐≠[载-车@口]。如果几种描述表达式等长﹐尽量不采用含-的描述表达式﹐如□=[山/厂]﹐≠[岸-干]。
C.因GBK字库是以大陆简化字字形为主的字库﹐故本数据库宜在简化字显示方式下观看﹔在繁体字显示方式下﹐一些简化字字形显示不正常。如广与广本是两个字﹐後者简化为前者﹔在繁体字显示方式下﹐二者会混而无别。此外﹐为直观起见﹐本数据库使用了部分CJK扩展字符﹐如啉、槞等﹐在非GB码显示方式下﹐也可能会显示不正常。
6.对周祖谟在《广韵校本》一书中校出的讹误的字形﹐绝大多数都按周氏的校勘记改正。个别GBK字库中收入﹐而周氏认为讹误的字形﹐依情况改正或不改。另有个别周氏未校正的讹误字形﹐亦均改正。凡改正的字﹐均置为红色﹐以示强调。需要说明的是﹐这些讹误的字形是相对於周氏采用的张士俊泽存堂本广韵而言﹔如以他本为底本﹐则可能出现字形未讹误的字却被置为红色﹐或字形有讹误的字却未被置为红色的情况。
7.对和正体不同的异体字形(包括异体字、新旧字形和其他一些更细微的差别)﹐按下面的方法处理﹕
a)如果该异体字形存在於GBK字库中﹐则照录﹐如吴﹔但以该异体字形为偏旁的字﹐如不存在於GBK字库中﹐则不录﹐如蜈不作[虫吴]﹔如正体也不存在於GBK字库中﹐仍照异体字形描述﹐如[王吴]﹔
b)如果涉及到整个汉字结构的变化﹐则按异体字形描述﹐如[鼠@冬](即鼨字)﹐[鸟庸](即鷛字)﹔
c)如果涉及到笔数的增减﹐一般要按异体字形描述﹐如[□幵](即汧字)﹔
d)如果不涉及笔数的增减﹐一般不按异体字形描述﹐如空字不作[□/儿/工]﹔
e)如果异体字形更对应於小篆字形﹐则按异体字形描述﹐否则﹐就不按异体字形描述。如卑﹐不作[卑-□1]﹔
f)避讳字都恢复正字。
8.当异体字形的正体存在於GBK字库中时﹐用( )号注明在异体字形之後﹐以便於检索﹐如□﹐後注(聪)。广韵中在某字的注释中给出的异体字﹐如存在於GBK字库中时﹐也用( )号注明。此外﹐数据库中也酌收了一些常见的、广韵未收入或注释的後起异体字﹐亦用( )号注明。
9.《广韵》中的小韵字数统计有误时﹐也用红色表示订正後的字数。
=================中古拼音和输入法说明=================
中古汉语拼音v1.23及输入法由
[email protected]制作。尽管该方案的设计有少数拟音的考虑﹐但方案设计时﹐一个字母在不同韵中可有不同发音﹐即高度简并﹐所以各人可按照自己拟音来读。同样﹐四个次入韵的-d不□明是塞音尾﹐二等字的-r-也不代表发音包含颤音﹐只是标记。具体参见“中古汉语拼音v1.23.txt”。
中古汉语三拼方案v2.0及输入法由
[email protected]制作。三拼方案和中古拼音没有直接联系﹐只要熟悉每个字的声、韵、调﹐并记住键位﹐不须了解拼音方案也可进行输入。在“中古三拼方案v2.0.xls”第四页中有键盘图﹐可以打印。
唇音字尽管大体没有开合口的区分﹐在拼音及三拼方案中为方便起见﹐开合口分韵的及轻唇韵采用合口﹐开合口不分的一等韵﹐重唇三等韵﹐以及所有二四等韵采用开口。在拼音方案中﹐为了用仅有的6个元音字母解决所有韵母问题﹐按照韵图﹐东一、东三采用开口﹐冬、锺采用合口。这不代表作者认为两组的差别在於开合口。而在三拼方案中﹐由於-ng尾韵过多﹐冬、东三采用和东一、锺相同的中码并使用-m尾韵的末码。这也不说明输入法作者认同冬、东三在中古时读为-m尾。类似地﹐脂韵的末码同-i尾韵。
目前的输入法只包括《广韵》中的UTF-8编码内的汉字。广韵之外的字(除在“广韵.xls”中圆括弧中的字)以及编码中没有的组合字未加入输入法。
目前两种输入法仅有单字﹐没有词。我们考虑在以後添加词组和广韵中未收录的字﹐以及在新的编码更通用後收入非UTF-8的汉字。
=====================输入法安装====================
在Windows系统中可以使用系统自带的“输入法编辑器”(imegen.exe)(通常在\system32目录的子目录内﹐可能为隐含目录)﹐按“浏览”打开两个*.txt文件﹐按“转换”生成码表文件*.mb并按“创建”安装输入法。“转换”时询问“是否编入所有GBK字符”选“否”。安装时可使用压缩包内的MOC.bmp作为图标。利用输入法编辑器也可以修改输入法的词表、构词方法等。具体可参见输入法编辑器的帮助文件。
如果出现不能安装的提示﹐可尝试改短输入法名称及“创建”时的机构名称。如果仍然无法安装﹐可采用以下偷梁换柱的办法﹕
在\Windows\system32\(依使用Windows系统版本不同自行查找)目录下会找到几个*.mb文件﹐如winpy.mb(汉语拼音全拼)、winsp.mb(汉语拼音双拼)、winzm.mb(郑码)等。选择一个平时不用的输入法﹐改名另存﹐将包内的MOCQP.MB(中古汉语全拼)或MOCSP.MB(中古汉语三拼)复制到此目录并改名为被改掉的原文件名。随後通过控制面板或在输入条按右键﹐进入“文字服务和输入语言”﹐添加相应被改掉的输入法即可完成安装。
========================联系=======================
若对数据库和拼音、输入法有任何问题或建议﹐请莅临bbs水木社区(www.newsmth.net)Linguistics(语言与语言学)板面﹐或者写信给﹕biopolyhedron在hotmail点com及zhugeheng在hotmail点com。
2005-09-08
--
自制中古汉语拼音(1.23版)
零leng 一qjit 二njiih 三sam 四siih 五ngox 六liuk 七chit 八pret 九kiux
十zjip 百prak 千chen 万myanh 亿qik 兆drieux 京kieng
甲krap 乙qit 丙piengx 丁teng 戊muh 己kix 庚krang 辛sin 壬njim 癸kjyix
子cix 丑thriux 寅jin 卯mraux 辰zjin 巳zsix 午ngox 未myoih 申sjin 酉jux
戌syt 亥ghaix
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 221.218.70.189
1F:推 chenpeishin:'营'利目的 联'系' 134.208.34.139 09/08
2F:推 polyhedron:羞。。。多谢指正 61.49.122.27 09/08
3F:推 mapleflute:签名档是上古汉语吧 05/07 10:46