作者polyhedron (古韻~zh.wikipedia.org)
看板TW-language
標題廣韻全字表及輸入法
時間Thu Sep 8 20:25:11 2005
(跟諸位繁體中文系統使用者說一下﹐因為有轉碼問題﹐
bbs上有些文本會讓人很疑惑﹐這個說明以壓縮包裏面的為準。
另外我不確定這兩個輸入法是否適用於繁體中文的windows系統﹐
如果有人願意試驗﹐請把結果告訴我﹐不勝感激﹗)
本壓縮包包括《廣韻》字數據庫、中古漢語全拼及三拼輸入法。
下載地址為﹕
http://www.newsmth.net/bbscon.php?bid=203&id=41087&ap=8085
本壓縮包含有以下文件﹕
*Readme.txt //本文
*廣韻.xls //數據庫﹐含拼音查詢
*中古漢語拼音v1.23.txt //拼音方案介紹
*MOCQP.MB //中古漢語全拼v1.23版輸入法碼表
*MOCSP.MB //中古漢語三拼輸入法v2.0碼表
*MOCQP.txt //中古漢語全拼v1.23版輸入法字表
*MOCSP.txt //中古漢語三拼輸入法v2.0字表
*中古三拼方案v2.0.xls //中古漢語三拼輸入法編碼方案
*MOC.bmp //位圖文件﹐20*20﹐16色
本數據包內所有內容可以自由複製、傳播、修改﹐但禁止用於一切贏利目的。
===================廣韻數據庫凡例====================
1.廣韻數據庫由
[email protected]製作小韻﹐
[email protected]填充漢字並校對。本凡例由
[email protected]編寫。
2.數據庫以周祖謨著《廣韻校本》(北京市中華書局﹐2004年6月第三版)為底本。因周氏在著作該書時﹐已以張士俊澤存堂本廣韻為底本﹐並參校以傅氏雙鑑樓及日本金澤文庫所藏北宋刻本、黎刻古逸叢書本和曹刻楝亭五種本﹐故在製作數據庫時﹐不再參校他本。
3.“序號”是各小韻在《廣韻》中的總序號。
4.極個別小韻沒有切語﹐而是以某韻聲轉的方式註明讀音﹐或闕如﹐“切語”一欄中一律空缺不填。對於有誤的切語﹐本數據庫中不加說明﹐徑改為正確的切語。
5.關於本數據庫使用的字庫﹕
A.為照顧盡可能多的使用者﹐本表字符集選用GBK字庫﹐而未選用GB18030字庫或更新的擴展字庫。
B.對於GBK字庫中沒有的字﹐按如下的描述法描述(為方便起見﹐下文中舉例所用字﹐均為GBK字庫中的漢字﹐這些字在數據庫中並不必此列描述法描述)﹕
a)凡GBK字庫中沒有的字﹐均用[ ]號括起。[ ]中是描述表達式﹐由偏旁字符和結構運算符組成。偏旁字符均採用GBK字庫中的字符﹐包括GBK漢字與個別註音符號、日文片假名和全角製表符。如蚩=[ㄓ/蟲]﹐ㄓ雖是註音符號﹐但因GBK漢字中沒有形狀類同的字﹐故也作為偏旁字符採用。
b)結構運算符有/﹐\﹐@﹐$﹐^﹐v﹐|﹐-﹐( )和{ }十個﹐均採用半角字符。另採用半角數字作為補充說明符。
c)如果兩個或兩個以上偏旁字符之間無結構運算符﹐表示這幾個偏旁字符左右排列。如明=[日月]﹐萍=[艸/□平]﹐賀=[力口/貝]﹐囂=[口口/頁/口口]。
d)/表示上下關係﹐如花=[艸/化]。
e)\也表示上下關係﹐但其前後各偏旁字符中心縱筆上下要相連為一筆﹐如果=[田\木](區別於男=[田/力])﹔
f)@表示包圍關係﹐包括全包圍(圍=[囗@韋])、下開口三包圍(開=門@開)、上開口三包圍(兇=[凵@乂])、右開口三包圍(區=[匚@品])、左開口三包圍(□=[□@一])、左上半包圍(庫=[廣@車])、右上半包圍(氣=[氣@米])、左下半包圍(趕=[走@旱])、右下半包圍、左右夾中(僅用於用臼代表像輿或盥上部的左右兩部分字形﹐如輿=[臼@車/一/八]﹐盥=[臼@水/皿])、上下夾中(主要用於以衣為部首的字﹐如裹=[衣@果])等幾種具體情況。但為直觀起見﹐左右是“行”的偏旁和漢字不作為包圍型看待﹐而是作為左右型看待﹐如衍=[彳□亍]﹐≠[行@□]。
g)$表示相互包圍關係﹐如包=[□$巳](區別於旬=[□@日])。
h)A^B^C表示A和C分別位於B的左肩和右肩﹔AvBvC表示A和C分別位於B的左腋和右腋﹐A|B|C表示A和C分別位於B的左腰和右腰﹐如坐=[人^土^人]﹐繭=[艸/□v(□@|)v蟲]﹐來=[人|木|人]。
i)用-表示剔除關係﹐如虍=[虎-幾]﹔如果一個字中有幾個相同部分﹐而祇去掉其中一個﹐則再在剔除的偏旁字符後加上半角數字表示次序﹐如祇=[祗-□3]﹔剔除後的偏旁如果能單獨成字﹐要求盡量與原字音同﹐如垂=[棰-木]﹐≠[睡-目]。
j)對於以上方法都不能準確描述的複雜漢字﹐還可再用{ }括起說明語附在需要補充說明其字形的結構後面﹐如[邑{反}](表示此字字形與邑字左右相反)﹐[予{倒}](表示此字字形與予字上下顛倒﹐即旋轉了180度)。在能夠設置顏色的場合﹐還可以再把整個描述表達式連同[ ]號一同置為綠色﹐以示強調。
k)遇到由多個偏旁字符組成的漢字﹐上述符號可以混合使用﹐優先級順序是﹕{ }﹐無結構運算符﹐-﹐^或v或|﹐@或$﹐\﹐/。需要改變優先級順序時﹐用( )號。如荊=[(艸/開)□]﹐而荊=[艸/開□]。有時為直觀起見﹐也可以使用額外的( )號。如荊也可以表示為[艸/(開□)]。
l)為嚴謹起見﹐形聲字盡量分開音符和意符﹐如捌=[□別]﹐≠[拐□]。
m)在一個字有幾種描述方法時﹐採用最短的描述表達式﹐如哉=[呋@口]﹐≠[載-車@口]。如果幾種描述表達式等長﹐盡量不採用含-的描述表達式﹐如□=[山/廠]﹐≠[岸-幹]。
C.因GBK字庫是以大陸簡化字字形為主的字庫﹐故本數據庫宜在簡化字顯示方式下觀看﹔在繁體字顯示方式下﹐一些簡化字字形顯示不正常。如廣與廣本是兩個字﹐後者簡化為前者﹔在繁體字顯示方式下﹐二者會混而無別。此外﹐為直觀起見﹐本數據庫使用了部分CJK擴展字符﹐如啉、槞等﹐在非GB碼顯示方式下﹐也可能會顯示不正常。
6.對周祖謨在《廣韻校本》一書中校出的訛誤的字形﹐絕大多數都按周氏的校勘記改正。個別GBK字庫中收入﹐而周氏認為訛誤的字形﹐依情況改正或不改。另有個別周氏未校正的訛誤字形﹐亦均改正。凡改正的字﹐均置為紅色﹐以示強調。需要說明的是﹐這些訛誤的字形是相對於周氏採用的張士俊澤存堂本廣韻而言﹔如以他本為底本﹐則可能出現字形未訛誤的字卻被置為紅色﹐或字形有訛誤的字卻未被置為紅色的情況。
7.對和正體不同的異體字形(包括異體字、新舊字形和其他一些更細微的差別)﹐按下面的方法處理﹕
a)如果該異體字形存在於GBK字庫中﹐則照錄﹐如吳﹔但以該異體字形為偏旁的字﹐如不存在於GBK字庫中﹐則不錄﹐如蜈不作[蟲吳]﹔如正體也不存在於GBK字庫中﹐仍照異體字形描述﹐如[王吳]﹔
b)如果涉及到整個漢字結構的變化﹐則按異體字形描述﹐如[鼠@冬](即鼨字)﹐[鳥庸](即鷛字)﹔
c)如果涉及到筆數的增減﹐一般要按異體字形描述﹐如[□幵](即汧字)﹔
d)如果不涉及筆數的增減﹐一般不按異體字形描述﹐如空字不作[□/兒/工]﹔
e)如果異體字形更對應於小篆字形﹐則按異體字形描述﹐否則﹐就不按異體字形描述。如卑﹐不作[卑-□1]﹔
f)避諱字都恢復正字。
8.當異體字形的正體存在於GBK字庫中時﹐用( )號註明在異體字形之後﹐以便於檢索﹐如□﹐後註(聰)。廣韻中在某字的註釋中給出的異體字﹐如存在於GBK字庫中時﹐也用( )號註明。此外﹐數據庫中也酌收了一些常見的、廣韻未收入或註釋的後起異體字﹐亦用( )號註明。
9.《廣韻》中的小韻字數統計有誤時﹐也用紅色表示訂正後的字數。
=================中古拼音和輸入法說明=================
中古漢語拼音v1.23及輸入法由
[email protected]製作。儘管該方案的設計有少數擬音的考慮﹐但方案設計時﹐一個字母在不同韻中可有不同發音﹐即高度簡併﹐所以各人可按照自己擬音來讀。同樣﹐四個次入韻的-d不□明是塞音尾﹐二等字的-r-也不代表發音包含顫音﹐隻是標記。具體參見“中古漢語拼音v1.23.txt”。
中古漢語三拼方案v2.0及輸入法由
[email protected]製作。三拼方案和中古拼音沒有直接聯係﹐隻要熟悉每個字的聲、韻、調﹐並記住鍵位﹐不須了解拼音方案也可進行輸入。在“中古三拼方案v2.0.xls”第四頁中有鍵盤圖﹐可以打印。
唇音字儘管大體沒有開合口的區分﹐在拼音及三拼方案中為方便起見﹐開合口分韻的及輕唇韻採用合口﹐開合口不分的一等韻﹐重唇三等韻﹐以及所有二四等韻採用開口。在拼音方案中﹐為了用僅有的6個元音字母解決所有韻母問題﹐按照韻圖﹐東一、東三採用開口﹐冬、鍾採用合口。這不代表作者認為兩組的差別在於開合口。而在三拼方案中﹐由於-ng尾韻過多﹐冬、東三採用和東一、鍾相同的中碼並使用-m尾韻的末碼。這也不說明輸入法作者認同冬、東三在中古時讀為-m尾。類似地﹐脂韻的末碼同-i尾韻。
目前的輸入法隻包括《廣韻》中的UTF-8編碼內的漢字。廣韻之外的字(除在“廣韻.xls”中圓括弧中的字)以及編碼中沒有的組合字未加入輸入法。
目前兩種輸入法僅有單字﹐沒有詞。我們考慮在以後添加詞組和廣韻中未收錄的字﹐以及在新的編碼更通用後收入非UTF-8的漢字。
=====================輸入法安裝====================
在Windows系統中可以使用系統自帶的“輸入法編輯器”(imegen.exe)(通常在\system32目錄的子目錄內﹐可能為隱含目錄)﹐按“瀏覽”打開兩個*.txt文件﹐按“轉換”生成碼表文件*.mb並按“創建”安裝輸入法。“轉換”時詢問“是否編入所有GBK字符”選“否”。安裝時可使用壓縮包內的MOC.bmp作為圖標。利用輸入法編輯器也可以修改輸入法的詞表、構詞方法等。具體可參見輸入法編輯器的幫助文件。
如果出現不能安裝的提示﹐可嘗試改短輸入法名稱及“創建”時的機構名稱。如果仍然無法安裝﹐可採用以下偷樑換柱的辦法﹕
在\Windows\system32\(依使用Windows系統版本不同自行查找)目錄下會找到幾個*.mb文件﹐如winpy.mb(漢語拼音全拼)、winsp.mb(漢語拼音雙拼)、winzm.mb(鄭碼)等。選擇一個平時不用的輸入法﹐改名另存﹐將包內的MOCQP.MB(中古漢語全拼)或MOCSP.MB(中古漢語三拼)複製到此目錄並改名為被改掉的原文件名。隨後通過控制面板或在輸入條按右鍵﹐進入“文字服務和輸入語言”﹐添加相應被改掉的輸入法即可完成安裝。
========================聯係=======================
若對數據庫和拼音、輸入法有任何問題或建議﹐請蒞臨bbs水木社區(www.newsmth.net)Linguistics(語言與語言學)板面﹐或者寫信給﹕biopolyhedron在hotmail點com及zhugeheng在hotmail點com。
2005-09-08
--
自製中古漢語拼音(1.23版)
零leng 一qjit 二njiih 三sam 四siih 五ngox 六liuk 七chit 八pret 九kiux
十zjip 百prak 千chen 萬myanh 億qik 兆drieux 京kieng
甲krap 乙qit 丙piengx 丁teng 戊muh 己kix 庚krang 辛sin 壬njim 癸kjyix
子cix 丑thriux 寅jin 卯mraux 辰zjin 巳zsix 午ngox 未myoih 申sjin 酉jux
戌syt 亥ghaix
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 221.218.70.189
1F:推 chenpeishin:'營'利目的 聯'繫' 134.208.34.139 09/08
2F:推 polyhedron:羞。。。多謝指正 61.49.122.27 09/08
3F:推 mapleflute:簽名檔是上古漢語吧 05/07 10:46