作者ilanese (1月13日有新作)
看板Liu
标题Re: [讨论] 现在的字码有规划要进行改版吗?
时间Thu Apr 29 03:34:14 2010
在今天看来,呒虾米一个很大的败笔之一是一码字编的奇烂无比
,可能在刘老一开始发明呒虾米的年代并没有教育部这类的字频表(
但在199X年这类经过电脑统计的字频表报告早已出现了。)
一码字A:对,字频序号第91。
一码字G:机,字频序号第144。
一码字I:後,字频序号第59。(勉强算还可以)
一码字M:满,字频序号第293。
一码字N:南,字频序号第333。
一码字P:备,字频序号第447。
一码字T:通,字频序号第239。
一码字V:要,字频序号第37。(勉强算还可以)
一码字Y:益,字频序号第707。
一码字Z:整,字频序号第367。
前几年开始发展的师大大师输入法的一码字如下:
是、有、说、来、时、为、在、的、我、个、大、中、
一、了、人、以、年、可、所、要、小、好、国、不、开、
会、能、这、到、就。(大多数在字频前30名内,少数是在
字频前100名内。)
要不是那个大师输入法延用我长久以来都学不会的仓颉
字根,以及很奇怪的拆字顺序(不符合一般的笔顺方式),
不然我搞不好会去学它看看。
所以,我建议呒虾米真要改革的话,一码字和二码字可
以考虑按照字频去编排。
PS:中央研究院有个汉字构形资料库的功能及相关研究
报告真是强大,有兴趣的人可以下载来玩看看。
--
表一:字频总表
说明:
1.本表根据样本统计所得之单字数为 5731 字,频次总数为 1982882次。
2.本表排序依字的出现频次高低排列。
3.本表部首笔画据教育部《重编国语辞典修订本》(1995)所分。
╔════╤══╤═╤═╦════╤════╤════╗
║ 字 频 │ │部│笔║出 现│ 累 积 │累 积║
║ 序 号 │ 字 │首│画║频 次│ 频 次 │百 分 比║
╟────┼──┼─┼─╫────┼────┼────╢
║ 1 │ 的 │白│08║ 32739 │ 32739│ 1.651 ║
║ 2 │ 不 │一│04║ 24362 │ 57101│ 2.879 ║
║ 3 │ 一 │一│01║ 22524 │ 79625│ 4.015 ║
║ 4 │ 我 │戈│07║ 19414 │ 99039│ 4.994 ║
║ 5 │ 是 │日│09║ 17698 │ 116737│ 5.887 ║
║ 6 │ 人 │人│02║ 17638 │ 134375│ 6.776 ║
║ 7 │ 有 │月│06║ 14346 │ 148721│ 7.500 ║
║ 8 │ 了 │亅│02║ 12721 │ 161442│ 8.141 ║
║ 9 │ 大 │大│03║ 12416 │ 173858│ 8.767 ║
║ 10 │ 国 │囗│11║ 10660 │ 184518│ 9.305 ║
║ 11 │ 来 │人│08║ 10620 │ 195138│ 9.841 ║
║ 12 │ 生 │生│05║ 10256 │ 205394│ 10.358 ║
║ 13 │ 在 │土│06║ 9988 │ 215382│ 10.862 ║
║ 14 │ 子 │子│03║ 9708 │ 225090│ 11.351 ║
║ 15 │ 们 │人│10║ 9454 │ 234544│ 11.828 ║
║ 16 │ 中 │|│04║ 8751 │ 243295│ 12.269 ║
║ 17 │ 上 │一│03║ 8668 │ 251963│ 12.706 ║
║ 18 │ 他 │人│05║ 8554 │ 260517│ 13.138 ║
║ 19 │ 时 │日│10║ 8311 │ 268828│ 13.557 ║
║ 20 │ 小 │小│03║ 8061 │ 276889│ 13.963 ║
║ 21 │ 地 │土│06║ 7580 │ 284469│ 14.346 ║
║ 22 │ 出 │凵│05║ 7437 │ 291906│ 14.721 ║
║ 23 │ 以 │人│05║ 7423 │ 299329│ 15.095 ║
║ 24 │ 学 │子│16║ 7306 │ 306635│ 15.464 ║
║ 25 │ 可 │口│05║ 7202 │ 313837│ 15.827 ║
║ 26 │ 自 │自│06║ 7199 │ 321036│ 16.190 ║
║ 27 │ 这 │辵│11║ 7175 │ 328211│ 16.552 ║
║ 28 │ 会 │曰│13║ 7044 │ 335255│ 16.907 ║
║ 29 │ 成 │戈│06║ 6996 │ 342251│ 17.260 ║
║ 30 │ 家 │宀│10║ 6979 │ 349230│ 17.612 ║
║ 31 │ 到 │刀│08║ 6857 │ 356087│ 17.958 ║
║ 32 │ 为 │火│09║ 6838 │ 362925│ 18.302 ║
║ 33 │ 天 │大│04║ 6799 │ 369724│ 18.645 ║
║ 34 │ 心 │心│04║ 6762 │ 376486│ 18.986 ║
║ 35 │ 年 │干│06║ 6350 │ 382836│ 19.307 ║
║ 36 │ 然 │火│12║ 6264 │ 389100│ 19.622 ║
║ 37 │ 要 │襾│09║ 6225 │ 395325│ 19.936 ║
║ 38 │ 得 │彳│11║ 6193 │ 401518│ 20.249 ║
║ 39 │ 说 │言│14║ 6151 │ 407669│ 20.559 ║
║ 40 │ 过 │辵│13║ 6028 │ 413697│ 20.863 ║
╚════╧══╧═╧═╩════╧════╧════╝
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.216.248.148
1F:→ aaaaa0703:这个好像每次都会被拿出来讨论 04/29 07:46
2F:→ aaaaa0703:问题是大家都习惯了,而且常用字是会变的 04/29 07:47
3F:→ aaaaa0703:而且一码字要变的话2码字是不是也会被牵动呢? 04/29 07:49
4F:→ aaaaa0703:好像还有在板上看过如果改了之後的速度分析之类的 04/29 07:50
5F:→ aaaaa0703:但是还是很希望看到更有效率的字码! 虾米加油! 04/29 07:52
6F:推 toni09:你说的 独眼龙都知道 04/29 08:56
我记得很久以前,我曾写信给行列输入法发明人有关这个问题,不过
他说会影响到旧的使用者,所以也不愿意改革,後来我就改用呒虾米了。
设个「,,sp8」模式之类的,要用更改过一码字、二码字的新版的人
,就能很容易地变更输入模式了,要用旧的,还是用新的,可以由使用
者选择,所以这种方式并不会影响旧的使用者。(至於预设那种输入模
式,也可以自行设定,这根本不是问题。)
重点是一码字、二码字要怎麽选择,这才是最大的问题。教育部的字
频表、词频表是最大编修依据(不过最新的版本好像也是民国八十七年的
事情吧?)但希望呒虾米的公司要改的话,要好好地研究,一次就改好。
(这种重大的改版也是有一定的商业利基,并不会没有回报。)
民国八十七年常用语词调查报告析介(教育部的网站):
http://140.111.34.54/files/site_content/M0001/87news/index1-2.htm?open
※ 编辑: ilanese 来自: 61.231.229.245 (04/29 10:21)
7F:推 Ross0916:请找标题 "一码字" 很久以前讨论过了.. 04/29 13:37
8F:→ Ross0916:除了字频 也要考虑跟原字根的相关性什麽的 04/29 13:38
9F:→ Ross0916:而且当然这个字频未必跟每个人的日常生活用字符合 04/29 13:38
10F:→ Ross0916:想一想 大新仓颉这些全部算计在内了 04/29 13:39
11F:→ Ross0916:简单说大新仓就是把这些先进武器全装上去了QQ 04/29 13:40
12F:→ Ross0916:现在呒虾米不管怎麽改 速度要赢大新仓几乎不可能 04/29 13:41
现行的呒虾米输入法一码字有很多也只是沾个边而已,就是直接硬背
而已,更多是莫名其妙硬背的,当初都有办法硬背了,为何现在无法背那
几个字呢?
对(最後一码A?不然我也不知道要怎麽牵连了?)
机(完全不晓得为何是G?)
後(第二码I?)
满(完全不晓得为何是M?)
南(第二码N?)
备(第一码P?)
要(完全不晓得为何是V?)
益(完全不晓得为何是Y?)
整(最後一码Z?)
※ 编辑: ilanese 来自: 61.216.243.111 (04/29 16:40)
13F:推 Hemiola:机念起来就是 G 啊,要就是很重要所以硬背 04/29 17:02
那「满」大概就是念起来像M吧?
那「益」大概就是念起来像Yi吧?
※ 编辑: ilanese 来自: 61.231.231.217 (04/29 17:28)
14F:推 plane0747:今天如果要你改"桌子"其实是椅子的义,"椅子"其实是桌子 04/29 18:03
15F:→ plane0747:的义,不用多,10个就够让你崩溃了XD 04/29 18:03
16F:推 banqhsia:我觉得现在的一码字就很好了唉XD 04/29 20:02
17F:→ banqhsia:满、南、益、整、备、机、高、通、以 我都是用音记的 04/29 20:03
18F:→ banqhsia:如果照您的逻辑的话...那至为什麽是P呢? 04/29 20:04
19F:推 Ross0916:倒不是声讨原来的「没道理」,只是原来的「字频不够高」 04/29 20:39
20F:→ Ross0916:但想想就算前 26 名硬塞好了! 真能胜大新仓吗? 04/29 20:40
呒虾米的一码字塞进一到十的数字,已经先天不足了(如果依字频来说,
除了「一」、「十」外,大多是二码字就够了。)
如果想要赢大新仓颉的话,光改一码字是不够的,连二码字都得异动了。
例如:呒虾米的「国」这个字还得最少打三码,连二码字都不是,也应该
适时地改一下吧?
如果要胜大新仓颉的话,我觉得并不难,一码字、二码字是关键。(问题
是旧的输入法使用者,叫他们重新背那些资料,可能会受不了。)
更何况那些打字队的,为了速度,本来就是硬背硬练的。而一般人如果那
些两码字不是常常打的话,或许就会忘了,而用一般拆字的方式了。(那为什
麽呒虾米还会输呢?就是因为一码字、二码字编排的不好。)
※ 编辑: ilanese 来自: 61.231.233.102 (04/29 22:58)
21F:推 banqhsia:我觉得这样就很够用了啊.. 04/29 22:59
22F:推 toni09:哈 我有参加过打字队 现在要改 还满难的 都定型了 04/29 23:00
23F:推 Ross0916:本来输入法就是在硬塞与易记间求取平衡 04/30 04:47
24F:→ Ross0916:大新仓颉还多用四个键呢,就算一二码字全都按顺序硬塞 04/30 04:48
25F:→ Ross0916:可能也不行.. 而且没有人会愿意 @@ 04/30 04:48
大新仓颉应该还是延用仓颉原本那一套的小字根,只是大新仓颉
使用最多四码吧?(因为我没学过,仅看资料。)
用小字根来拆码,遇到结构复杂一点的字通常会拆码拆到四码、
五码(因为仓颉还得取字首最多取两码、字身最多取三码,大新仓颉
是取四码而已,怎麽取码,我就不知道了。)
用过小的字根来拆码,非常违反中字字形结构的原理,有许多字
是为拆而拆,说难听点,是硬背硬拆罢了。(大新仓颉官网自称约100
个字根而已,呒虾米的基本字根大约2XX个。)
如果不考虑到一码字、二码字,以及重码字问题的话,理论上呒
虾米的打字速度是会比大新仓颉快的。
但实际上,为何近几年来的比赛成绩,大新仓颉是比呒虾米快呢
?真只有重码字的问题吗?(而且我认为呒虾米的重码字问题还未必
会比大新仓颉严重哟!)
答案还是一码字、二码字是不是采用字频表来编排的问题嘛!
只是旧的使用者不想重新再背再学习罢了……
但我已经提出一个解决方法了,就是用「,,sp8」之类的功能来
切换新旧的一码字、二码字的拆码模式,根本不会影响到旧的使用者
。
※ 编辑: ilanese 来自: 61.231.230.142 (04/30 11:03)
26F:推 Ross0916:你可以看看"大新仓颉与呒虾米输入法之输入绩效比较研究" 04/30 13:38
27F:→ Ross0916:关於你说的这些点大概都有比较到,以及「平均取码数」 04/30 13:39
28F:推 biblio:根据楼上的那篇论文: 04/30 14:24
29F:→ biblio:「研究结果显示:在理论分析方面,大新仓颉输入法的键盘配 04/30 14:24
30F:→ biblio:置、平均取码数及输入法的选字率皆优於呒虾米输入法。实验 04/30 14:24
31F:→ biblio:评估验证了理论分析的评估结果,在输入速度方面,大新仓颉 04/30 14:25
32F:→ biblio:输入法之输入速度比呒虾米输入法之输入速度快;在输入错误 04/30 14:25
33F:→ biblio:率方面,大新仓颉输入法之输入错误率比呒虾米输入法之输入 04/30 14:26
34F:→ biblio:低(P=0.004<0.01)。 04/30 14:26
36F:推 carymask:唔唔… 十个受试者,这个样本数会不会也太少了点呐? 05/01 11:00
37F:推 wind50321:相信十年後的理由还是一样… 05/04 01:51
38F:推 Eckes:推这篇 05/05 07:14
39F:推 xcraft:推~觉得多出来一个送字模式会更好,这样不会影响旧的使用者 05/05 14:35
大新仓颉有个功能是可以恢复第三代仓颉的一码字输入模式。
真要改的话,呒虾米可仿效大新仓颉的作法,变换为新的一码字
及二码字输入模式,根本不会影响到旧的使用者。
本来输入法就是一直改良的,大新仓颉将第三代仓颉改为四码输
入及依照字频表顺序来对一码字、二码字及重码字的选字上作改良,
呒虾米输入法也可以这麽作的。
※ 编辑: ilanese 来自: 61.216.243.117 (05/05 19:21)
40F:推 XXZDX:推这篇 我也是虾米族 呒虾米真的有它的败笔在 我们要正视它 05/06 18:53
41F:推 OverInfinity:推,虾米族期望见到进化,从虾米变成龙虾吧 05/07 22:53