Liu 板


LINE

看板 Liu  RSS
※ 引述《deltazone (洋葱)》之铭言: : : 之前可能是我的误解 : : 那这边我用我的话解释,你看看我有没有理解错误 O_O : : 先简化问题,单纯就汉字来说 : : 「大字库」是一个纳入了所有汉字正规编码、简码与容错编码的编码表 : : 这边的容错包含了同语言的异体字以及不同语言的同源字 : : 而「同源」是指像「龙、竜、龙」或是「体、体」这样的字群 : : 所以打 LUL、LQL 或 AXF,龙、竜、龙都会同时出现在选字区 : : 这边再辅以「语言模式」的功能,来决定第一顺位的排序 : : 比方说,就算我打的是 LQL = 竜,我在简中模式底下的第一顺位也还是「龙」 : : 就算我拆的是 YJFK = 壊,我在繁中也还是以「坏」为第一顺位 : : 是这样吗? : 我用字也不够精确, : 另外大致没错!!! : 担心误会再补一个说明,目前虾米所包含的中文字 : 以现有的呒虾米字码不变为准,不增加编码,不减少编码 : 其实编码都没变,只是把日 简 繁 同样的编码(如lul)都统整在选字列中! : 现行的简体中文模式下:打lul会出现"龙",但在繁体中文模式中, : 打lul却无法出现"龙",改变成可以在字的选单中都出现"龙" OK 我懂了,现在我们想的是一样的东西了…XDDD 那我想这大字库至少需要定义几项东西 首先是一个文字的拆码 有点像废话,不过这是实际的问题 XD 而为了达成前述跨语言整合的效果,需要有人去整理我所说的同源字有哪些 现行的编码表应该已经有相当程度的整理了 否则做不到打繁出简或日文模式的汉字输出 所以重点就是缺口有哪些了 再来是该文字在各种模式下的优先序 更精确来说,应该是考虑该文字的某种特定拆法的优先序 这会关系到切模式时或是撞码时排序的问题 像是「围、叶、啐、囲、叶」通通拆 OJJ 哪些属於繁中,哪些属於简中,哪些是日文? 如果不属於该语言就可以不定义优先序,通通塞到最後面就好了 若是该语言中有这些字,但拆法来自不同语言 则可用该语言的拆法为优先,其他语言为後 若是这些字同属於该语言,那最後就是走现行的编码顺序 所以打 OJJ 繁中模式可能会排成「围、叶、啐、囲、叶」 日文模式可能会排成「囲、叶、叶、围、啐」(其中「啐」在现行日文模式打不出来) 简中…我懒得切输入法了,同理推论 Orz : =========================================================================== : 我觉得是不是误会,以为我说要在中文模式下也要打日文很有效率!(不是这样) : 这不是我的初衷,在每个模式(日简繁)时,是定义在此模式下,打此语言最有效率! : : "大字库"的用意是每个模式(日简繁)下,都可以用选字的方式,打出不同语言的文字! : 虽然打不同语言文字时速度比较慢,因为要选字,但至少能打出来! : 且此方式,不影响此模式下,该语言文字输入的速度! : : 然後不要说这会拖慢输入法的速度了XD : 使用繁体中文模式!繁体中文还是一样快! : 但可以在繁中模式下,打出简体字和日本汉字如此而已!! : ============================================================================ 是误会,我并没有「在中文模式下有效率地输入日文」这样的意思 可能是我表达的问题吧 Orz : 至於怎样才合格,你用的高兴就算合格XD (开玩笑的别介意) : 只是不知道怎麽回答了! : : 中文模式下,就照原本的方式输入日文, : 如打sa,等 : 但如打sa也出现さ和サ 在字的选单中,只是绝对不是在第一顺位 : (这点可以讨论,详细日文你比我熟! 你来提建议如何 修改好了XD) 既然合不合格是自由心证,那我的想法是:不要改 或者说,不要打掉原来的编码,我较倾向的是修正和补完 呒虾米的一些编码其实就等於是把选字的动作内化了,我想善用这点 刚刚研究了一下现在的日文模式假名编码,至少有以下规则: (我是用官方提供的 gcin 日文模式表格试的) * 以罗马拼音为基础,以「,」结尾输入平假名,以「.」为结尾输入片假名 - 含有一定程度的容错能力,如 TSU, TU, 都能出「つ」, LA, RA, 都能出「ら」 * 以罗马拼音後接 V 输入小型的假名,如 TUV, = っ * 以 L 或 X 为开头也能输入小型的假名,如 LTU, = っ * 拗音如きゅ可以一次输出两字,以此例为 KYU, * 特殊规则,如 っ 尚有 SS, TT, 等拆法,ー(长音符号)拆成 EE, 或 EE. 日文模式的汉字就不赘述了,对擅长字形的华语人士来说不成问题 里面确实可以找到几个问题 首先是假名的规则不透明 上面这些不是我无聊试出来的,就是刚刚去官网查码交叉比对来的 官网给的规则只写了这些:http://boshiamy.com/feature_basic_4_1.html 但有其他字如 VA. = ヷ、ヴァ 没写出来 而本身也有撞码而与一般罗马拼音选字序不同的地方 像 LA, 我期待出的字是「ぁ」,但第一候选字是「ら」 像 VA. 第一候选字是「ヷ」,可我期待的是「ヴァ」 再来是标点符号 我们的逗号是「,」,但日文中作为同样用途的是「、」,也就是我们的顿号 「,」反而比较少用 虽然这可能影响不大,但和英文输入的习惯不一样的话,还是会卡卡的 要改进有几个方向 * 仿照拗音的出字方式,加速促音的输入 - 如打 KKU, 可以输入「っく」两字,会比分开打 TT, KU, 来得快且直觉 * 增加「、」拆码「,」,在日文模式下比「,」优先输出 - 理由同上,「、」比「,」虽然功能一样但更常用 * L* 的假名编码改以小字优先,再来才是ら行容错 - 「ら」多数人会选择打 RA, 而非 LA, * V* 的假名编码以「ヴ」的复合发音为优先,再来才是ヷ行字 - 前者较後者常用…至少我自己是很少看到後者 * 规则透明化,官网真的写得太简略了 - 「々」(汉字叠字)也算是常用符号,但我还得分开特别查才知道能怎麽打… 以上是日文程度 N95 的小弟一点见解 XD : 补充说明: : 优化日文,加入韩文,在如繁体中文模式下,大多打韩文和日文还是都会偏慢! : 因为要选字! : 只是因为大字库的关系,在繁体中文模式下,也可以打得出来日文和韩文! : 同理韩文模式下,打繁体中文也会变慢!但也可以打出繁体中文来! 这个我现在理解你想做的是什麽了 : 想反问,各位大大,那有什麽其他的改变可以帮助呒虾米走出台湾呢? 这个我还真的不知道…(倒 不过就你前面对我提出的客群的回应,你最大的重点就是「走出台湾」 而手段之一是「让呒虾米不只是中文输入法」 这也没有绝对的对或错,就只是个方法 我的看法是,呒虾米现在本身的环境是封闭的 在不了解法律的状况下 我怕对它的编码表做什麽事,或是基於它衍生新的编码表,并且公开 会不会有法律上的问题 於是只能龟在这里打打嘴炮提建议,官方接不接受又是另一回事 至於没内建、授权问题这些前人也提过很多次了 要是能走出这个封闭的环境,应该会比较好推广 : : 简码能加速是因为我们大量的常用字被配了简码,进而大幅减少输入的字码数 : : 如果日文的常用字和我们差太多,可能会发生冷门字反而在呒虾米有简码的状况 : : 或是反过来,常用字反而得用正规拆码 : : 我指的是这件事 XD : 应该是我上面所说的问题? : 我是用模式(日简中)去区分! 我指的是像下面的状况 比方说「对」这个字,在中文它很明显非常常用,被指派了简码 A 但日文中「対」就没有像中文那样这麽常用 那这个简码在日文加速的效果就不明显了 我明白你所说的切换语言模式不影响原本输入速度的原因 但我的问题不在这里 : → deltazone: 还有做变形字根表,但一踏入才知汉字之大XD 06/29 17:08 : → deltazone: 可是属於一头热型! 目前变形和简体字表难产中XD 06/29 17:09 多少可以体会刘先生当初发明呒虾米的辛苦了吧 XD 这部分如果有办法让多人共同作业的话,可能会轻松一点 --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 122.116.109.225
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Liu/M.1435588014.A.BA9.html
1F:推 xxvi: 如果大字库指的是把同源(编码相同?)的字甚至符号全 06/30 09:17
2F:→ xxvi: 部列出,那麽感觉会比现有的候选字串长很多?这大概就 06/30 09:17
3F:→ xxvi: 需要留给呒虾米公司评估实用性跟推出後能不能吸引新使 06/30 09:17
4F:→ xxvi: 用者了,我个人是偏好它打字时几乎可以不看候选字串这 06/30 09:17
5F:→ xxvi: 一点就是XD 06/30 09:17
6F:→ xxvi: 另外自制编码表作为建议应该是没有问题的,但是「对现 06/30 09:21
7F:→ xxvi: 有编码表做什麽」这边我不太懂,如果是要自己建一套测 06/30 09:21
8F:→ xxvi: 试版的新虾米输入并发布可能有疑虑,不过提出修正想法 06/30 09:21
9F:→ xxvi: 公开讨论或提给公司的话应该没有太大问题啦:~ 06/30 09:21
10F:→ Frozenmouse: 没有错,假设今天我有时间整理了一个基於呒虾米的改 06/30 11:36
11F:→ Frozenmouse: 进表格,自行发布给人试用,那可能就会有问题… 06/30 11:36
12F:→ Frozenmouse: 所以不是用其他方式规避就是只能交给官方决定了 06/30 11:37
13F:→ Frozenmouse: 我那句主要指的是这个XD 06/30 11:37
14F:→ Frozenmouse: 至於大字库的候选字,以他的论点来说,应该是在不破 06/30 11:39
15F:→ Frozenmouse: 坏繁中现有编码的前提下做这件事,若排序得好的话打 06/30 11:39
16F:→ Frozenmouse: 起来手感应该是和现在一样的 06/30 11:39
17F:→ Frozenmouse: 同源指的是跨语言判定属同义的字,不知有无正式名称 06/30 11:50
18F:推 deltazone: 同源应该是指中日韩统一表意文字!? 06/30 23:51
19F:推 deltazone: unicode编码 06/30 23:54
20F:→ deltazone: 连结打不上 自行维基百科 "中日韩统一表意文字" 06/30 23:55
21F:→ Frozenmouse: 很接近,但我不确定有无因为异体字而被编成两个码的 07/01 01:28
22F:→ Frozenmouse: 另外像叶(cn)和叶(tw&jp)是被我归在同源的 07/01 01:33
23F:→ Frozenmouse: CJK统一表意文字则着重在字形 07/01 01:33
24F:→ Frozenmouse: https://goo.gl/J0zIiP 这是中文维基条目 07/01 01:58
25F:→ Frozenmouse: 可能要找其他名称,同源会和统一汉字的来源混淆XD 07/01 01:59
26F:推 deltazone: 把现有呒虾米 繁 简 日 模式中 所有字 所有编码 统整 07/01 04:49
27F:→ deltazone: 就可以初步解决 "鱇" 在繁中模式 找不到状况! 07/01 04:51
28F:→ deltazone: 也是我所说的大字库 的雏型了 没那麽复杂 07/01 04:56
29F:→ deltazone: 现行的简体模式打 rst可以打出"叶" 07/01 04:58
30F:→ deltazone: 现行的繁体模式打 ojj也可以打出叶(只是要选字) 07/01 05:02
31F:→ deltazone: 异体字的部分 之前整理变形字根有遇过! 07/01 05:08
32F:→ deltazone: 如:"奂""换"有些字体 下面是两点如八 看着字打 打不出 07/01 05:11
33F:→ deltazone: 中日韩统一表意文字 的确 和你说的不太一样! XD 07/01 05:16
34F:→ deltazone: 目前可以联想到的是 大陆官方发行的 简化字 对照表 07/01 05:17
35F:推 deltazone: 另外 编码表要补缺口 我觉得看要(能)做到什麽程度!? 07/01 05:24
36F:→ deltazone: 不补缺口其实也可 只是做的比较粗浅, 07/01 05:25
37F:推 deltazone: 像andriod手机 使用lime-hd打呒虾米那样! 07/01 05:29
38F:→ deltazone: 另外"对"简码的问题,提个方案,日文模式下,简码重订 07/01 05:41
39F:→ deltazone: 但打a 也可以找到 "对"XD 只是在後面的顺序! 07/01 05:43
40F:→ deltazone: 有点大胆,但本着各个模式其实是独立的输入法看待! 07/01 05:46







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Tech_Job站内搜寻

TOP