作者but (←杀千刀的UAO始作俑者)
看板NIHONGO
标题Re: [心得] 时の泪:Unicode补完计画
时间Mon Dec 5 23:09:03 2011
: 虽然这个跟日文版没有什麽关联
: 不过在使用日文字普遍的这个版上
: 还是希望写一篇来警惕一些刚想学日文的人
: 可能会遇到打日文字的问题
虽然跟日文版没有关连
但是身为作者 实在无法接受作品被反覆的造谣
所以该澄清的还是要澄清
先说清楚 我是Unicode补完计画第一版作者
自己现在用Win7 没有装Unicode补完计画
但无论是PCMAN、Pietty、Firefox
或多或少都「内建」了Unicode补完计划的字码表
无论你有没有用Unicode补完计画
能够使用PCMAN在BBS上看到日文汉字
这字码表 确实是我们Unicode补完计画小组一个字一个字定出来的
(Unicode补完计画的范围不只是假名而已
他在BIG5中定义了SJIS跟GB2312的所有汉字)
: 直到Windows98时代前期
: 台湾人开始希望能写日本字
事实上 台湾一直有处理日文的需求
从DOS时代开始 倚天中文系统就内建了假名
市面上畅销的中国海字集收录了大量日文汉字
很可惜的微软放弃了假名部分 才造成之後问题连连
: 这时候就有人想到
: 那麽为什麽不直接在BIG5的字典表中
: 加入那些日本字呢?
: 没错
: 这就是Unicode补完计画的诞生
不 直接在BIG5中加入日文
是传统的造字档方法 也就是樱花输入法之类的
从 Windows95 时代就有
: 这也是在Windows98下最普遍的日文输入法
: 因为你的电脑并没有内建各国输入法
其实有 Microsoft Global IME(JP) 可以装.....
不过只能在 IE 里用就是了
: 一直到WindowsXP时代
事实上 Unicode 补完计画是在 2001年的时候
针对 Windows XP 开发的
Windows 95/98/ME 是 DOS 架构的 Windows
系统底层是用 ASCII 处理的(1位元字码)
Windows NT/XP/2003.... 是 NT 架构
系统底层是用 Unicode 运作的 也就是国际码
虽然底层改成 Unicode
但大多数的软体、旧文件,都还是 BIG5 的
所以BIG5跟Unicode两种不同的字码 不可能说换掉就一口气换掉
实际上 Windows XP 无时无刻在做这两种编码之间的转换
但是因为微软放弃了BIG5里的假名
所以樱花输入法的假名会被转换到Unicode的造字区
Unicode 补完计画真正做的事情是
换掉系统预设的 Unicode <=> BIG5 互相转换表
把 BIG5 日文字区的字码 转换到正确的 Unicode 日文字区
: 就算是把各国的资讯都安装进去,基本上也没有什麽问题
: 所以可以接受跟显示日文字
网速之类的问题不大 主要是系统底层架构的影响
: 这时候会发生什麽问题
: 你的电脑多出来安装的东西
: 当初日本人没有装
: 就算他看得到繁体中文字的BIG5编码
: 你在後面加上去的那些字库他是没有的
: 所以她看不到
Unicode补完计画所做的事情是调整转换表
而不是像樱花输入法一样 在造字区把日文字型塞进去
所以安装以後 在正确的Unicode环境下
BIG5日文会被正确转换成Unicode的日文
如果日本人看不到 只有一个原因
就是你传送了BIG5编码的文件
: 接着,你电脑中所有的档案
: 档名都已经换成BIG5的日文字
不会
Windows XP 的档案系统 NTFS 是用 Unicode 储存档名 不是 BIG5
事实上
Unicode补完计画所提供的档名软换工具
是把档名里的假名
从Unicode造字区改成正确的Unicode日文假名
因为当年像Winamp之类的软体 无法开启本地编码缺字的档名
所以才会写这个功能
: 最後Unicode补完计画虽然支援文件的转换还原
: 一般人找不到方法去还原他
事实上是
我们本来就评估过 时代会渐渐走向软体支援开启所有Unicode档名的档案
所以把档名转换工具设计成不建议转回来
试问 在这个时代
有什麽时候需要把正确Unicode日文转回造字区的假日文呢?
: 辛辛苦苦存的Word,歌词之类的,就是会消失
Word 是用 Unicode 储存的
会出问题的是樱花输入法
使用 Unicode 补完计画的日文不会有问题
: 到了WindowsXP的时候
: 只要使用AppLocale就可以解决多数问题(除非锁日Win系统)
AppLocale 的真正用途
是用来解决 在Unicode环境<=>Big5对应下 想要执行SJIS的软体
也就是平常用的是中文
所以把Windows XP定义成地区编码预设转换成BIG5模式
但又想执行SJIS的软体 想只针对这个软体 预设Unicode与SJIS互相转换
但这不能解决BIG5环境的问题
要说还有什麽BIG5环境 主要就是BBS... 就是这个ptt
: 这是Windows就有内建的东西
: 也是日本人打字用的东西
: 也是最正规的东西
所以Unicode补完计画一向提倡使用MS-IME
而且随着Unicode补完计画安装的Unicode补完计画版本樱花输入法
也是吐出正确的Unicode字码
: 如果存成Unicode还是UTF-8就没有这个问题
: 那些存成ANSI的各国种类的文字档都将不复存在
我同意时代终於走到BIG5越来越少的时候了
但要完全离开BIG5还是有困难的
一来是最难解的BBS (ptt本身就是完全的BIG5环境)
另一来是很多文字编辑器(像记事本) 预设还是存BIG5
: 因此
: Unicode补完计画虽然称为Unicode补完计画
: 但是他补完的对象是Unicode
: 并不是代表他建构在Unicode上
Unicode补完计画是建构在WindowsNT架构会不停进行Unicode<=>ANSI互换的前提下
调整Unicode<=>BIG5的对应关系
实际上没有修改到Unicode编码表
可以说是有大量修改了BIG5的编码
: 但是自从WindowsXP左右
: 他就是时代的眼泪
他是WindowsXP时代的产品
虽然後来Unicode补完计画有硬搞出Win98的版本
不过限制非常大
基本上还是比较适合WindowsNT
: 甚至中文字都出来了日文字就是乱码
: 那麽这个可能就是来自Unicode补完计画出来的毒
: 不要想了,扔掉吧
不一定
也很有可能是樱花输入法或中国海字集之类的BIG5文件
而且 根据现在最新的国家标准(BIG5-2003)
日文假名是BIG5的一部分
反而是微软版本的BIG5不合标准
再者 BBS上的假名跟日文汉字 到现在还是用BIG5储存的
无论你是装Unicode补完计画 还是用PCMan或Pietty
能看到这些字 都是靠Unicode补完计画定义的对应关系
: 那麽请直接重灌电脑
: 并且花很长的心力去复原你的文件
: 这是阵痛期,痛过了就没事了
: 你即将跟世界接轨
事实上 因为微软拿掉了BIG5里面的日文假名
才造成後来一堆各式各样的问题
传统的解法就是用造字区解决
大家使用一样的造字表 就都够看得到一样的字
但这些字在Unicode里其实都有
当时代进入Windows XP後
BIG5造字区里的假名 也被对应到Unicode的造字区
Unicode补完计画用很特殊的方法尝试解决这问题
就是把BIG5的造字区 对应到Unicode正确的日文区
这麽一来就能达到我们认为还算理想的结果
1. 在BIG5环境下,跟传统的造字区解决方案相容
2. 在Unicode环境下,跟正确的日文字区相容
Unicode补完计画一开始的设计目的
就是为了试着让BIG5造字区里的日文 能尽快跟Unicode里正确的日文字区接轨
要说这是活在象牙塔里 这是不公平的
如果你使用Unicode补完计画
後来很小心自己文件都以 Unicode (包括UTF-8) 储存
那麽Unicode补完计画刚好是把旧的樱花输入法造字资料
协助转换成Unicode正确日文的帮手
(副作用就是爱存BIG5的话,也会很拿手地将Unicode日文存成BIG5造字日文....)
虽然我不能否认说
一方面这也造成了BIG5日文文件的持续使用
但至少在Unicode补完计画的协助下
不会让这些造字日文扩散到Unicode环境里
如果现在你还在使用樱花输入法方案
那你从BBS所复制的日文 存在Word里 他都仍然是Unicode造字区
是因为Unicode补完计画/PCMan/Pietty 把它正确对应到Unicode日文区
所以安装Unicode补完计画/PCMan/Pietty之後
BBS里的日文才能跟Unicode正确的日文完全接轨
: Unicode补完计画
: 之所以後来会被称为补不完计画
: 不是没有原因的
我自己是没碰到什麽问题啦
确实我自己会很小心尽量存 Unicode 就是了
因为我自己现在会用到BIG5的情况只剩BBS了
所以我选择没安装Unicode补完计画 只装个PCMan解决
但这仍然是Unicode补完计画的延长线
装PCMan可以看到BBS的日文 不是因为ptt支援Unicode了 或是PCMan支援Unicode了
而是因为
PCMan把Unicode补完计画的那张Unicode<=>BIG5对应表内建进去了
只是根据这份表进行对应的范围 从整个系统局限到一个软体里了而已
另外可见以前写的说明
http://blog.chweng.idv.tw/archives/90
我会回这一篇 并不是要劝人装
我自己现在也没有需要 就没装了
只是不能接受整篇的误解 该更正的时候还是要更正一下
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 114.36.151.172
1F:推 medama:推 111.255.92.108 12/05 23:10
2F:推 WindSignal:这真的不能不推!118.169.210.226 12/05 23:15
3F:推 kazano:有大大快拜 m(_ _)m 124.8.68.79 12/05 23:24
4F:推 wolfwolf:有神快拜118.168.136.193 12/05 23:25
5F:推 tomuya:有神快拜 61.58.88.134 12/05 23:33
6F:推 dragonsoul:推 211.74.184.96 12/05 23:50
7F:推 jasonmasaru:拜 180.30.210.38 12/05 23:54
8F:推 vacuum41910:有看有拜 42.72.74.227 12/06 01:23
9F:推 KawasumiMai:まぁ、既然最了解个中原理的作者都出140.121.210.139 12/06 05:43
10F:→ KawasumiMai:来解释来龙去脉了,不推也说不过去140.121.210.139 12/06 05:43
11F:推 pc010710:有神快拜!!!218.107.246.206 12/06 09:06
12F:推 bibiman: 有神快拜!!! 61.60.117.68 12/06 10:04
13F:推 RIDERKNIGHT:有神快拜,感谢你的付出和努力 125.227.230.5 12/06 11:38
14F:推 RIDERKNIGHT:老实讲光讲不推说不过去根本不够 125.227.230.5 12/06 11:42
15F:→ RIDERKNIGHT:造谣生事成这样,不道歉才说不过去 125.227.230.5 12/06 11:42
16F:→ RIDERKNIGHT:还在那边用居高临下的态度真的很恶心 125.227.230.5 12/06 11:43
17F:→ ssccg:问题还是在使用者习惯啦,有装的人自己转很 117.56.105.98 12/06 12:18
18F:→ ssccg:顺,就会不自觉或者倾向存成BIG5 117.56.105.98 12/06 12:18
19F:→ ssccg:不装的人根本看不到BIG5日文,自然会被强迫 117.56.105.98 12/06 12:20
20F:→ ssccg:都用全unicode,现在常用的ansi大概就剩bbs 117.56.105.98 12/06 12:20
21F:推 Kueiminshan:原来造谣还可以这麽嚣张140.114.209.122 12/06 12:41
22F:→ KawasumiMai:看样子那天花时间作了多余的事情140.121.210.139 12/06 12:53
23F:→ KawasumiMai:在下的个性是只会针对有错的部分道歉140.121.210.139 12/06 12:53
24F:→ KawasumiMai:既然跟日文版无关就不再发一篇回文140.121.210.139 12/06 12:53
25F:→ KawasumiMai:最初的用意是希望其他人不要因此後悔140.121.210.139 12/06 12:53
26F:→ KawasumiMai:毕竟这也是在下的经验跟得到的资讯140.121.210.139 12/06 12:54
27F:→ KawasumiMai:看了这篇文後有想过自删,不过应该也140.121.210.139 12/06 12:54
28F:→ KawasumiMai:有人会以毁屍灭迹评论140.121.210.139 12/06 12:54
29F:→ KawasumiMai:道歉完再说废话也会有人认为不够诚意140.121.210.139 12/06 12:55
30F:→ KawasumiMai:所以在下先把想说的话说完140.121.210.139 12/06 12:55
31F:→ KawasumiMai:最後140.121.210.139 12/06 12:55
32F:→ but:我是希望大家不要战起来啦~_~ 210.71.217.252 12/06 12:55
33F:→ KawasumiMai:个人对於Unicode补完计画的详细原理140.121.210.139 12/06 12:55
34F:→ KawasumiMai:的确有误解跟错误认知,并且误导各位140.121.210.139 12/06 12:55
35F:→ KawasumiMai:在此对该程式作者致上十二万分的歉意140.121.210.139 12/06 12:56
36F:→ but:只是因为Unicode补完计画刚好卡在BIG5跟 210.71.217.252 12/06 12:56
37F:→ but:Unicode转接的部份 在网路上常常背负了传统 210.71.217.252 12/06 12:57
38F:→ but:樱花输入法的原罪跟误解 趁机讲清楚而已 210.71.217.252 12/06 12:57
39F:推 newtypeL9:感谢原PO,惠我良多 114.24.10.226 12/06 14:56
40F:推 akumahirosi:神来了快拜 m(_)m 111.248.221.10 12/06 16:40
41F:推 einard666:有看有拜! 211.79.153.138 12/06 17:10
42F:推 articlebear:受惠者跪拜<(_ _)> 203.77.48.117 12/06 20:06
43F:推 roxasd:太神了!遇到初版作者!!快拜!!140.130.175.138 12/06 20:43
44F:推 AoiLibra:有神快拜 m(_ _)m 61.59.237.199 12/06 21:33
45F:推 momizi:感谢 Unicode补完计画,惠我良多 114.32.108.32 12/06 21:54
46F:推 lkkadd:推~~~ 谢谢你 111.242.173.84 12/06 22:09
47F:推 aini6323:有看有拜!!! m(__)m 61.62.72.52 12/06 22:24
48F:推 rokudo:拜了!!真的很谢谢你<(_ _)> 111.254.47.156 12/06 22:31
49F:推 koicocoro:拜!!!218.160.190.221 12/06 22:43
50F:→ mooor:虽然看不懂,但还是要拜! 至少我用过unicode 210.139.145.80 12/06 23:29
51F:→ mooor:也没啥不便之处. 210.139.145.80 12/06 23:29
52F:→ orion:无论你们原意如何,事实上就是很多人装了 59.112.233.59 12/07 00:16
53F:→ orion:Unicode补完计画後,继续在用big5日文不自知 59.112.233.59 12/07 00:16
54F:→ orion:原作者劝说大家不要装是对的 59.112.233.59 12/07 00:17
55F:→ orion:现在装了只是自找麻烦,尤其是对电脑不懂的 59.112.233.59 12/07 00:19
56F:→ orion:一个时代的解药,是另一个时代的毒药 59.112.233.59 12/07 00:22
57F:→ orion:我觉得补完计画只是在替big日文延寿... 59.112.233.59 12/07 00:38
58F:→ orion:除了BBS,现在真的没有非用Big5的地方 59.112.233.59 12/07 00:39
59F:→ orion:就让BIg5日文彻底死掉吧 59.112.233.59 12/07 00:39
60F:推 bluemaria:这麽多年来谢谢你... 114.34.0.153 12/07 01:06
61F:推 sindi:拜140.112.251.194 12/07 01:30
62F:推 TabrisDirac:朝圣~ 218.175.154.52 12/07 03:13
63F:推 samuraiboy:推,我现在也还有在用呢,没出什麽问题 220.132.139.96 12/07 03:23
64F:推 demon:朝圣推~ 203.72.235.11 12/07 11:58
65F:推 Anauma:推 解决了我对BBS和日文之间关系的疑惑 140.112.229.72 12/07 16:53
66F:推 donkatu:有神快拜 60.249.238.162 12/07 17:25
67F:推 KeroroMorita:朝圣推 <(_ _)> 111.240.160.13 12/07 18:35
68F:推 kaiteng:真是写的太好了。还好我从来没有用过这样 111.240.218.61 12/09 12:32
69F:→ kaiteng:的东西。真的是谢天谢地。 111.240.218.61 12/09 12:33
70F:推 fourleaf1027:推 114.41.97.175 12/09 13:50
71F:推 Icthyoblue:大推,我也用补完计画很久了。 118.168.64.108 12/12 16:07
72F:推 vpmdlilty:推,以前也用过补完计画,真的很好用。 211.74.239.61 12/14 11:51
73F:→ vpmdlilty:用EmEditor就不会不小心存成Big5了。 211.74.239.61 12/14 11:54
74F:推 genovis:推!140.137.122.178 04/13 12:35