作者MilchFlasche (Borg Eraser)
看板TW-language
标题Re: [请教] 创造台语文字
时间Fri Apr 21 20:16:09 2023
※ 引述《shyuwu (El Cid)》之铭言:
: 标题: Re: [请教] 创造台语文字
: 时间: Thu Apr 13 23:50:19 2023
:
: 两三冬前,我开始耍人工文字,形式是母音附标,无佮声调
:
: https://i.imgur.com/IPkuwh9.jpg
:
: 即嘛来共改做谚文,阁佮声调
:
: https://imgur.com/a/VBTcdwH
:
: 春晓例文
:
: https://imgur.com/a/eUWfK5t
:
: 罔耍罔参考
:
:
:
: --
:
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 42.79.189.100 (台湾)
: ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/TW-language/M.1681401021.A.D3E.html
: → lorena409: 第一张像卢恩符文XDDD 04/13 23:56
: → shyuwu: 卢恩XD 我兮原始设计毋是字母,是母音附标,爱去看这绾主 04/13 23:59
: → shyuwu: 题顶一篇兮推文兮图啦 04/13 23:59
: ※ 编辑: shyuwu (42.79.189.100 台湾), 04/14/2023 07:38:46
: → saram: 声调一定要有.汉语的注音用字,没标示声调,等於自由唱歌了. 04/14 08:15
: → shyuwu: 原始设计毋是为着台语,是人工语言。到遮着牵了较远去矣 04/14 08:19
: ※ 编辑: shyuwu (42.75.110.211 台湾), 04/14/2023 14:47:47
: → saram: 人工语言到最後会成生活语言.如果经得起考验的话. 04/14 23:24
: → tbrs: 不过文字这种东西从来都是人工的 04/15 02:27
: → shyuwu: 社会自然发展出来,交人为发明兮,总是无仝。韩国字着是 04/15 08:24
: → shyuwu: 上好兮例,北美兮惹拉义 (切洛基) 嘛是发明兮,可能阁影 04/15 08:24
: → shyuwu: 响着西非诚济文字发明 04/15 08:24
: 推 MilchFlasche: 某人是不是帮帮忙一下,「人工语言」和创造文字怎麽 04/16 20:58
: → MilchFlasche: 会一样???又在那边语、字不分了 04/16 20:58
: → MilchFlasche: 然後人造语言指的是像esperanto这种 04/16 20:59
: → MilchFlasche: 或是Klingon、Quenya这种,除了爱好者小圈子外, 04/16 21:00
: → MilchFlasche: 不会变生活语言;所谓日久会形成新语言的, 04/16 21:00
: → MilchFlasche: 是creole混合语,例如海地语,或青海五屯话, 04/16 21:00
: → MilchFlasche: 或寒溪语,这些才真的是生活用语。嘛帮帮忙! 04/16 21:01
: → MilchFlasche: @all:创造文字系统是每个人都可以做的, 04/16 21:09
: → MilchFlasche: 「人工」两字可以拿掉,因为书写系统何尝不是人造的 04/16 21:09
: → MilchFlasche: 欢迎多po多交流。我20年前研究所时上课也偷画扩充式 04/16 21:10
: → MilchFlasche: 谚文来写鹤+客+华语,但或许像这两天大家po的, 04/16 21:11
: → MilchFlasche: 大刀阔斧全改,设计起来比较不会被旧系统绑住 04/16 21:11
: → MilchFlasche: 不过不管谚文或字喃/西夏文,因为都是一音节一方块 04/16 21:12
: → MilchFlasche: 字符太多,对Unicode制订和字型制作都是一大挑战哦 04/16 21:12
: → MilchFlasche: 纸上画画或是用电脑绘图还可以。有兴趣就加油罗 04/16 21:13
: 推 tbrs: 原来人工智慧时代了 这符号的难打老问题还是难以解决 04/16 21:15
: → MilchFlasche: 因为要进入国际通用标准就旷日废时 04/16 21:17
: → MilchFlasche: 而且就算是前电脑的活字时代,这麽多字符你也是得花 04/16 21:17
: → MilchFlasche: 大钱(开足济钱)请工坊铸几万个活字(那也是font) 04/16 21:18
: → shyuwu: 国际统一码有字符,嘛有附加符号,欲斗一个音节应该是无 04/17 15:11
: → shyuwu: 遐困难矣 04/17 15:11
爱看字骨(font,字型)。
这马我所知影大部分会使共附加符号(combining diacritic marks)
好好势势囥到其他字符面顶个,
上主流犹阁是罗马字个字骨。
因为,斗起来个时阵,附加符号个位置爱倚左爿几若点(pt)?、倚面顶几若点?
相对位置拢爱设计过。
附加到罗马字面顶个效果,佮附加到 Hangul 面顶个效果,
犹是爱试看觅。
若有侬试出来可行个组合方式、有理想个字骨,欢迎分享。
: → shyuwu: 是讲古早文字因为毋知是啥人、抑是一阵人有意识创造、改 04/17 15:29
: → shyuwu: 编兮全新系统,所以咱拢共当做是自然发展兮。 04/17 15:29
是。毋管讲文字是人工造作个,抑是自然发展个,
拢干焦是无仝角度来讲,拢成立;
逐家莫像 saram 共「文字」vs.「人造语言」vs.「creole 混合语言」
概念完全相滥乱使讲着好矣!
: → saram: 谁说一开始就要上网路电脑文字页? 04/18 17:07
If you have eyes, please check out my comment:
": → MilchFlasche: 字符太多,对Unicode制订和字型制作都是一大挑战哦 04/16"
": → MilchFlasche: 纸上画画或是用电脑绘图还可以。有兴趣就加油罗 04/16"
: → saram: 台语注音字与台文字有一个共通版本吗?孩子都没出生,就替他 04/18 17:09
: → saram: 申请入学? 04/18 17:09
: → saram: 几百个白话字没造出来而被教育部选定,不会有真正台语文字典 04/18 17:11
^^^^^^
汉字就汉字,所有的汉字是同一个集合,
哪里分什麽「白话用的字」、「文言用的字」了?
台语用的「白话字」就是 POJ,就是 Pe h-ōe-jī 啦,
每次看你在那边把专有名词拿去乱用,真的很白目。
ROC 统治台湾当局推荐写台语的叫作「推荐汉字」啦,
而且也不是都罕用字啦;
然後华语 Mandarin 自己也一堆罕用字啦不用说别人
然後全世界的资讯系统进入 Unicode 时代以後没人在「造字」或用「外字集」。
全球网际网路时代绝对需要 Unicode,就是让同一个码点(code point)
不管在哪个国家的系统中,refer 到的都是同一个字符(当然字型可以有所差异),
才能避免不同内码的资料交换时变成一堆乱码
「造字」和「外字集」的发行,是 Unicode 还不普及的年代才要做的事:
Big5 标准最早只有 5401 字,所以大量的罕用字,尤其公家机关、户政,
遇到民众的汉字名字有罕用字,只好自己从 Big5 标准没有制定到的空缺中,
用程式去自己画点阵字(一样点点点),这就是「造字」
(以前倚天中文有相关工具箱);
但是後来台湾中文系统的字集有扩大了,我记得是到 14000 多字,
所以「造字」的需求慢慢少了;
但还是有些罕用字,刚好进入 Windows 时代,
所以有些字型商(华康、金梅、文鼎等),有些字型会搭配「外字集」,
补足主字型档缺的字。
但这些都不是 Unicode 标准,都是台湾自己的 Big5 标准,甚至只是个别单位在用,
根本无法交换和流通,这个单位在这个码位造的字,拿到别的单位的电脑可能就变别的字
Unicode 组织和标准制定以後,
世界各国的人就只要一直向 Unicode 提交新字符的描述就好了,
汉字也是,常用字制订完,扩充字 Ext-A、B、C、D、E……
十几年来已经不知道到几面了,
普世的标准制定出来,再加上字型商或是一些超级神心的机构提供支援的字型
(例如日本人做的 HanaMin A、B 花园明朝体,支援 7 万多个汉字),
这样同一个字在支援 Unicode 系统的电脑上打出来都是同一个字,
这样透过网际网路交换才不会乱掉嘛!
然後有这些制定好的字元,搭配字型商的产品,当然谁要拿来写什麽语文都可以
这不是用你的早年脑袋看到的「造字」造出来的好吗!!!
但这几万个 CJK Ideographs 难道是一蹴可几的吗?
标准的制定、字符的审订、字型的制作(详下),
东亚文字的工作量硬是比其他文字系统多了 n 倍;
还有 Hangul 也是,所有的音节组合多达几万,
一般的韩文字母支援的甚至都是以常见的一、两万为主,
所以 CJKV 汉字字型、韩字字型,成本都比欧美字母字型高非常多,
这不是常识吗?
所以我说我非常尊重设计新文字系统的人,
但是不管是走西夏文路线、韩文路线、字喃路线,
那都是多少的字元和工作量,
要普及化和资讯化的话也是要进 Unicode 这关才会上世界台面,
又不是每个人都要像习近平一样「内循环」、做自己单位里少数人在用的东西嘛。
所以,用手写来设计、分享、写作,
我绝对欣赏,
但是当我在那边说现实上的现代技术门槛越来越高时
(我也不是要吓人,就是讲一下现在环境又不同以往了,新的文字系统的产生,
可能会长期处於难以进入现代资讯交换的体制内,如此而已!)
(其实就算是非资讯时代,不也是要花大钱请工匠铸一大批活字?我先前讲过了)
就请你 saram 不用在那边不懂装懂,把很复杂的事情说得一派轻松、
再次用错误的资讯误导板友、误导世人,谢谢!
: → saram: 中文电脑怎麽来的?为什麽那麽快速? 04/18 17:12
: → saram: 因为现成就有国语字典存在,挑一万多个常用字出来,就能 04/18 17:13
: → saram: 进入图形显示系统了. 04/18 17:14
真的很瞎耶。你以为早年那些零壹、倚天、宏碁的汉字那些 16×16、24×24 的点阵字,
不需要由员工一个一个字点是不是?(先不管是以前的什麽「字型扩充卡」(「汉卡」)
还是磁片式的中文作业系统哦)
你以为早年的「中文电脑」是把字典翻开、用照相网片,
就可以进入「图形显示系统」?
○咧你会不会太跳跃了啊,活得久但不要把故事中间都忘光光好吗
「图像」、「图形」咧,你觉得解析度够好的一个「字」的图像,
512×512 好了 = 262,144 bit = 32,768 byte,也就是 32KB,1 个字;
1 万字 = 32 万 KB = 320 MB
好了,温馨提醒,早年的 DOS 电脑常见的软碟片,一张 5" 1/4 磁片是 1.2 MB、
一张 3.5" 磁片是 1.44 MB……
我不够老,我小三开始用电脑那时倚天好像是「飞碟三号」
早年的中文电脑最早就只有 16×16 点阵字,
那也是每个字 256 格一个一个去点出来的好吗!
这个年代台湾还很少图形化介面作业系统,
苹果最早的麦金塔那种奢侈品我也是大一点才知道有钱人用得到那种东西,
庶民都在用 DOS + 倚天,那叫纯文字介面;
做中文游戏的人甚至可能往往要自己点字型
进入 Windows 以後,出现 TrueType font,
那也是要字型设计师一个一个用贝兹曲线或是什麽我不懂的向量曲线,
去拉出来的耶!!!
用的人你是觉得中文电脑什麽很快速?发展很快速?处理很快速?
用的人当然觉得什麽都嘛快,
但是要把你所谓什麽一万多个中文字典里有的常用汉字光是弄到早年的 DOS 电脑
或其他的纯文字介面电脑、後来的图形介面作业系统,
比起用 26 个罗马字母的欧美人,需要多少成本多少人工和血泪这难道想不到吗???
不用自己动手,出张嘴,最简单,最快速啦!瞎!
: → saram: 你就用手写吧,当作电脑尚未问世,大家还在铅字排版. 04/18 17:16
: → saram: 但至少刻字前也该把台文造出来不是吗? 04/18 17:17
: → saram: 能写出来,就能藉图档在电脑显示了. 04/18 17:18
显示图档 okay 啊,有多少字元,就做多少图档,
然後编号,你还要做对照表,
然後要显示句子、文章的时候就各显神通,
HTML,就打一大堆 <img src="00001.jpg"> <img src="13048.jpg"> 啊,
你当然可以写程式或小脚本加快输入或产生 HTML 码的过程,
但也要你会写程式啊;
文书处理软体?是要把一大堆图档用滑鼠一个一个拖放到软体里开始排版吗?
都可以的,我绝对是尊敬的,正因为新的文字系统
进入能够具有自己的字型、输入法来便於输入的阶段前,
这种手写或手绘的字符在「图档的时代」需要不少工程才能处理,
所以我绝对尊敬有热情的人。
但是我就不齿自己不会动手、出一张嘴、己愿他力,
还一天到晚鄙视罗马字、攻讦现有汉字书写的努力、
一天到晚嚷嚷什麽每种语言一定要自己造字、不造字他就看不起的 saram 啦,
不懂的一堆、信口开河,抱着错误的认知观来看待语言及书写、资讯处理、
语文的现代化、资讯化这些议题,
每次随便说几句,就需要人家大量说明免得误导视听。
不过没关系,我以後储存 FAQ,看是不是就复制贴上就好,
反正有人想来想去都不出那几套,转不出来。
--
【爱湾语 Aiuanyu】关怀台湾语言现在未来的转播站
https://www.facebook.com/Aiuanyu
【Taigi123】汝个台语小学堂
http://taigi123.ga/
【Hakka123】摎你共下来讲客
http://hakka123.ga/
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 59.127.130.221 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/TW-language/M.1682079372.A.F92.html
1F:→ MilchFlasche: 我就说乐见纸上画或用电脑绘图了, 04/21 20:17
2F:→ MilchFlasche: 还要硬要出来假gâu 04/21 20:17
3F:推 annisat: 发现这些事我都做过XD 在编码上手绘字元或是JS造字等等等 04/22 10:21
4F:→ annisat: Unicode3.0有IDC,但是这区好像还很少平台有支援 04/22 10:21
5F:→ annisat: 就算有支援,编出来的码就跟之前不一样了,很多自动化文 04/22 10:22
6F:→ annisat: 字处理会不适用 04/22 10:22
7F:推 tbrs: 我只有玩过造字软体而已 对电脑事情一窍不通 04/22 20:22
8F:→ tbrs: 用画的倒是很简单 随便撇一撇就一个新字出来了 04/22 20:23
9F:推 tbrs: 自制台语字就这样小画家造出来玩 04/22 20:25
10F:推 shyuwu: 欲用电脑斗字母音节确实无遐简单,我设想兮台语文字阁有 04/22 20:27
11F:→ shyuwu: 一种是音节文字,亲像日语假名仝款,只要共韵尾参声调改 04/22 20:27
12F:→ shyuwu: 做附加符号着好办矣。 04/22 20:27
13F:→ MilchFlasche: 楼顶咱讲个较成「母音附标文字」,像泰文 04/23 20:58
14F:→ MilchFlasche: 假名是音节文字 04/23 20:58
15F:推 shyuwu: 我设想兮台语音节文字毋是我进前贴兮,是按算共现有汉字 04/24 13:23
16F:→ shyuwu: 当做灵感,仝款是共一个子音-母音兮音节写做一个字符,甚 04/24 13:23
17F:→ shyuwu: 至共子-母-子写做一个字符嘛无要紧。 04/24 13:23
18F:推 annisat: 我自己现在在做的,我觉得在现代情境下比较有意义的 04/25 09:40
19F:→ annisat: 是让新字字型可以比较快速产生的方法,对新的Unicode应用 04/25 09:42
20F:→ annisat: 应该有很大的帮助 04/25 09:42
21F:→ MilchFlasche: 有在做的都加油,欢迎随时分享 04/25 12:48
22F:推 shyuwu: 18楼兮赞喔 04/25 20:33
23F:→ MilchFlasche: IDC我知道,期待成果 04/27 16:10