作者CCY0927 (茹絮梦)
看板TW-language
标题[分享] 语言亲缘关系常见的几个迷思:兼论语言与方言
时间Fri Oct 3 21:37:53 2025
https://www.sinica.edu.tw/cp/695
【专栏】语言亲缘关系常见的几个迷思:兼论语言与方言
作者:陈彦伶助研究员(本院语言学研究所)
美国夏威夷大学语言学系毕业,目前任职於语言学研究所。研究专长为历史语言学、接触
语言学。透过分析东亚与东南亚的少数民族语言,尝试为语言间错综复杂的关联提出解释
。
看日剧、韩剧的时候,你是否想过日韩语有些词汇为什麽听起来这麽像台湾台语?这些语
言彼此间的关系又是什麽?
两个或数个语言若能追本溯源到同个祖先,语言学称之为同源(genetically-related)
。语言若发源於同个古语(proto-language),其後代就如後代子孙一样,彼此间有着亲
缘关系。而同源的语言,自然归属於同个语系(language family),与族谱、籍贯的概
念有着异曲同工之妙
然而,台湾台语、日语、韩语之间其实毫无亲缘关系。这些词汇之所以相似,其实是语言
彼此互相借用的结果。汉语、日语、韩语古时同属汉字圈,因往来密切,日、韩语里有着
大量的汉语借词,且利用这些汉字再造新词汇,尔後汉语再反向借入。
举例来说,日语「电话」(denwa)是和制汉语,先出现於日语中,才借入华语。而「窗
帘」カーテン(kaaten)则是日语先从英语借入curtain,台湾台语因日治时期受日本文
化影响,再从日语借入。韩语因音节结构与台湾台语相似,皆允许非鼻音韵尾,所以台湾
台语的「结婚」kiat-hun和韩语的「结婚」(gyeol hon)听起来才会这麽像。相较
於台湾台语还保留着中古汉语的入声韵(音节以 p、-t、-k收尾),华语早已丢失入声韵
,因此「ㄐㄧㄝˊ」和韩语的gyeol在感知上相去甚远。
日语中的汉语借词有时并不易辨识,如:数字1「いち」(罗马拼音写成ichi),实为汉
语借词,因受日语倾向以元音或鼻音收尾所致,所以在音节尾补上了元音/i/,和中古汉
语拟音*jiet(读起来像台湾台语的「一」/it/)看起来大不相同。除了跨语系借用外,
同语系内部借用也很常见,例如:英语有大量的法语借词,且和法语同属印欧语系;闽南
语所谓的「文白异读」,其中文读层便源於自官话(汉语底下一个分支)。
值得注意的是,此处的汉语、日语、韩语指的是语系或语支(language branch),并非
指从哪个特定的语言(language)、方言(vernacular或dialect)或地域语((regional
) variety)输入。考量到读者的语言使用,本文选择以华语、台湾台语读音作为汉语支
代表,华语不等於汉语,台湾台语也不等同於中古汉语(台湾台语音节结构和中古汉语相
似,不代表古人都讲台湾台语)。
语言系属不能以借词作为分类依据
World Loanword Database所调查的2131个日语词,有36%来自外来语,以源自汉语的词汇
为大宗、英语次之。事实上,汉语、日语、韩语在语言学上并不同源,日语并不会因为有
着汉语借词,就变成汉语的一种。语言系属(genetic classification)最重要的指标乃
(一)规律语音对应(recurrent sound correspondences,得搭配核心词表Swadesh
List或是Leipzig–Jakarta list使用、(二)构词,尤其是黏着语素(bound
morphology)。
为什麽必须核心词表才能算数呢?主要是因为,所有的语言成分,不论词汇、语素、音素
、论元结构、语意讯息等等,无一不能借用,只是机率高低的问题。而规律语音对应必须
立基於同源词,将范畴限定於核心词汇,能降低借词出现的机率,不会因借词而误判语言
间的亲缘关系。而构词成分移借的案例并不常见。譬如越南语的被动式的b ,便是源於
汉语表「遭受」之意的「被」,但汉语支和越南语也不同源。
借词常出现於科技、政治、宗教、数字、亲属称谓、文化、家具、食物等领域。以汉语为
例,「浮屠」、「刹那」源於梵文的(budh)和(kaa),因借入
时间够长,大家未必会意识到是外来词。汉语向周遭语言输出了不少数词,日语、韩语、
越南语虽和汉语不同源,但都有着两套数词,其中一套,便是从汉语而来。泰语属侗台语
系的一员,和汉语没有亲缘关系,其数词2至10(及相关组合)正是承继原始台语(Proto
-Tai,和台湾台语一点关系也没有)里的汉语借词(2源於汉语的「双」,其余源自相对
应的数字)。
泰语里食物相关的外来语,如:「粿仔/河粉」(kuuey tiiaw)、
「豆腐」(tau huu)、「油条」(paa thɔɔ
koo)、「肉粽」(ba taa)、「冲(咖啡)」(tho),
来自闽语潮汕话的「粿条」、「豆腐」、「白糖粿」、「肉粽」、「冲」。日常用品「桌
」(to)、「椅」(kau ii)、头衔「老板」
(thau kɛɛ)也是从潮汕话的「桌」、「交椅」、「头家」借来的。此外,潮汕裔家
庭所讲的泰语,可能还会参杂潮汕话的「阿妈」(aa maa)、「阿公」
(aa ko)、「兄」(hiia)等亲属称谓。潮汕话和台湾台语有亲缘关
系,大家可以用台湾台语念念看这几个词,是不是很像呢?
当源於同个语源的借字量够多时,即可产生规律语音对应,或是出现新的构词手段。举例
来说,日语汉语借词的「汉音」能和隋唐的中古汉语呈现规律语音对应;英语常见-ism、
-tion、in-、 tele-等词根,也是大量借用法语词汇下的产物。若我们错将上述领域的词
汇当作判定语系或语支的证据,就会做出错误的推断,像是把西日耳曼语支的英语当作拉
丁语支的一员。换言之,继承自同个先祖的核心词才是判断语言是否同源的依据。
顺带一提,从语言系属划分的角度看来,词汇移借是很普通的现象。不受外界干扰的语言
,实属罕见,可能只会出现在使用者与世隔绝的情况下。然而,并不是出现借用,该语言
就会成为洋泾滨(pidgin)或克里奥语(creole)。此外,一个人的用词遣字也反映着自
我认同,有区辨你我的功能。读者可以思考一下下列词汇自己用的是哪个版本:「影片」
/「视频」、「镜头」/「摄像头」、「人工智慧」/「人工智能」、「塑胶」/「塑料」、
「大学生」/「本科生」、「检举」/「举报」、「CP值」/「性价比」、「封锁」/「拉黑
」、「品质」/「质量」、「回馈」/「反馈」、「不会」/「没事」。
语言系属不能以类型学作为分类依据
类型学特徵(typological features)也不能作为语言系属的证据,亦即句法特徵、语音
特徵、音韵特徵、构词特徵等等,都不能应用在系属判定上。以人为例,看起来相像的两
个人,并不一定是亲戚,而有血缘关系的两个人,未必看起来很像,语言亦是如此。日语
、韩语动词居於句末,越南语、华语、壮语为声调语言,蒙古语、土耳其语都有元音和谐
(vowel harmony),以上结构特徵都不能作为同源的佐证。同源的语言彼此间不见得看
起来很像,嘉戎语和华语同属泛喜玛拉雅语系(Trans-Himalayan languages,又称汉藏
语系),但嘉戎语有着复辅音(consonant cluster)和丰富的构词,乍看之下彼此毫无
关联。
https://i.urusai.cc/Ka7VM.png
语言系属不能以通话程度作为分类依据
同个语系的语言不代表彼此能相通,通话(mutual intelligibility)乃区别dialect和
language的手段,而非语言是否同源。来自不同地方的单语语者(monolingual)若能理
解彼此,他们说的话就是同个language底下的dialects,理所当然属於同个语系。台湾本
岛的南岛语和菲律宾的他加禄语(Tagalog)都是南岛语系的成员,但无法通话。相较之
下,兰屿的达悟语和巴丹岛上的伊巴丹语(Ivatan)因分开时间相对短,基础沟通还可以
。有些语言因地理阻隔之故,还形成了方言链(dialect chain),物理距离越近的地域
语彼此理解无碍,距离越远的地域语则有理解对方的困难,实质上为不同语言。
有些语言在这世界上孤家寡人一个,学界将之称为「孤立语言」(language isolate;勿
和缺乏型态变化的「孤立语」(isolating language)混淆)。比较有名的有西班牙境内
的巴斯克语(Basque)、日本境内的爱奴语(Ainu)。日语和韩语曾被视为孤立语言,但
日语(Japanese)其实属於日本–琉球语系(Japonic language family)底下的一员,
琉球语支(Ryukyuan)为其姊妹语言(sister languages);韩语(Korean)和济州语(
Jejueo)组成韩语系(Koreanic language family)。北海道、本洲、四国、九州的日语
和琉球群岛的琉球诸语并不相通,朝鲜半岛的韩语和济州语彼此间亦不能通话。除了琉球
诸语和济州语外,琉球群岛跟济州岛也通行日语跟韩语。
语言系属不能以文字作为分类依据
语言是否同源,也不能以文字断定。中国境内的蒙古语以传统蒙文书写,蒙古国的蒙古语
采西里尔字母、传统蒙文并行的方式,便是同个语言以不同文字系统书写的写照。泰雅语
、越南语、法语都以拉丁字母书写,彼此间并无亲缘关系。同理可证,台文不会因为以方
块字书写,就变成官话底下的方言,也不会因为以罗马字作为媒介,就变成英语的一种。
语言系属不能以非语言学证据作为分类依据
语言系属分类不可以以非语言学证据作为同源的依据。考古学证据着重在过去的人类活动
、遗传学证据关注各族群的基因研究。语言和人不是一对一对应的关系,因迁徙造成的语
言转移并不罕见。以台湾为例,汉化後的平埔族多半操持华语或台湾台语,但其DNA并不
会使汉语变成南岛语的一种。
小结
本文旨在破除语言系属分类上几个常见的迷思。然而,语言系属的划分实属学术需求,应
用到现实生活,还得考量实际层面的问题。俗话说得好,A language is a dialect with
an army and a navy。马来语、印尼语在学术上是同个语言底下的不同方言(dialects
),因分属不同政治体,故在现实世界被当作两个独立语言;中国境内的侗台语系(Kra-
Dai)、苗瑶语系(Hmong-Mien)彼此虽毫无亲缘关系,但因政治诉求,通通归在汉藏语
系底下。总之,现实生活中的系属判定会受到诸多因素影响;倘若分类的最终目的为学术
研讨,建议还是得循学界标准论述。
相关文献
● 教育部台湾台语常用词辞典(
https://sutian.moe.edu.tw/zh-hant/)
● 孙天心、石丹罗,2002。草登嘉戎语与「认同等第」相关的语法现象。语言暨语言
学第三期第一卷,页79-99。
● Campbell, Lyle. 2013. Historical Linguistics: An Introduction. Edinburgh
: Edinburgh University Press.
● Schmidt, Christopher K. 2009. Japanese vocabulary. In Haspelmath, Martin
& Tadmor, Uri (eds.), World Loanword Database. Leipzig: Max Planck Institute
for Evolutionary Anthropology, 2131entries.
(
http://wold.clld.org/vocabulary/21 )
● Shimoji, Michinori. 2022. An introduction to the Japonic languages:
grammatical sketches of Japanese dialects and Ryukyuan languages. Leiden;
Boston: Brill.
● Tadmor, Uri, Martin Haspelmath, and Bradley Taylor. 2010. Borrowability
and the notion of basic vocabulary. Diachronica 27:2 (2010), 226–246.
doi:10.1075/dia.27.2.04tad
● Yang, Changyong, William O’Grady, Sejung Yang, Nanna Haug Hilton, Sang-
Gu Kang, & So-Young Kim. 2019. Revising the Language Map of Korea. In S. D.
Brunn, R. Kehrein (eds.), Handbook of the Changing World Language Map.
https://doi.org/10.1007/978-3-319-73400-2_110-1
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.255.101.141 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/TW-language/M.1759498679.A.EDF.html
※ CCY0927:转录至看板 Linguistics 10/03 21:38
1F:→ Parafolia: 什麽都不能,连辞汇都可能被打成借词,还有什麽标准? 10/16 12:02
2F:→ Parafolia: 日韩琉的归类也很怪,把京都东京津轻凑一凑也可以啊XD 10/16 12:04
3F:→ CCY0927: 文章应该是说词汇语音在找规律对应的时候,要小心借词的 10/17 01:00
4F:→ CCY0927: 影响,尽量降低借词出现的机率,所以才会提到搭配核心词 10/17 01:00
5F:→ CCY0927: 表。 10/17 01:00
6F:推 Asvaghosa: Parafolia 根本没看懂 10/18 12:36
7F:推 liaon98: 1F也不算乱喷啦 如何判断一个词到底是同源还是借词 10/18 16:05
8F:→ liaon98: 也是一门学问 一些拟构的大型语系 使用的同源证据 10/18 16:05
9F:→ liaon98: 也常会被别派学者反驳认为那是借词而不是同源 10/18 16:05