南亚语系(Austroasiatic languages),其英文名称源于拉丁语“austro-”(意为“南方”)和“asiatic”(意为“亚洲的”),是东南亚最早出现的语言集团之一,包括越南语、高棉语、孟语、佤语等,目前约有1.2-1.3亿人使用,其中大部分为使用越南语的京族人(近1亿人),其次是高棉人(将近2000万人)。

  • 总体情况

南亚语系包括多个语族,但具体的划分方案没有取得共识,各个语族相互之间彼此影响,同时也受到其他语系的影响,难以严格区分出不同的族属。最基本的划分是将该语系各语言分为蒙达语族孟-高棉语族两类,还有的方案将孟-高棉语族进一步划分出核心孟-高棉语族、越芒语族(主要是越南语)、卡西-克木语族、尼科巴语族等。中国云南的佤族、德昂族、布朗族使用的语言共同组成了佤-德昂语支,和卡西-克木语族接近,可视作该语族的一个分支,此外广西的俫语(同名未识别民族的语言)亦属于该语族。

▲南亚语系语言及语族划分。

南亚语系的各语言分布在中国云南省、中南半岛北部、印度东部地区。其中,越南语、高棉语两个超过千万人口的大语言分布在富饶的红河、湄公河下游平原;人口约160万左右的孟语集中在萨尔温江入海口的海岸地带,少量散居在周边的缅、泰山区;其他大多数南亚语系语言分布在中、越、缅、老、印度、马来西亚等国的中高海拔山地,另有少数人(尼科巴语族)居住在尼科巴群岛。

南亚语系所分布的中国云南、东南亚、南亚热带和亚热带地区,包括了河流谷地、丘陵、山区等多种地形,总体而言降水充沛,为水稻、热带经济作物提供了良好的生长环境。越南人、高棉人所处的红河、湄公河下游平原,气候湿润、水热条件优良、土地肥沃平坦,发展出发达的稻作农业,历史上形成了繁荣的城市与国家文明;孟族亦生活在萨尔温江下游的河谷、河口与海岸地带,平原面积较少,但仍然以稻作农业为主,历史上社会文化发达;中缅等国的佤族、德昂族、布朗族,以及印度的蒙达人传统上居住在丘陵和中高山区,植被茂盛但地形崎岖,农村多位于山区,粮食种植规模有限,以玉米等杂粮为主,同时发展出适宜山区地形的经济作物产业,如茶叶、热带水果等;印度的蒙达语族还有部分人采取刀耕火种的迁徙农业。

▲南亚语系分布以及涉及的地形区

  • 演化特点

南亚语系所涉及的各个民族,并非是一个具有共同起源、共同历史的族群概念。南亚语系各民族在不同时期接受这一语言集团下的各个语言,这些民族的来源亦有所不同,部分民族在接受南亚语之前采用过其他语系的语言。

南亚语系形成可以追溯到大约10000年前,具体形成的地点没有定论,不同的学者提出过中国与中南半岛交界的山区、中国长江流域的中游、湄公河流域等观点。如果南亚语系形成可以追溯到10000年前,意味着南亚语系可能比汉藏语系的出现还要早,并且明显早于汉语和藏缅语族的分化。南亚语系后期的分化过程中,也与包括汉藏语系、壮侗语族在内的各语言集团不断产生交集。比如距离今天最近的例子就是缅甸语,无论是语言还是文字方面都受到了孟族的影响,而缅族占据伊洛瓦底江后,又反过来影响孟语的演化。

最早出现的南亚语系语言(原始南亚语),为中国西南、中南半岛北部一带狩猎、采集族群所使用。距今7000-5000年左右,他们开始迁居到中南半岛(包括马来半岛),随后扩散到半岛的大部分地区。

在最近的3000-2000年中,中南半岛的南亚语系各语言受到汉藏、印度语言的影响,分化加剧。逐渐形成了越芒语族、孟-高棉语族、卡西-克木语族等分支。

卡西-克木语族分布在中国、印度、中南半岛各国,其中,中国的佤族、德昂族(旧称崩龙)、布朗族所属的佤-德昂语属于卡西-克木语族。这支族群源自中国西南历史上的“百濮”,后不断南下经哀牢山扩散到中南半岛北部、印度东北部地区,其中,卡西语在印度东北的梅加拉亚邦曾经是官方语言之一。

卡西-克木语族各语言音系相对简单,声调不多,辅音和元音的对比度不如其他南亚语系语言强烈。语序特点常见主宾谓(SOV)的结构,词汇与邻近的藏缅语族语言有一定交流。

▲卡西-克木语族分布。

▲佤邦地区的北佤多属于高寒山区,辖区范围内多为高山峡谷,约95%为山地,仅有不到5%的土地是平坝地区,南佤地区多是湿热泥泞的热带雨林地区。佤邦与中国云南临沧市境内的沧源县班洪乡、班老乡和芒卡镇(南腊乡)相连,是阿佤山在缅甸的延伸。

▲缅甸掸邦北部设立有德昂自治区。目前,缅甸德昂族的民族武装(德昂民族解放军)实际控制区远大于自治区所包括的两个镇(南散、曼通,人口约10万)。2023年缅北冲突后,德昂民族解放军实际控制约1.5万平方公里领土,人口约数十万。关于缅甸的德昂族人口,德昂军方面宣称有100万,缅甸官方宣称30万,实际规模应在两者之间。

▲缅甸的“自治区”,其中包括了佤族、德昂族两个南亚语系民族。官方划定的自治区范围明显小于各民族武装实际控制的范围。

▲老挝的南亚语系族群包括克木人、巴拿人、戈都人,克木人属于卡西-克木语族,后两者语言接近高棉语。

▲卡西语曾经是印度东北部的梅加拉亚邦的官方语言,目前该邦的官方语言为英语。全邦人口300万左右,33%左右的人口使用卡西语,为目前该邦最大的语言群体,整个印度卡西语人口约140万左右。以梅加拉亚高地为界,卡西人主要居住在该邦的东部高地地区,首府西隆亦位于卡西语地区。

进入中南半岛的南亚语系族群,在同化了当地更早定居的古亚洲人(Paleoasiatic)的同时,也接受了其他从北方南下的族群融入。这批南亚语系族群,或单独,或与其他族群一道,沿着河流从半岛北部不断南下,直到湄公河、萨尔温江、红河的三角洲,并与更早进入当地的古亚洲人融合,发生文化和基因交流,这批古亚洲人在相貌和文化上与澳大利亚-美拉尼西亚人(Australo-Melanesian)关系更为密切。

这些越过中南半岛内陆高原的族群抵达伊洛瓦底江、湄南河、湄公河的下游冲击平原,吸收了当地少量更早定居的古亚洲人,并在长期的文化交流中引入大量来自印度的梵语和巴利语词汇(特别是宗教和文学领域),此外还有南岛语系和壮侗语族的借词,分别在湄南河和伊洛瓦底江流域形成了孟语,在湄公河下游形成了高棉语。孟语相比于高棉语吸纳了更多巴利语、梵语成分,高棉语则有更多南岛语系的元素。这两门语言的特点,尤其是词汇方面,反映出中南半岛的教传播和政治联系。孟语、高棉语在历史发展过程中,语法趋于简单化,屈折变化减少,语序和功能词的作用增加。高棉语的语序已经发展为主-动-宾结构,并以功能词标识语法关系。

▲核心孟-高棉语族分布。

▲柬埔寨语言分布,其中巴拿语、仲语等南亚语系语言,被视作山地高棉语。

▲缅甸孟邦。

▲老孟文字母,缅文、西双版纳傣文均在该文字基础上创制出来,目前老孟文已经弃用,孟族改用缅文书写。

▲柬埔寨历史上最辉煌的时期——吴哥王朝,是南亚语系族群历史上建立的最有影响力的国家。

▲吴哥窟

进入红河流域的南亚语发展成为越芒语族,但是其中的越南语和芒语差异巨大,芒语主要分布在越南西部、西北部,今天仍然保留原始南亚语的核心词汇、部分音素,语法上保留了原始南亚语的黏着特征(芒语也显示出一些孤立语的特征,可能是受周边语言影响所致)。越南语保留了一些南亚语系的句法特点,但大部分句法和表达方式已汉化。芒语和越南语相比,更多反映了红河流域没有汉化的南亚语情况。

▲芒语主要分布在越南西北部、西部的山区。

越南语目前分布在红河三角洲、湄公河三角洲以及两者之间的海岸地区,由于红河三角洲在历史上被北方统治了上千年之久,此后也长期作为藩属国来往,大量汉族人移居红河三角洲。因此,地处红河三角洲的原始南亚语受到汉语影响非常深远,原本接近芒语的语言逐渐分化为新的语言。越南语词汇中约60%以上的词汇有汉语来源。除了大量的汉字词汇,越南语还保留了一些南亚语系的基本词汇,但与芒语的词汇差异较大。越南语与汉藏语系的长期接触(特别是汉语的影响)导致了声调演变以及音韵的汉化现象,越南语实际上已经发展成为一门孤立语,同时出现了其他南亚语系语言所没有的音调现象。越南语在语法上与汉语类似,词序和功能词在句法中的作用显著。

▲越南语方言划分。

在马来半岛,保留了更多古亚洲人特点的部分半岛土著(包括塞芒人、塞诺人等),在接触了南下的南亚语系族群后,接受了该语系的语言(语言替代),形成亚斯里语族(Aslian languages)。亚斯里语族群在相貌和生活方式上与孟-高棉语支的族群有明显区别,生产方式传统上更偏向于热带雨林中发展而来的狩猎采集(塞芒人)和小规模的原始农业(塞诺人)。

亚斯里语族的语言中,部分词汇并不是南亚语系固有的,来源不明,很可能就是源自于古亚洲人的语言,并且在马来半岛的热带雨林中发展而来。受地理隔绝的影响,亚斯里语言保留了原始南亚语的特征,比如相比于孟-高棉语族更复杂的音位系统,如鼻化音、声调等,此外还有原始南亚语固有的黏着性特征,其他南亚语系语言已经逐步失去,比如通过词缀或内部变化来表示动词的时态、体态或语态。亚斯里语支使用人口目前约5万人,目前被马来西亚政府认定为土著人群,享受一定的优待政策,但政府对这一族群的强行同化(尤其是宗教方面)使得其与马来人关系较为紧张。

▲亚斯里语族分布:包括北、中、南三支。

▲亚斯里语族分布在马来半岛中部的山区、高原。

距今3000年左右,南亚语系先民进入印度次大陆。进入次大陆的原始南亚语族群在融合了其他族群(如古亚洲人)后,演化形成今天的蒙达语族各族群。

目前,蒙达语族族群大多数在印度境内,人口约700-900万。历史上,蒙达语族被雅利安人、达罗毗荼人排挤到东部的山区中,发展水平较为落后。由于相貌、发展水平与印度社会主流有着较大的差异,他们也成为印度最为封闭、落后的群体之一,大多被划入印度的“表列部落”(Scheduled Tribes)。他们接受了印度宗教与文化的同时,也保留了自己的语言和少量信仰。属于蒙达语族的各民族、族群分散在印度东部各邦(如恰尔肯德邦)。目前印度各邦的官方语言中,还没有蒙达语族的语言。

蒙达语族在词汇上保留了一些南亚语系的古老特征,音系较为复杂,尤其在元音系统和辅音簇方面。该语族各语言有较强的黏着性,词语通过词缀的附加来表达不同的语法意义,例如时态和格标记。蒙达语族分布在印度中部和东部,与印欧语系语言互动频繁,语言特征受到外来影响。

▲蒙达语族分布在印度东部地区,尤其集中在焦达讷格布尔高原一带,当地自然环境远不如恒河平原,包括蒙达语族在内的各民族社会发展较为落后,这里也是印度“表列部落”较为集中的地区之一。

蒙达语族集中的地区地处焦达讷格布尔高原,经济落后,当地表列部落众多,也成为印度“红色走廊”的重要组成,频繁的武装冲突进一步影响了当地的发展。

除了蒙达语族、卡西-克木语族,另一批分布在印度的南亚语系下属语族是尼科巴语族。这一语族目前约1万人使用,居住在尼科巴群岛,尼科巴人主要是孟人和马来人融合形成,尼科巴语应属于核心孟-高棉语族的一部分,但由于远离其他同语族的语言,加上马来人和其他族群的影响,尼科巴人的语言普遍被单列为一个独立的语族。尼科巴人主要信奉基督教,同时受到传统的万物有灵和自然崇拜影响。

▲尼科巴群岛目前由印度安达曼-尼科巴群岛中央直辖区管辖。

  • 南亚语系与苗瑶语系(族)

南亚语系各语族分化严重,核心的同源词数量稀少,难以构建清晰的演化与分化特征。而中国和东南亚的各语言集团(汉藏、壮侗、南岛、南亚、苗瑶)相互之间影响强烈,使得探寻不同语言之间的同源联系更加困难。有人认为南亚语系与苗瑶语系(族)可能存在同源关系,这两个语系在语音、词汇和语法上有一些相似性,但一些学者认为它们之间可能有历史上的接触和语言混合现象,尚无充分证据支持它们同源或属于同一个语言集团。

苗瑶语系(族)主要分布在中国南方、越南、老挝、泰国和缅甸的山区地带。这一语系主要分为苗语(Hmongic)和瑶语(Mienic)两大分支,在中国包括了苗族、瑶族、畲族。苗瑶语族的起源和迁徙路径仍不完全明朗,但一般认为苗瑶族群源自中国南方,后来逐渐向东南亚迁徙。

▲苗瑶语系(族)分布。

南亚语系和苗瑶语系(族)在词汇和语法上存在某些相似性,如相似的语序、语法,部分词汇接近。东南亚早期人群的迁徙和互动非常频繁,可能导致不同语言族群之间相互影响,尤其是农业传贸易在这些言的演变中发挥重要作用,如云南南部、越南北部、老挝一带,南亚语系和苗瑶语系(族)接触频繁,这种接触可能使南亚语系和苗瑶语系(族)之间产生了一些相似性,比如一些共享的词汇和语法特征。目前,这些相似性仅支持解释为语言接触的结果,而不是两者同源的证据。

两者在地理分布上存在相似之处,内部多个语言分布在山区,许多民族具有典型的山地族群的特点。南亚语系占据了亚热带与热带交界的山区,苗瑶语系(族)占据了中亚热带与南亚热带交界处的山区(即长江和珠江两大流域的分水岭)。

▲南亚语系与苗瑶语系(族)分布,两个语言集团的分布地区大致构成了从中亚热带到热带,不同气候区的过渡带。在川圹高原一带,两个族群杂居,联系紧密。

  • 亚洲之外的南亚语系

传统南亚语系地区之外的相关族群,主要是定居欧美各国的越南裔、柬埔寨裔人士,他们在聚居区仍然使用自己的民族语言。

20世纪以后,一批东南亚移民,迁到欧美生活,其中,越南移民是最大规模的南亚语系族群之一,主要分布在美国、法国、德国、澳大利亚等国家。美国越南裔集中在加州、德克萨斯州、华盛顿州等地,法国也有相对较大的越南社区。值得注意的是,这批越南移民不光包括京族人,也包括早些年移民到越南的华人后裔。

许多欧美的越南移民在家庭和社区内仍然使用越南语,相关文化活动和越南语学校的设立也帮助维持语言传统。当然,年轻一代也开始将英语或法语作为母语。

▲美国加州橙县的“小西贡”入口欢迎牌,标注英语和越南语。

▲美国加州橙县的“小西贡”范围,这是全美国最大的越南裔社区,也是越南之外最大的越南人聚居区,当地越南裔人口约20万,整个大洛杉矶地区的越南裔人口约40万。

说高棉语的柬埔寨移民,多集中在美国和法国。美国的柬埔寨裔群体主要位于加州的长滩(Long Beach)和马萨诸塞州的洛厄尔(Lowell)。相比于越南移民的经济实力和文化传承,高棉语主要在家庭和宗教场所使用,文化活动和民族学习不如越南人社区活跃,第二代和第三代使用英语、法语比较普遍。

除了越南、柬埔寨移民,20世纪后半叶中南半岛的冲突也推动了克木人等南亚语系族群作为难民移居美国,他们的生活圈不一定围绕越南人或柬埔寨人等南亚语系族群,而与苗(赫蒙)等其他语系的东南亚山地民族联系更为密切。他们不仅都是作为难民移居,同时在信仰和文化方面具有传统东南亚山地民族色彩,正如东南亚的克木人与苗人杂居共生,美国的克木人也经常参与苗人的社区活动,目前美国克木人多居住在加州、明尼苏达州等地。