现代越南语是一种与汉语非常相似的语言,可以说它是与汉语最接近的外语之一。之所以这样说,是因为越南语在历史上深受汉语的影响,至今其词汇中约有60%以上的词汇都来源于汉语。除此之外,越南语与汉语一样,都是世界上少数具有声调特征的语言之一。根据不同的声调评定标准,现代越南语的声调数目大致在6到8个之间。更值得注意的是,越南语的语法也曾深受汉语的影响,譬如两者都很少通过词缀来表示语法意义,而是通过语序结构(如主谓宾)来传达信息。此外,越南历史上也长期使用过汉字。尽管如此,绝大多数语言学研究仍然将越南语归入南亚语系,而非与汉语同属汉藏语系。这种不同的语言归属,意味着越南语的起源与汉语仍然存在差异。那么,为什么越南语会被归入南亚语系?南亚语系包含哪些语言?它又源自哪里,并经历了怎样的历史演变呢?
在前文中,我们已经提到了越南语与汉语有很多相似之处,特别是在词汇和语法方面。可以说,越南语无论是在词汇量还是语法结构上,都是与汉语最为接近的语言之一,尤其是在词汇方面,越南语中大量的汉语借词占据了总词汇的60%左右。
这些汉语借词大致可以分为三类:古汉越词、汉越词和越南化的汉语词。古汉越词是指在唐代之前传入越南的汉字词汇。比如“飞”(bay)、“帆”(buom)、“房”(buong)等词汇,虽然它们源自汉语,但其音韵与现代越南语中的汉越词并不完全一致。其次,汉越词主要指的是唐代前后,汉语对越南语的词汇影响。如今,这些汉越词已构成越南语汉语借词的主体,占据了整个词汇的60%左右。在政治、经济和法律等领域,汉越词的比例甚至达到70%到80%。因此,在越南语的日常交流中,像“科学”(khoa hoc)、“教育”(giao duc)、“政治”(chinh tri)、“历史”(lich sir)、“和平”(hoa binh)、“医院”(benh vien)等词汇,几乎无一例外都是汉越词。
由于汉越词在越南语中占据着如此重要的地位,越南语甚至形成了一套完整的汉字音读体系。这些词汇的发音与唐宋时期汉字的发音有着较强的对应关系,正是这种语言现象使得越南语和汉语看起来如此相似。然而,除了这些汉越词,越南语中还存在少量近现代从汉语借入的词汇。尽管这些词汇的发音经过越南化,但与汉越词相比,它们在音韵上有一定差异,因此被归为另一类。
不仅如此,越南语的语音和语法结构也明显受到汉语的影响。以语法为例,原始越南语在语法构造上和其他南亚语系语言类似,采用屈折形式,也就是通过词缀来表达语法功能(例如英语中的动词词尾“-ing”表示进行时,“-ed”表示过去时)。然而,由于越南语深受汉语的影响,现代越南语中这种屈折变化已经极为罕见。另外,原始越南语曾有一些复杂的复辅音现象,如“bl”、“gl”、“ml”以及“mnh”等几个辅音连读现象。但受汉语影响后,现代越南语中这种现象也显著减少。而越南语中的声调系统,也无疑是受汉语影响的产物。在其他南亚语系语言中,几乎没有类似的声调特征。
尽管如此,越南语中的汉语影响主要来自大约两千年前的中国,许多史料也能追溯到这一时期。因此,虽然现代越南语与汉语有很多相似之处,但这并不意味着它们有着相同的起源。在最能体现语言起源的基本词汇方面——例如人称、数词、亲属称谓、身体部位等,越南语与孟语、柬埔寨的高棉语等南亚语系语言有着更多相似之处,而与汉藏语系的语言差异较大。即使越南语的语法已深受汉语影响,但它的基本语法结构依旧与南亚语系的其他语言保持一致。而且,越南语中依然有接近40%的词汇是纯越南语词汇,与汉语毫无关联。因此,从语言的根源来看,越南语和汉语、甚至整个汉藏语系并不属于同一体系,它仍被主流学者归入南亚语系之中。
说到南亚语系,我们不妨简单了解一下它包含的语言种类。南亚语系,或称澳亚语系(这一名称有时会引起误解),包括168种语言,其中越南语是最大的语言种类。除此之外,南亚语系还包括柬埔寨的高棉语、缅甸和泰国的孟族所说的孟语、以及我国、老挝、缅甸和泰国等国少数民族所使用的佤语。此外,南亚语系还包括广泛分布在南亚各国的桑塔利语等语言。
从全球范围来看,说南亚语系的语言的人口总数大约为1.2亿人,其中越南的使用者约有8500万,主要是越南的京族人(越南总人口超过1亿,其中少数民族约1500万)。在柬埔寨,总人口约1600万,其中高棉人约1300万。此外,印度的22种法定语言中,也包括了桑塔利语,约有700万人使用。
南亚语系内部分为两个主要语族:蒙达语族和孟-高棉语族。蒙达语族包含一些南亚国家的语言,如桑塔利语等。孟-高棉语族则包括越南语、高棉语和孟语等,主要分布在东南亚地区,语言种类接近100种。越南语属于孟-高棉语族中的越芒语支,除了越南语,芒族的芒语也属于这一支。芒语与现代越南语相近,虽然其中的汉语借词较少,因此也可以视为一种未被汉化的越南语。
虽然现代学者普遍认为南亚语系是一个独立的语系,与汉藏语系等没有共同起源,但一些学者认为,南亚语系与汉藏语系的先民曾有共同的历史渊源。根据一些学者的研究,约5万年前,东亚、东南亚和美洲的先民曾属于同一族群。大约2.5万到1.5万年前,南亚语系的先祖与东亚和美洲土著族群发生了分化。差不多在这个时期,东亚的某个分支迁移至东南亚海岛地区,并逐渐取代了当地原住民,成为南亚语系族群的祖先。
约1.5万年前到1.2万年前,南亚语系族群成为东南亚海岛地区的主导群体。然而,约1万年前,他们逐渐受到了南岛语系族群的排挤,一部分南亚语系族群迁回了亚洲大陆,另一部分则与南岛语系族群发生了融合。
大约5000年前到4000年前,南亚语系的先祖从中国的长江流域进入中南半岛。关于他们的迁徙路线,目前有不同的学说,可能经过岭南、云南或越南沿海等地。这一时期也被认为是原始南亚语的形成期。而现代基因研究表明,这批人的父系基因在东南亚和东亚的不同族群中都有一定的分布。
这些早期的南亚语系族群进入中南半岛后,其中一部分开始向西扩展,约4000到3000年前进入南亚次大陆地区,成为今天印度、巴基斯坦和孟加拉等国的南亚语系族群的祖先。通过基因研究发现,这些进入南亚的南亚语系先祖大多数为男性,而今天南亚语系族群的父系基因大多为O1b,而母系则主要来源于南亚本