编
者
按
吉林大学古文字学科有着悠久的传统,自创立以来,会集了于省吾、姚孝遂、林沄、汤余惠、吴振武等学术名家,产生了大量具有重要影响的经典成果。经典常读常新,“吉大古文字”微信公众号特开辟“经典常新”栏目,回顾古文字名家的治学历程与经典论著,以传承、发扬前辈学者的优良治学传统。
本期登载林沄先生《谈谈汉字历史中的几个问题》一文,是林沄先生于2011年3月4日在清华大学王国维讲座上所作的报告,由孙飞燕据录音整理,本人审阅。后载于《出土文献》第2辑,中西书局,2011年;收入《林沄文集·文字卷》,上海古籍出版社,2009年,第247-271页,今据后者推送。
林沄,1939年2月27日生于上海。1962年北京大学考古专业本科毕业,1965年吉林大学历史系考古专业研究生毕业。吉林大学考古学科创始人之一。现任国家社科基金项目考古学评审组成员、教育部社会科学委员会委员、国家古籍整理出版规划小组成员、教育部高校古籍整理工作委员会委员,曾任中国古文字学会理事长。1992年被国家人事部授予国家“中青年有突出贡献专家”称号,1993年起享受国务院政府津贴。
林沄教授多年来致力于考古学、古文字学、历史学的研究,内容涉及古文字考释、文字学理论、甲骨断代、商周考古和商周史研究、中国北方与东北地区青铜器研究、俄罗斯远东和西伯利亚考古等领域,共出版学术著作3部,发表论文130余篇。所提出的以字体为核心的甲骨断代方法及古汉字早期阶段的一形多读的用字方式就是传统六书说中的“转注”等观点,是古文字研究理论方面的创新性见解。在东北系青铜短剑的发展序列与族属、商文化青铜器与北方地区青铜器的关系、中国早期国家的组织形式与社会结构等方面的研究先后有多篇论文被译成英、日、俄、韩等文字,在国际学术界产生了重要影响。论文曾获国家教委首届人文社会科学优秀科研成果二等奖和第三届中国高校人文社会科学研究优秀成果二等奖。2009年6月被聘任为吉林大学第二批哲学社会科学资深教授。
谈谈汉字历史中的几个问题
王国维讲座是很高级的讲座,我实在不够格。最近我是在研究新疆的青铜器,对在座各位讲不合适。古文字的东西我现在很少有专门的研究,所以想来想去就讲一个文字学的题目。从前海峡两岸要出一套丛书,《汉字沧桑》是初步定的一个书名,我写了个提纲,后来没写。这次我搬家,整理旧的稿子,才想起还有这么一件事。要我来讲,就想就从这里边找两个题目来讲讲吧。这是一个文字学的题目,也不太切合,因为你们主要是研究古文字学和历史学。文字学本来是一门传统的学问,是为读经解经服务的学问。但是由于社会的发展,特别是近代学术的发展,第一件事情,是出土了以甲骨文为始的很多先秦古文字材料,使文字学开辟了一个新的研究领域:汉字最早的时候是怎么产生的、汉字构成的方式、汉字最早的发展规律,就使得传统的文字学有了一种很新的内容。第二件事情,就是以敦煌文书的出土为代表的汉代以后的各种手写本出土,使我们增加了很多对汉字发展的新的知识。要按照裘锡圭先生的说法,我们先要对汉以后的俗文字有研究以后才能对整个汉字的学问有新的前进。第三件事情,是由于近代的汉字改革以及解放以后的文字改革,使得很多人注意汉字历史上怎么发展的,往前再怎么发展,对汉字发展规律的研究也就更加重视。最新的就是现在的信息化,很多东西都收到计算机里去,对汉字的研究又有新的要求。所以现在文字学的内容跟传统的文字学有很大的不同了。我觉得现在研究古文字的人实在不少了,刚改革开放那时没几个人懂古文字,现在懂古文字的人很多。但是研究文字学、汉字学的人现在是太少。像北师大的王宁先生是研究汉字学的,我当然不能算研究汉字学的,总之是这方面的人太少。应该是谁来参加这个研究呢?我想研究古文字的人应该有义不容辞的责任,应该关心整个汉字文字学。所以我觉得今天讲这个问题也不算太出格。
我今天准备讲四个问题:第一个问题就是最早的汉字;第二个问题是我对汉字特点的认识;第三个就是在汉字的发展中我认为比较重要的几个问题;第四个就是我对汉字改革的一点看法。
一
现在讲第一个问题。最早的汉字应该是什么样子呢?我谈一个看法,不一定对。我认为最早的汉字应该也是拿毛笔写的。因为古文字里边“书”字是上面有一支毛笔,如
(颂鼎)、
(
鼎),要更象形一点是这样的
、
(子
簋)。另外还有一个“画”字,“画”字上面也是有一支毛笔作
(五年师
簋)。当然最早的文字很多是从图画形象来的。既然图画是拿毛笔画的,最早的文字应该也是毛笔写的。它的载体是什么呢?应该就是简册,竹简木简然后把它编起来的东西。那么毛笔什么时候有的呢?应该起码新石器时代已经有了。因为新石器时代彩陶的花纹肯定是拿毛笔画的,彩陶上面的记号很多也是毛笔画的。
但是自从甲骨文发现以后,最早研究甲骨文的罗振玉先生有了一种新的看法,就是仓颉造字的时候是看鸟兽的脚印发明的字,所以说字一定是先刻出来又凹下去的。他的书叫《殷虚书契》,“书契”就是说这字是刻出来的。而且在《殷商贞卜文字考》中说:“小而简册,大而钟鼎,莫不皆然。”认为简册上的字起初也是刻的。很有名的学者朱自清先生他是赞成这种说法,可见这是一种相当有代表性的意见。现在《辞海》上也是用这个说法,就是古代文字都是用刀刻的:
书契①指文字。契就是刻,古代文字多用刀刻,故名。《易·系辞下》:“上古结绳而治,后世圣人易之以书契。”一说,书指文字,刻木以纪数、纪事谓之契。唐李鼎祚《周易集解》:“百官以书治职,万民以契明其事。”②指券约等书面凭证。《周礼·大官·小宰》:“六曰听取予以书契。”孙诒让正义:“凡以文书为要约,或书于符券,或载于簿书,并谓之书契。”
唐兰先生《中国文字学》里边也说最早的文字是刻的,拿新石器时代陶器上的刻纹来做例子。持这种看法的人很多,我不知道在座的人是否也还有认为是这样的?实际上,我们现在看见的甲骨文大多是刻的,但是在甲骨上还有很多是拿毛笔写的字。
图中左边是龟甲正面刻的字,右边是龟甲反面毛笔写的字。第一个毛笔写的字我姑且念“画”,就是“画”送来了30件龟甲。当然在殷墟毛笔写的东西不只是写在龟甲上,还有写在陶器上、写在玉器上,还有写在别的东西上。
这一张表就是商代的毛笔字跟商代的甲骨文对照(下表)。商代人写字主要还是毛笔字这种样子,不是甲骨文的样子。现在不少写书法史的人一开始就说最早的书法就是刀刻的,这个我觉得很可笑。一开始书法还是毛笔写的,甲骨文只是一个特例。
大型陶缸上的朱书文字
这就是在郑州小双桥祭祀坑里边的陶缸上面用毛笔写的字(上图),用红色写的字。郑州小双桥大家知道,时代比殷墟要早。殷墟甲骨文上有毛笔字,比殷墟早的小双桥,也就是二里岗文化时期,也已经是用毛笔写字了。这种字跟甲骨文、金文比较,应该是同一个系统的。
新石器时代确实有很多陶文,这些陶器上的符号有的是刻的,有的实际上也是拿毛笔写的。过去有不少文字学家,包括像我的老师于省吾先生,认为这些字就是中国文字的起源,比如于省吾先生就举出半坡文化陶器上的一些符号认为跟甲骨文可以对上。过去不少学者认为文字的发生是符号的积累,符号积累多了自然就形成文字了。就是说有这么多符号了,其中我找出一些跟后代文字相似,那么就是文字起源。好像郭沫若也是这样看的。有的符号很像图形符号,如:
大汶口文化陶尊上的符号
尉迟寺遗址出土大口尊(距今5000~4500年)
有学者认为这就是原始的文字,像唐兰就认为这就是汉字的起源了。但是汪宁生就认为这个不能算文字,这样的符号虽然形象性很强,可能代表一定的概念,跟文字是有区别的。因为文字应该是一个能够按照顺序来记录语言当中的词的符号体系,“体系”就是不仅要有一定数量的符号,还要有一定记录语言的规则。这些符号为什么现在还不能说是文字呢?就是因为在这些陶器上面它只是单独出现,顶多就是两个东西在一起,没法证明它是用来记录完整的语言。如果要说那时候已经有文字,还需要其他条件来证明。但是到了较晚的时候就是距今四千年或四千五百年这样一个范围之内,也就是在新石器时代晚期,确实出现了由多个符号排在一起的现象,这就是比较有名的山东邹平丁公遗址出土的丁公陶文:
有不少古文字学家对这个还做过考释,有的人还能念,有的人说是古代的彝文,整篇能翻译出来。客观的现象就是有很多有点像图形符号的东西排在一起了。这里我再举两个良渚文化陶器上的例子:
江苏吴县澄湖遗址出土黑陶罐(距今5400~4000年)
浙江余杭南湖遗址出土黑陶罐肩上刻符(距今5400~4000年)
良渚文化的年代不是很确定,或说是距今四千年,有的人认为没有这么晚,也可能是距今四千五百年或是更早一点。一件上面是四个符号排在一起,一件上面是八九个符号排在一起,我记得李学勤先生到吉大去还专门讲过其中一个,觉得有可读性。我认为像这种现象其实不一定要逐个符号去读,为什么呢?因为当时真正的文字它不会刻在陶器上,特别是不会像丁公陶文那样刻在一片残陶片上。显然是陶器已经破了以后刻的,这上面刻了好多字有什么意义呢?没有意义。我拿一件在山东莱阳前河前村出的一件形式上是西周的仿铜陶盉来比较一下:
它的脖子上就有一周像文字的东西,但是没法念。其中有的横过来看像一条鱼:
有的是头倒过来的鹿,头上有角:
有的呢,是不知道什么东西:
这边有一个像圆的头,然后有身子,下面有腿,像一个人,但是这个符号也没法念。我们大家都知道,在西周时期铜器上已经有成篇的铭文,为什么在陶器上会有这种现象呢?我认为做这个陶器的人他是仿铜器的,他知道铜器上面是要有铭文的。而这个做陶器的人不认识字,所以他就做出来一些像字不像字的东西放在这里,他认为也是一种装饰。我认为上举新石器时代晚期的陶文,实际上也是这种性质的东西。
我要证明我的观点。曾经让我的孙子给我写几个字看,他那时候是学龄前的,没有学过字,就画出来这么一堆符号:
这些符号你看像字不像字?我们都知道现在汉字是什么样的。但他认为我这个写的就是字,因为他不会写字。
我再举一个例子:
这个是我的一个学生的小孩,也是学龄前的。我说画一本小人书。他知道小人书上面是要有标题的,他也就弄了一个标题。这个字还有点像字似的。小人书封面上还有图,这旁边画的是图。古代人也可以做这样的事。其实他不会写字,但是他看见过字。看见过字呢,他就要进行一些模仿。模仿呢,就出来这种陶文。这种陶文的意义是什么呢?就是反映出现了一些类似于象形的符号,而且它们是排在一起的。这种情况应该说那时候可能已经处在正在创生文字的过程当中,所以我对新石器时代晚期的陶文是这么一个看法。不知道在座的有没有人能同意。实际上,刚才所说殷墟肯定已经有文字了,而且殷墟有墨书的文字。再往前,比如说二里岗文化时期,也有墨书的文字,因为它的写法跟甲骨文一样。我们再往上推,如果推到二里头文化时期。二里头文化大家都知道现在在考古学上很多人认为它是夏代。二里头遗址有一件陶器很多人没有注意,但是李学勤先生是写过文章的。
李学勤先生是把这个符号(上图)跟良渚文化的陶文作比较的。我的看法觉得它实际上跟后来的“目”字有关系。它表现眼睛的方式跟后来台西遗址的陶文、殷墟甲骨文(台西比殷墟还要早些),是一脉相承的。
二里头陶文
殷墟甲骨文
台西陶文
我们假如认为殷墟已经有文字的话,那么夏代的文字也是有了很重要的线索。现在知道陶寺遗址出了一个陶瓶,陶瓶上面有朱书的文字。一个是“文”字,非常清楚,跟甲骨文的“文”字写法是有相近之处的,就是文武的“文”。还有个字有的人说是尧字,有的人说是昜(阳)字,反正也不是很清楚。
山西陶寺遗址出土朱书“文”字扁壶(H3403)及“文”字摹本
陶寺遗址的年代,现在考古学上都认为它可能是比夏代还要早的。有人说是尧舜时代,那时候有墨书,也有跟后代能够联系起来的文字。根据二里头和陶寺遗址的这些发现,所以我们现在可以把汉字出现的年代上推到夏代或是更早一点,并不是完全无稽之谈。这是我要谈的第一个问题。
二
第二个问题,我再谈一谈汉字的特点。汉字的特点现在占主导的意见可以以《辞海》的词条为准:
文字①记录和传达语言的书写符号,扩大语言在时间和空间上的交际功用的文化工具,对人类文明的促进起很大的作用。文字有表形文字、表意文字、表音文字,这三种类型大体上标志着文字发展的三个不同阶段。表音文字最便于人们学习和使用。②文章。唐孙卓《同宋药州太史登滕王阁》诗:“子安文字当时体,纵横万象谁端倪?”
《辞海》认为文字有表形文字、表意文字、表音文字,这三种文字类型大体上标志着文字发展的三个不同阶段。在表意文字的词条里边说通常把古埃及文字、楔形文字以及汉字看作表意文字。
按《辞海》的说法:
表意文字用一定体系的象征性符号表示词或词素的文字,不直接或不单纯表示语音。通常把古埃及文字、楔形文字和汉字看作表意文字。是文字发展中在表形文字和表音文字中间的一个阶段。
那就是说汉字是表意文字。我是不同意这个看法的,而且把这三种文字看作文字发展的三个阶段这个说法也没有根据。说表形文字根本就不通的,因为文字是记录语言的,语言是没有形的,怎么去“表形”呢?你要记录语言的话,语言只有两个东西,就是它用音来表示意。文字客观存在就是一个形,因此文字表达语言的话只有三种方式。第一种就是以形表意,就是用形来表示语言的意义。我要表现“狗”,我就画一条狗,这个是不是就没有音了呢?也有,因为“狗”在具体的语言里边它都有发音的,因此也就具备音了。还有一种就是我想表现一个词,这个词不能用图形来表现它,那我只能找它的音。如果我已经画一条狗表示“狗”的音的话,如果还有一个词发音发成“狗”的,那我就用“狗”来代表它,那就是记音法。第三种就是意音字。意音字就是字形分成两半,一半跟意有联系,一半跟音有联系,我们讲的形声字就是这个意思。其实一共只有这三种办法。那么表意字能不能构成完整记录语言的符号体系呢?这实际上是不可能的。第一,语言当中的词汇数量很多,意义是各异的,你如果对每一个词都用表意法去表现,那么你要造多少个符号才能完成这个体系呢?这是没法限制的,而且非常难办。第二个不可能,就是语言里边,比如拿汉语来说,有实词有虚词,虚词它是表示词跟词之间关系的,它没有固定意义的,那么怎么用表意法来表现呢?我们现在说白勺“的”,白勺“的”是表示什么意义的呢?你说用什么来表示这个意义呢?那就有很多虚词是很难表现的。所以,假如要有一个成熟的记录语言的文字体系,那么它一定要有表音法。也就是说只用表意字不可能按照语言次序无遗漏地书写语言,因而不可能构成成熟的文字体系。这一点我想大家稍微想一想就会同意的。
我这里举一个例子,拿东巴文来说明这个例子。我举这当中的一段。东巴文为什么好呢,就是它不仅完整地保存下来了,而且它的每一个文字应该怎么读,纳西族的巫师他都有念法,可以互相对照。它不是一种死文字,是一种活的文字。
下图中第一行是东巴文《送情死者》的片段,图中第二行就是把上面那些符号做了解释,第三行就是应该怎么念。它就是一格代表一个句子。念法就是从上往下然后再往右边移过来再从上往下,我就不一一念了。比如拿第一句来说,这是画一个人的嘴,出来一个线条,那是表示口发的“啊”的音。它其实是一个声符,是用来记录纳西语的“咱”。下面是一堵围墙,发的音和“咱俩”的“俩”这个音是一样的。向右就是“二”,像汉语一样应该算指事字了。右旁的“个”是一个量词,这个量词画的是一个蒜头,大蒜,它发的音和纳西语的“个”一样。下面是一个人拿管子在吸酒。吸酒这个词的音就和感叹词“哪”是一样的,所以这样一些符号就可以念作“咱们两个哪”。这里面很多就是表音字,其他句子因为时间关系我就不一一说了。它还是没有成熟的文字,因为虽然这句很好,跟语言中每一词完全都对应了,后面各句却有多出来的东西。像这第二句还有点文字画的意思,中央是一个男人,他一只脚画出一个三角形,表示走。这个人脚上有个线条表示戴了脚镣。单单就是一幅图画就可以表示一个男人戴个脚镣在走,但是它又很地道地加上一只脚。记录“脚”这个词,又用一双眼睛记录纳西语的“上”的音。再画一个桶,这个桶是量米的升。这个升字和“镣铐”的音是一样的,那就用来记“镣铐”。“戴上”这个音和他们“狗”的音一样。这里没画一条狗,是借用汉字里面的犬字,是一个纯粹的记音字。那么念起来就是“脚上镣铐戴上”,中央这幅图画所表示的“男的”和“走”都是多出来的成分而不用念了。其实这一句有规定的念法“脚上铁镣戴上”,其中“铁”这个词并没有记录符号,而中央图形整个来说是多出来的,可以不要的,但是又起帮助理解内容的作用。所以这种文字还不成熟,还在文字画向文字过渡的过程当中。它在过渡过程当中已经出现了大量的表音字,才能比较好地记录语言。
咱们两个哪,脚上铁镣上,手上铁铐上,要转回来了
我们汉字也是一样。汉字到甲骨文的时代,有很多是假借字,这个我们稍微学过一点古文字的人都能同意。正因为这样,我们学校已经去世的姚孝遂先生,他就有个意见,在《古文字研究》第四辑上面,说甲骨文当中既然有那么多表音字,甲骨文就是表音文字。因为每个字都有固定读音嘛,所以说汉字是表意文字根本不对。那么甲骨文就已经是表音文字,这样的说法对不对呢?我认为说是表音文字也不对。因为甲骨文当中实际上既有表意字,又有表音字,还有意音字,它是三种字混合都有的。这种三种字共存的制度,埃及文字、楔形文字,还有玛雅文字,实际上都用这些办法。所以周有光先生在《比较文字学初探》里面说,六书有普遍适应性,这句话我认为是很对的。在意音文字体系里面,它这六种方法都要用。当然像转注呢,各人有不同的看法。我的看法是这样的,就像刚才那个东巴文的例子里边,画把斧子,可以不念斧,而念铁。为什么呢?因为斧子是拿铁做的。画一把斧子既可以念铁又可以念斧,这就是转注,这种在埃及文字里面、在楔形文字里面都有,所以它实际上还是一种表意法。
汉字从开始创造一直到后来已经变成隶书以后,它基本上还是用六书的方法造出形来的。随便举一些例子。象形法造的字很少,比如伞字,这个伞字起源很晚,宋代肯定有了,唐代何时出现还没有细查。伞字《说文》里面肯定没有,古文字里我们都没有见过,它画得像一把伞那样。指事呢,像凹跟凸,还有丫,都是后来造的字。凹凸现在看来最早好像是《抱朴子》里边有,再早也没有。会意字呢,比如像闩,门闩的闩,是门里面夹根棍。我就不一一说了。那么形声字、假借啊,后来这个方法是经常用。所以说汉字这个体系它始终是兼用表意法、表音法、意音法在造字。总体来说,汉字不单纯是表音符号,因为大量的同音词靠字形上的区别来指明其词义上的差别。为什么不能说它是表音字?因为它有很多字实际上是同音的。同音它为什么还要造那么多字,是为了区别同音的意义不同的语词。汉字也不单纯是表意符号,因为大量的同义词靠字形上的区别来指明其词音上的差别。而且有大量的汉字是既多音又多义的,只是在它代表特定的意时才和特定的音相联系。也就是在意音一体的情况下,才有确定的指别作用。所以说不论我们把它叫作表意文字或者表音文字,都是不准确的、片面的,应该叫意音文字。
我们对汉字都了解,你想想是不是应该这么来认识。但是如果要说汉字在表音和表意上面,哪一方面更强一点,我的看法是汉字的表意性比表音性还要强。我这里举一个例子。獃,这个字你念它什么?我想在座很多人都是要念dai的。你说dai字为什么要这么造呢?这个dai字其实它是用“皚”做声符的,就是白雪皚皚那个皚。白雪皚皚那个皚就是白字加一个豈字,“皚”省声就把“白”省掉了,剩下这个豈呢读ai的音,就是从犬ai声,所以它的反切是五来切。为什么从犬呢?说像狗小的时候不懂事的样子。所以在《康熙字典》里边这个字还是念ai的音。但是到了后来呢,就不念ai了,就变成念dai了。那么这个字的意义是说这个人痴呆。ai这个音是哪儿的音呢?是南方人的音,在座应该有南方人。但是北方人同样的意思念dai。所以这一个字就有两个读音,南方人就念它是ai,北方人就念它dai,最后在字典里面是念dai成主流了。因为我们现在汉语是以北方话比如说北京话为主体的,又参考东北话的。南方话其实也并不念ai,没有这个注音符号,字典里面没有这个音的,我只好说是念ai了。所以一个字字形是固定的,实际上真正首先考虑的是它的词义。从词义上才派生出词音,南方人就念ai,北方人就念dai。最后北方读音胜利了,于是这个字就变成dai了。变成dai以后它还有别的用处,比如说这个字有死板的意义。可以用会意法造的“呆”字作为异体字,然后又可以用来作“待”。比如说你待在这儿两天吧,或者你待一会儿再来吧。反正这个“呆”有不同的意义,不光是傻子的意思,可以代替这个“待”字。那么在它去代替这个“待”的时候,它的音又起了主要作用,但它开始时能够把这个音转过来的话是义起了主要作用。
这里我再举一些现象。比如这个应该念雪茄(xuejia)吧,雪茄这个译音从哪儿来呢?那肯定是上海地区的,上海地区这两个字念siga。Siga就和英语里面cigar的音是完全对应的。但是这个字要北方人用,xueqie与cigar差太远了,是不是?那怎么办呢?字典里面就注音,茄这个字又念jia,什么时候念jia呢?在“雪茄”这个词的时候念jia。可是,在座的人我想有不少人一定不念xuejia,一定念xueqie。所以你念这个字的时候还是以意义为主的,因为你知道这是茄子的茄,那么我念qie一定是没错的。
再举一个就是“百老汇”,百老汇大家都知道,是讲美国的一个娱乐中心的地方。实际上呢,它是纽约的一条街,就是Broadway,Broadway就是宽街,宽街用上海话说就是bolaowei。Bolaowei就和Broadway很像,但是已经翻译成汉字了。北方人来念呢,就是百老汇。百老汇和Broadway就差很远很远了。但是你为什么不念Broadway呢,那是因为你知道“百”字有个固定的念法,“老头子”的“老”有个固定的念法,“汇”有个固定的念法。字典里面这个百老汇就不是多音字。北方人有点不懂什么叫“瘪三”,上海人呢,也不念biesan,上海人念bisei。bisei它和英语中的begsay那是比较像,就是小叫花子,就是叫花子、难民,是在租界里面出来的一个词。
我小时候印象比较深刻的事,就是一个字念法可以不一样,用南方话念还有白读和文读。口语里念成一个音,文言文里念成一个音。它的基础是什么呢?这个字到底表示什么意义它是肯定的,但是读音是可以不一样的。所以我们念汉字呢,首先考虑是意义上的区别,然后我再找到它这个音来读。因此不同地区不同方言的人,同样的汉字可以念出不同的音来。有的时候这个音还可能差得比较大。所以我认为汉字是意在前面的,音在后面的。但是在同一个方言区当中,还是有区别不同读音的作用。不同字形有区别不同读音的作用,它既是别音的,又是别意的。所以我们不能把汉字看成表意字,也不能看成表音字。我们应该说它是意音文字。不知道大家能不能同意这个意见。
三
现在我再讲第三个问题,就是汉字的发展。汉字的发展可以从很多方面来讲,我今天主要挑其中三件事来讲。
第一件就是简化。大家都知道简化,简化逐步破坏了意音文字的系统性,简化是使用汉字时候的一种趋势。为了方便,就把笔画写得越来越简单,但是越写越简单就把意音文字本来的理据都给破坏了。第一条,它把单个符号本来是怎么表意的变得一点儿看不出来了,越变越看不出来了。而这不是近代才开始的,在甲骨文当中就开始了。甲骨文当中的“易”字
,容易的“易”,如果不知道还有它原始的形状
,你怎么也想不出来它怎么变来的。像甲骨文当中非常常用的那个“以”字
,如果不知道它原先的形状
,那也不知道它怎么来的,就只能说是一种记号。所以基本构字符号变成一种记号,实际上在甲骨文或者更早时代就已经开始了。
现代汉字中,本来很象形的符号,比如鱼、鹿、鸟、马,象形性完全没有了,所以它也都只是一个记号。就是单个符号它本来怎么表意的,道理现在也已经讲不出来了。所以我们现在小学教字,可以拿一些很简单的字,比如说“山”是怎么变来的,“水”是怎么变来的。但是你要去讲“马”字怎么变来就有点麻烦,因为它变得太厉害了。所以现在这种字在现代汉字分析中都不叫象形字了,都叫记号字。既然这些都是记号字,本来所表示的意义从字形上都已经看不出来了,那意音文字这个系统从根本上就改变性质了。
还有就是不同的意符和音符都变成了同一个记号。本来是不同的东西,但是演变过程当中它就演变成一个东西了,这也不是简化字开始的。现在都说简化字不好,汉字的构字道理都给破坏了,其实从汉字隶变的时候很多都已经没法讲道理了。比如说“雷”字下面有个“田”,这个“田”是个轮子,本来有很多个轮子,表示天上有轮子在那滚。“果”字上面的“田”本来是果实。“畜”字下面的“田”本来是笼头,笼头上面有绳子,表示“畜”字。“异”字中的“田”是一个可怕的脸,很吓人的脸。“畀”字是一支箭,“田”是表示箭头上有花纹。“糞”字当中的“田”是个簸箕,也就是个撮子。“巢”字的“田”是鸟巢的下半截。这些字都变成一个田了,它们本来原始的表意性就没有了。汉字现在简化以后呢,像“又”这个符号可以代替很多符号,反正很多符号都变成“又”了,而且有的变成“又”了,有的又不变成“又”,那就是符号的系统性就没了。
再有一个就是简化以后就把文字原来的结构也破坏了。不仅它单个符号看不出来了,它本来是怎么构造的也看不出来了。现在要讲汉字变化厉害,一般都说简化字造成的,实际上简化字也不是很厉害,因为在隶变过程当中早就很厉害了。文字学书里面这个例子是经常举的:
就是春字、奉字、秦字、泰字,顶上都是三横,一个人,这个也不知道叫什么旁,都变成一样了。它本来是完全不同的东西变的,就是说隶变把本来的结构也都破坏了。再举一个隶变当中的情况,就是什么东西都变成大:
奔跑的“奔”是上面一个奔跑的人形变成大;“奈”字本来上面是个木字变成大;“莫”是两个草合在一起变成大;“奂”、“樊”是两只手变成大,手有往里的、有往外的都变成大;“奠”字呢,是下面一个丌字变成大。这些东西都变成一个大,而且把原来结构也破坏了,有的是一对一,有的是两对一。所以我们不要说简化字怎么破坏了造字理据,实际上汉字简化过程当中很久以来就把意音文字的理据破坏了很多。所以研究现代汉字,像苏培成《现代汉字学纲要》,他说我们推测现代汉字的理据度大约在50%上下。有很多字都讲不出任何道理。举个例子,比如,书字的造字原理是什么,讲起来就很麻烦,而且最常用的汉字道理讲不出来。比如汉字当中使用频度最高的那个白勺“的”,白勺“的”你说为什么这么造啊,这个“的”字到底是什么意义就讲不大清楚,为什么一个“白”一个“勺”呢?我是讲不出道理来的。但是这个字肯定大家都要用的。
汉字演变当中还有第二个问题,就是汉字集的字数是不断累增的,这从字典中收字数越来越多就可以大概看出来。当然现在汉字不同字形有多少,有的估计说是八万,有的说可能十万以上。台湾还有一部《中文大字典》,它收的字好像没有《汉语大字典》多。但是《汉语大字典》以后还出了一些字典,有的比《汉语大字典》收的字还要多。当然一个文字体系假如有这么多字那是无法使用的。那么字为什么会越来越多呢?主要有两个方面:第一个方面是根据社会生活的发展要造新的字。这里举几个例子。一个“魔”字,“魔”字现在用得很普遍,大概在唐代字典才收了进去。《一切经音义》里说,可能是南北朝时翻译佛经造出来的字,最早是记音字,就用石磨的“磨”,后来因为它代表破坏、扰乱这种意义,就是不好的意义,所以给它加一个鬼的偏旁,就变成这样一个字。再比如说“椅”字,稍微知道家具史就知道椅子是唐代以后才开始用的,本来我们汉人是席地而坐或者坐在榻上的。这个“椅”字本来是写成人字旁的“倚”,在唐代的碑刻里就已经出现了。到了宋代,就给它专门造了个字,是木字旁的“椅”。但是这种新字跟“魔”又不一样,因为古时候这个字已经有一个“椅”字,意义是一种树,这个字还没有废掉,又造出一个形状相同的新字来。再比如说近代化学元素名称造了很多字,因为化学来了你就得造,就造了很多,有的也是和旧字形状相同的。历史上积累的字,即使是后代根本不用了的废字,但是字典里面总得收啊,你去翻古代的文献还得查啊,所以字就越来越多。
还有一个汉字的主要现象,因为它是意音文字,每个人都可以自己按照会意法、形声法去造字。意符、音符可以换,而且形声字还可以变成会意字,同一个字可以有很多种写法,那样结构性异体可以增加很多。还有一个就是笔画性异体更多,所谓“笔画性”就是写法稍微不一样,这样一来,异体字就很多很多。《汉语大词典》为什么有那么多字,其中有相当大的一部分就是异体字。比如在隶书里边,我们要写“食”字(是单个的食字,不是食字旁,食字旁还要多),不同的写法就有这么多:
“典”字不同写法也有这么多。还有“豊”字,有的人看第一个、第二个可能把它当“豐”字,实际上是“豊”字,头上的写法还和小篆一样。还有“處”字,它可以变成很多不同的写法。我们觉得这个问题是不是很严重呢?
现代汉字的异体字也是很值得注意的,现在台湾和大陆所用的汉字是有大量的不一样的,不仅是简繁体不一样。一共比较了将近五千个字,字形完全相同的有两千个字,只占40%,有大量的字是不一样的。比如一种就是以不同的异体作为正体:
上面这一行是大陆用的,下面这一行是台湾用的。这样的字有195个。有的是相似形体,但细细看还是不一样;有的是笔形不一样;有的是基本的部件不一样;有的是笔画数不一样。都是很小的差别,但是就不一样。
总之就是60%的字是不一样的。当然这里面有些不一定像《汉语大词典》把它作为异体字都收进去,如果把这些细微差别都收进去的话,那汉字的个数还要更多。是不是五万多个、六万多个、八万多个汉字大家都要学会呢?这倒不是。所以现在很重要的一个事情是研究哪些字是常用的。新中国成立以后主要公布过两次,现在社会上通行的是1988年《现代汉语常用字表》。现在经过研究,一级常用字2500个,覆盖率能够达到97.97%。那就是你认识这2500个字就基本上好使了。再加上1000个字,覆盖率可以达到99.48%。反正你认识字越多,覆盖率不增加多少,因为那些字出现得很少。所以倒也不要害怕,说我们要认识五万六万个字怎么能认识,就是你至少要认识2500个字,或者更多一点你认识3000个字,在日常生活中的读写当中应该就够用了。所以汉字现在还可以使用,否则汉字没法使用。
但是还有一个问题,就是汉字在发展当中不断增加多音多义性,如果说只有2500个字我就认识2500个字,应该说也不是非常非常难,特别在小孩的时候学习。但是它难在哪呢?汉字很多字都是多音多义的。跟外文比较,外文每一个词它当然也是多义的,如果你去字典上查,它的意义有很多很多、一长串。但是它每个词念法应该是固定的,没有说我写出一个词来有两种念法。然而汉字就是一个字要有很多音。《镜花缘》里边说,汉字音最多的字是哪个字呢,是伦敦的“敦”,说伦敦的“敦”有15个读音。当然现在《汉语大字典》没有15个音,只写进去10个音,10个音每个音还有不同的意义。当然这个“敦”字并不是很常用的字了。
这里不说多义字了,我们主要讲多音字,多音字必然也是多义的。《新华字典》里边734个多音字,占总字数的10%。《辞海》里边有2641个多音字,占总字数的22%。我们最主要的是说3500个字覆盖率已经到了97.97%,而常用字3500个字当中,有405个是多音多义字,占总字数的11.6%。而且在2500个一级常用字当中,有385个多音多义字,占15.44%。所以你不光要认识2500个字,2500个字当中还有相当多是多音多义的。造成这个的历史原因是什么呢?今天时间关系,不能分析了。多音多义怎么才能解决呢?我们现在识字的人都有经验,就是根据上下文来定它怎么念。但是有的时候你知识不够就不知道念什么。今天我们坐在车上,我爱人谈到“幹细胞”,有不少人知道这个简化字写的“干细胞”该念幹(四声)细胞,但是也有人可能念乾(一声)细胞。到底是念“乾”细胞还是“幹”细胞呢?我表扬我爱人说你是医生,你有医学知识,你念幹(四声)细胞对,你没有念乾(一声)细胞。所以学汉字有很大的难处,一个是写不好写,而且没什么道理;第二个是字非常多;第三个就是一个字还不知道念什么。汉字发展过程当中是有这么些缺点的。所以作为一个用汉字的人,我认为不仅要说我们汉字好,还应该清醒地看到汉字的缺点。
汉字为什么好呢?是因为适用于汉语的特点。汉字为什么没有完全发展成为纯粹的表音字?我们这里搞古文字的人很多,研究古代简牍。古代简牍里边我们看好多字都是表音字,好像不像我刚才讲的以意放在前面。你要是把这些汉字看成是以意为主,你就没法念那个东西。里边它大都不用本义的,好多都是借这个音,然后表示别的东西。但是汉字为什么后来没这么发展下去呢?假如这么发展下去不变成表音文字了吗?它没有变成,为什么呢?因为汉语里面同音词非常多,如果都用音来表示的话,最后就念不懂了。我想战国到汉代的时候那些识字的人,他念的文章很多都是背出来的,就有点像东巴文那个经师念的。他先由师傅教徒弟教出来,这篇文章就应该怎么念,所以他就光记音也没关系。但是那样是越整越乱,不好念了。秦始皇统一全国文字,用一种比较早的古代的文字,没用记音性那么强的文字来统一全体文字,用很多意音字来区分同音字。所以后来汉字是以形声字为主,要把同音字区别开来,这是它主要的任务。以至于到现在我们起码要用3000个字吧,或者2500个字,才能把文章记清楚。
四
第四个问题我非常简单地讲一讲我对汉字改革的看法。汉字改革我就少讲一点。汉字改革最激进的意见就是说汉字不好,汉语也不好,都不要。吴稚晖在20世纪初提出来说中国应该用世界语,可能在座的同学有的不知道世界语。我在小时候,家里岁数比较大的人要学世界语,所以就有那些课本啊什么的。但是那时候章太炎就说汉字汉语是不能废的,意见很对。他说要把中华民族的传统文化继承下来,语言都不要了怎么能行,所以他是主张要有拼音工具。后来在汉字改革当中,一条线就是搞表音,表音中常用的一个是拼音,也有是用不拼音的办法。不拼音的办法以赵元任为代表。赵元任有一本书,叫《通字方案》,不知道在座的同学看过没有。他是选出来两千多个汉字,就是想用这两千多个汉字来记录全部汉语。他就不是拼音,他就是要把汉字变成纯表音字。但是赵元任应该是对中国语言文字有比较充分研究的人,中国汉语当中不同音节只要用一千二百零三个,就可以把不同音节都记录下来。那他为什么说还得两千多个字呢?就是他认为纯记音是不行的,还是要有一些能区别词义的字,才能够用。他这个《通字方案》也曾经给周总理看过,但是中国到底没用这个办法。什么道理呢?就是因为汉语发展到现代,同音的字和词还是非常多,同音的多音词还是非常多。比如说我现在说一个“shìlì”,你会想到什么词呢?好像不止一个,对吧。单单就是说语言上这些问题呢,还不足以证明这个。现在就是有很多汉字当中需要区别的东西,如果要是纯表音纯拼音的话,就非常困难。第一个大事就是姓名。姓名如果是纯粹表音的话,不但很多人重名了,而且很多人重姓了,是吧。还有比如地名,再比如说中国很常用的商品品牌。这些专有名词的区别性如果你要用拼音的话都是很难保证的。所以就是在可预见的将来,汉字拼音或者汉字音化现在看起来好像是不现实的。
那现在在汉字改革方面应该做什么?根据信息化的要求,汉字规范化是一定要继续坚持下去的。另外还有一件事,我认为不应该继续搞简化字。而应该做两件事:第一件事是减少汉字通用字数。简化字为什么不好呢?你要造出一个新的简化字,那就是过去没有的字,字就又多一个。现在字库里面你要加一个字那是很麻烦的,整个的成本就可能很大。所以我觉得应该减少通用字数,就是逐渐把一些字代替掉,就不要了。就是说,这些字我现在不用了。我字库里这个字不用了,如此而已。我举一个例子,比如这个覆盖的“覆”,上面一定有个西字头的,然后还有双立人,那假如不用西字头和双立人,就用简化的“复”行不行呢?是不是就把这个区别性弄得太少了呢?那个“覆”挺难写的,假如不用那个“覆”,只用“复”,我觉得这是可以的。再比如说跳舞的“舞”,也是现在很难写的字,如果我拿中午的“午”字来代替它,是不是一定会引起很大的混淆呢?我认为恐怕也不一定。所以我认为可以逐步地不新造简化字,但是可以把代替的字的使用范围扩大,这样就可以减少一定的字数。
第二件事,我认为多音字也应该尽量想办法减少。过去只是在笔画上要把字写起来方便一些,实际上在多音字上也应该让学汉字容易一些。其实有些字读音慢慢就废除了,例如“说服”,我们就念shuofu了,台湾还念shuifu。“说”就有两个音,我们假如把shuifu这个音就不要了,字典里面就没了,那么它就少了一个读音了。我认为这种也是使多音字减少的办法。这是今音和古音。再比如说就像刚才讲的那个“獃”字。假如只用上面口下面木这个“呆”字,那个“獃”字我就不要了,当然字也就少了一个。而这个念ai那个音呢,就废除不要了,那它这个字就变成单音字了。还有呢,有时候多音字可以分化它的使用范围,比如说“待”一会儿,我就用上面口字下面木字这个“呆”字,不用那个双立人的“待”字。因为什么呢?因为双立人的“待”字有两种念法,一种是等待的待(四声),一种是待一会儿的待(一声),那它就有两个音,我如果说“呆”一会儿,完全用口和木这个“呆”,那么双立人这个“待”字就可以省简为单音字。这样的话就可以使多音字减少,我只是略举几例。
当然还有一个意见可能说了有点荒谬,不知道大家同意不同意,有些读音还可以根据口语当中的变化要适应于实际的读音。比如我和我爱人常常要吵嘴,她是医生,她说上臂的骨头是肱骨(honggu),我说不对,字典上这个应该念gonggu。她说我在医学院念书的时候老师也念honggu啊。她说不信你去医院里问,看哪一位大夫把这个念成gonggu。假如真的是那样,所有的大夫都念honggu了,那你还要念gonggu,那大夫不就听不懂了吗?连接触这个的人都不懂了就不好了,是不是啊?这里就涉及口头音和过去记录的书面音。它既然会有变化,就要承认现实。所以我认为汉字要改革呢,不是要再多加简化字,而应该是想办法减少用字数,减少字的标准读音,这样在文字改革上面可以用比较小的成本取得比较新的成绩。当然有的同学会这么想,你费这个事儿干什么,这事有可能吗?我认为从汉字发展的历史看起来,汉字是不可能不变的。它在很长的历史过程当中,是必然要发生变化的。你说现在就是要保持五十年汉字不动,就是要搞规范化,这完全可能,但是你不能保证五十年以后汉字完全不变。就是要变的话我们应该引导哪种趋势呢?我认为应该引导字数减少、读音减少的这么一条道路。而如果要把这个汉字问题认为是比较重要的事情,我认为不仅要有国家语言文字工作委员会,还需要一定的制度和一定的队伍、一定的组织,定期地对汉字和汉语的实际发展情况进行全面的普查,然后决定我们需要在哪方面能够采取措施。现在我觉得这个事情还是比较缺少的,应该防患于未然吧。我就说完了。
封面来源:山东大学博物馆官网
文字整理:邱培强、刘一娇
校对:张可新
排版:刘一娇
审核:李春桃、李玥凝