曾经不止一次吵过这个话题:汉语究竟是不是落后于英语。但是很多人都没有讲到点子上。我就用点通讯和数据存储上的概念来聊聊为什么汉语是世界上最先进的语言——没有之一。
这世界上,仍然在广泛使用的表意文字,恐怕就只有中文了。而表音文字大行其道。有的人认为这意味着表音文字是更先进的文字,所以表音文字战胜了表意文字。事实上几十年前的前辈们很多都是这么看的。他们曾经提出汉字拼音化的方案,准备把汉语也变成一种表音文字。
事实上,单从两者的发展历史,是得不到这个结论的。
文字,从一开始就是记录信息用的。原生文明,无论中国、古埃及、古印度还是两河流域,甚至是玛雅,其文字都是象形文字。换句话说,一开始都是表意的。当文字发展到一定程度的时候,原有的字符无法满足表达的需要,就会衍生出新的文字。这些新的文字往往由表音的部分和表意的部分合并而成。无论是早期汉字还是古埃及的圣书体都有这样一个特点。这是文字扩展的必然过程。但表意文字仍然是表意文字。从某种意义上来说,原生文明的语言都是基于表意文字的。
而次生文明则基本都是表音语言。比如希腊、比如日本。有人推测,这是因为次生文明需要从原生文明中学习很多的东西,包括大量的词汇。运用这些词汇最简单的方法就是直接用原生文明的发音来指代。而次生文明因为严重依赖于原生文明的词语发音,自己语言里那种发音恐怕是表不出来什么意思的。所以最终不得不使用一套表音文字体系来使得自己原有语言与从原生文明进口的大量词汇兼容。这种被迫囫囵吞枣的做法,我们可以看到也是今天表音文字的本能行为。比如日文“计算机”就是Computer的音译。
那么为什么这世界上的表意文字这么少呢?很显然,这世界上的原生文明本来就那么几个,而次生文明却要多几个数量级。历史大潮中三十年河东三十年河西,原生文明也有可能被次生文明所征服。在征服之后,语言也就有可能会逐渐消亡了。如果我们回头去看看,消亡了的表音文字比表意文字可是要多得多。
所以,表音文字广泛使用,这并不说明表音文字就优秀。只能说这世界上的原生文明实在太少。
如果要正儿八经讨论一种语言的优劣,就必须从两个角度来讨论,第一是语音,第二是文字。
之所以要先讲语音,是因为所有的语言都是从口语发展出来的,书面的文字,实际上是语言的一个记录工具,而口语的核心就是语音。
语言水平高低的评判准则
口语,放在今天来分析,实际上是一种通讯协议。就是说,语言实际上是把人的思想通过发音器官变成一串频率不同、波形不同的声波,然后有另一个个体的听觉器官和相关的脑部组织重新转变回思想。通讯协议,就是一个规则,一个规定了应该如何把思想/信息转变为易于传输的信号的规则。计算机上,通讯协议基本上有这么两个评判标准:传输效率和抗噪能力。所谓传输效率,是说,在单位时间里,按照该通讯协议能够传输多少信息。所谓抗噪能力,是说这种通讯方式能够在多大的噪音下仍然保证绝大多数信息正确传输。
传输效率又有两个方面,一个是编码效率,一个是传输速度。编码效率是说,这个通讯协议能够把一个信息用多短的一串信号来表达。传输速度是说一段信号,能够以多快的速度传输。
评价一种语言的口语是否先进,就要分析上面这几个问题。
传输的绝对优势:声调
首先从编码效率上,我们可以说汉语就是世界上编码效率最高的语言,没有之一。汉语发音有三大要素:声母、韵母、声调。一般的语言只有两个要素:声母的韵母。从编码上说,汉语发音的表意能力就比一般语言高出一个维度。高出一个维度的价值就在于,使用单个音节,汉语能够表达的不同信息的种类,最高可以达到一般外语的4倍。为什么外国人学汉语学得这么辛苦,而中国人学英语则没有那么辛苦,就是中国人是已经学会了高级的,现在再去学低级的,而外国人是相反。在学习汉语中,外国人最吃力的问题之一就是声调,因为这是要在他们习惯的表意能力上提升一个维度。
由于有了声调这个优势,理论上汉语的传输效率最高就可以达到一般外语的4倍。一般外语,虽然已经开始有意识地使用声调,但是效率非常低,往往一个句子中最多只用一个到两个音调表达诸如疑问、强调等作用。这还只是处于声调应用的初级阶段。远远无法与汉语相比,汉语在几乎每个发音上都应用了声调。
但是有人说,古汉语声调更多啊,至少有9个声调,难道汉语越发展越回去了么?这当然是错误的。汉语是一直向前发展的。那么,问题出在哪里呢?问题就在于,声调并不是越多越好(我们也要在下面讲到,发音种类也并不是越多越好)。声调的种类,取绝于人类发音器官的发音能力。有一些声调,比如吸气音,虽然也是在声调的维度上添砖加瓦,但是发音速度比我们今天的4个声调就低了很多,换句话说就是,与其用吸气音来表意,不如直接用两三个其他声调的音来表意。所以被淘汰了。还有一些声调由于与其它声调区分度不够大,就逐渐合并了。今天我们在一些地方方言里,仍然能听到一些特别的声调。但是这些声调往往要么要求特别的器官运动,要么要求有轻音支持。它们都在逐渐消亡。
信息论角度上的绝对优势
汉语在传输效率方面带来的优势,在文化中就进一步带来了更大的优势。
从信息论角度来考虑,编码是很有学问的。举个例子。我们知道计算机传输信息,实际上传输的都是0和1。那么,如果我们传输的各种信息出现的频率不一样高怎么办?答案是,出现越频繁的,编码越短。这样就能提高总体效率。
比方说,我们只有四种信息要传递。按一般的想法,自然是把这四种信息分别用00、01、10、11来表示。每个信息都需要用两位二进制数来表示,也就是说传播100条信息需要发送200个二进制数。但是如果其中有一种信息出现的概率是91%,而另外三种分别是3%。那么就可以使用另一种编码方式:1,01,001,000。平均下来这种传播方式传播100条信息需要发送91+2*3+3*3+3*3=115个二进制数。显然比前面那种效率要高。
因此,你会发现各个语言中越常用的词,一般就越短。英语里,我、你、他、她、我们,都是单音节词。
但是,单音节终归是有限的。绝大多数意思还是要用双音节或更多来表示。这时候汉语的优势就显示出来了。由于汉语所能承载的单音节词比其他语言多几倍,所以在构成多音节词的时候就可以很奢侈地使用逻辑结构。这种逻辑结构,使得中文的联系性、逻辑性要优于一般语言。而与语音脱离的文字体系,则进一步支撑了这种结构,方便了记忆。
很多其他语言,由于缺少单音节词,所以一般常用词只能使用双音节词。而要形成逻辑结构就必须大规模使用四音节词。这是非常低效的。为了避免这种低效,很多常用的词就只能抛弃逻辑结构,用毫无关系的双音节或三音节词表示。
比如我们可以很轻松地说“公鸡”、“母鸡”、“小鸡”、“鸡蛋”。而英语里就成了“Cock”、 “Hen”、 “Chick”、 “Egg”。类似的发音长度,中文能负担起逻辑结构,而英文就负担不起来。
所以说,类似长度的词,中文一般都要比英文的逻辑要更清晰。这不简简单单是是效率的问题,而更是人民接受信息能力的问题。组词方式越短、越有逻辑性,学习就越简单。整个社会效率就越高。学习、记忆什么叫Laser,远不如“激光”那么简单。
我们来举一个非常简单的例子。普通中国人的初等数学能力往往超过欧美。这并不简简单单是教育的问题。更关键地,这是中文对数字命名结果。
中文由于汉语在单音节词上无可匹敌优势,可以极度奢侈地给予每一个数字一个单音节发音。没有音调的语言,是不可能做到这一点的,因为还有其他更常见的东西需要占用宝贵的单音节词的资源。
人对数字的短期记忆,实际上是对数字发音的记忆。研究表明中国人一次能够记住的数字长度要高于英语母语国家。而在计算中,你需要短期记忆很多数字,这一点就天然地给予了中国人绝对优势。
更进一步,中国的数字都是单音节,因此可以采用绝对逻辑的方式构建整个数字表。九十六,就是九个十加一个六。英语是“九十”(与九和十都不同的特殊词)加一个六。法语是四个二十加十六。汉语种最简洁而最富逻辑的结构,在世界各种主要语言中是独一无二的。九九乘法口诀表,就是构建在这个基础上的。其他国家的儿童如果想背下来这张表,可以说比中国儿童难了几倍。语言上具备了这种优势,中国人的初等数学怎么能不好?就初等数学上的优势,乘以初等数学在整个社会中的价值,这就是中国的根本竞争优势之一。
当然,这里还是要提一下,在比较长的单词上表音文字当然也是有逻辑结构的,这是语言发展的必然结果。比如说英文nephritis,就来源于希腊语中一个读音类似的词,而希腊语中的那个词则来源于希腊语Nefros和itis,也就是“肾”和“炎”。不过很抱歉的是,由于表音能力差,这些很常见的意思必须要用这么多音节来表达。这就远不如中文简简单单的“肾炎”了。
此外还需要提到,由于汉语具有远超其他语言的庞大单音节词库,因此在对特定名词进行缩写的时候,就更具有无可比拟的优势。表音语言在对名词缩写时,一般只能取首字母,这非常容易引起歧义。而中文可以直接取整个名词中比较具有代表意义的字,可以极大地消除歧义。比如美国人说“国安局”就是“NSA”,中文三个音节,英文四个音节,结果中文比英文清晰得多。
最强抗噪能力:完全抛弃轻音
从发音种类上说,汉语的发音种类是比较多的。如果你注意日语的话,日语里面就没有r这个声母,发音种类就比汉语少。但是日语从汉语学到了一个巨大的优势,那就是基本抛弃轻音。
刚才我说到汉语发音种类比较多,可能有人就开始皱眉头了。因为如果不考虑声调,英语里独立发音的种类其实比汉语里还多。因为英语声母可以单独成音。而汉语里是没有的。
事实上,古汉语中轻音也是极度常见的。但是为什么我们都抛弃了呢?因为一个简单的原因:抗噪能力差。一个轻音,距离稍微远一点,或者噪音稍微大一点,就听不见了。而一个辅音和一个元音组成的音节,则由于元音的存在而有较强的信号强度,更容易正确传输。
有一个搞笑论调是这么说的,"我们的普通话叫“mandarin”,什么意思啊?满大人,满族人清朝入关之后,说不出我们的口语,他就把很多调去掉了,把入声去掉了,说的发音越来越简单了。然后逼着全国人都这么说。所以我们现在的口语比粤语要简单得多。"
这是一个非常愚昧的论调。首先,Mandarin这个英语单词来自于葡萄牙语mandarim,葡萄牙语这个词又来源于马来语mntri,马来语这个词来源于梵语mantrin,而梵语这个词的意思是官员。换句话说,mandarin的愿意是“官话”。而且Mandarin这个词能查找到的最早的记录出现于1589年。大家可以查查那时候“满大人”在哪里呢。
很多人以为粤语是正宗的汉语发音。这话对,也不对。粤语具备一些中古汉语的发音特征。但是也正是因为如此,它才落后于北方官话。有人认为北方官话的形成,是因为蛮族入侵“污染”了汉语。这个说法同样,对,也不对。北方官话之所以在中古汉语的基础上进一步的发展,就是因为战争与征服,北方汉民与语言不通的外族加深的了交流,多种族的融合,教育,最终抛弃了难发或者影响发音效率的音调。所以,你不能说一种方言既古老又高级。这两个是矛盾的。
我们举一个例子。白菜,这个发音在北方官话里是Bai2 Cai4,在粤语里是Baak6 Coi3。你注意到粤语“白”这个发音里有一个k的轻尾音。这个音在北方官话里彻底抛弃了。轻尾音抗噪能力不佳,它的很容易被噪音盖过,发清楚这个音需要花费额外的时间,而汉语的冗余度造成一个轻尾音发不准也不会影响整个意义的表达。所以大家可以注意到,随着广东地区对外交流的日益增加,年轻的粤语使用者往往采用“懒音”,也就是说,在日常会话中大量抛弃轻尾音。更进一步,菜这个音,粤语里实际上要发两个音,一个是co一个是i。所以coi这个发音,注定没有北方官话的cai效率高。所以,觉得粤语是更正宗的中古汉语,这没错,但要是觉得粤语更先进,那就大错特错了。同样一个来源的几个语音体系,使用的越广泛、交流的越多,其发展就越快。这是必然的道理。
现代汉语普通话,发音一个萝卜一个坑,一个辅音配一个元音(当然也有少量单独元音),发音强度大,效率高。这就是现代汉语的优点之一。
提高传输速度:懒化
那么再比较一下英语和汉语。从口语角度讲,汉语的核心优势在于语调。英语中一个发音,大致有三个要素:声母、韵母、长度。英语中的语调,是用整个词的调子或者整个句子的调子来表达单个言外之意,所以仅仅对口语起支撑作用。现今英语的发展潮流中,长度的要素逐渐消亡。长度要素,是通过发音的长短来改变发音的含义,理论上说长度的变化只能在一个基本单位音长和两个单位音长之间变化,长于两个单位音长,就失掉了经济性,从效率上讲,不如直接用两个音替代。事实上,英语中,长度变化,只有两种:短音和长音。而长音本身,从发音效率上讲是低效的。因此随着英语的广泛散布,长短音的差距越来越小。甚至很多英语母语国家的人讲英语都不管长短音的差异。比方说,sheep的那个i:的音已经见不到人专门拖长了,美国人发这个音基本都是短音i(有的人为了与ship区别,把那个sh发的有点像汉语拼音里的x)。再比如美国人日常对话里说I don't know的时候,Don't的那个t的发音常常是省略的。
此外,英语中包含有一些发音效率很低的音,比如th清音(就是three的th)。有一次在收音机里听见广告提到了一个电话号码,这个号码是833-3333。大家可以试一下严格按照th清音的时候,这个电话号码读出来有多费劲(Eight Three Three, Thirty Three Thirty Three)。th这个音我一般都发成s的音,几乎没有产生过误解。还有,比如L这个字母,理论上发音的时候舌尖要顶住上腭,实际上没发现有几个美国人是这么发音的。整个英语发音规则,随着广泛的传播,而迅速的“懒化”。换句话说就是发音规则向快速、高效发音方向发展。但是英语在发音上仍然是落后的。
我们反过来看汉语。汉语经历了长期、大范围的传播。因此发音普遍比较简单。目前汉语里与标准发音规则不同的“懒化”是比较罕见的。但是依然存在。举个简单的例子。“谁”这个音,按照汉语标准发音规则,应发为“shui”,而实际上,大多数人发的音是“shei”。为什么呢?很多人可能都没有意识到,但是我一讲立刻就能明白:“shui”这个音要求嘴唇作大范围的运动,而“shei”这个音则不需要。这个区别的核心在于ui和粤语中的oi一样,都是两个不同的元音结合在一起,需要用两个唇舌动作来发,而ei实际上是一个特殊的元音,而不是两个元音(当然,你也可以把它发成两个元音的结合,只不过一般说话没人愿意那么费劲)。所以在大量的使用中,“shui”就逐渐懒化成为了“shei”。
总的来说,汉语所有的发音,通常都能可以以极快的速度发出,绝不会有诸如小舌音那种效率极低的东西存在。所以汉语的传输速度也是首屈一指的。
侧面的证明:唇舌运动
那么我们最后回过头来看,汉语由于抛弃了轻音而具备了较高的抗噪能力,并抛弃了大量不容易发的音。因此与其他语言相比,汉语具有极高的先进性。那么有人问,这些都是空的,有没有直观的东西能证明汉语的优越呢?
有的。出了国,尤其是到了欧美的人,就会发现一个问题。那就是中国人说英语,相比于当地人来说,总有点含混不清。外语老师总是要求中国人说英语的时候嘴巴要张大,舌头要有力,甚至要求用说话时咬住一根铅笔的方式来训练。这是为什么呢?因为中国人已经习惯了唇舌微微运动的发音过程。汉语的高抗噪能力,使得发音不必费力,唇舌运动幅度比英语之类明显小。很多要求唇舌大幅度运动的音节构成(诸如前面说的英文33),都已经在汉语里看不到了。
所以,从一个通讯协议的角度看,汉语的语音显然对诸多其他语言更先进。传输效率高、抗噪能力强。
作者:冷酷的哲学
都说汉字是象形文字,你百度下象形文字看看,汉字除了少数最基本的几个字有象形的痕迹,其它绝大多数跟象形也就是图画,没啥关系。再看看纳西族或者世界其它民族传承至今的象形文字,就知道“此象形”非“彼象形”。关于汉字起源,我们一看见的就是非常成熟的文字,比如甲骨文、金文,考古发掘根本找不到汉字演化的痕迹。汉字更可能一开始就是作为一个成熟的文字体系,传承给我们的,就像日本的汉字、大韩国的汉字。天涯看见过一篇文章,现在找不到了,有朋友知道再给我说下。他画了些八卦图,就完全解释了几乎所有汉字偏旁的起源和意义。
汉字包含的信息量非常大,是非常适合阅读和电脑操作的文字体系,相对应的,其它拼音文字体系是比较适合口头交流的文字体系。我们读一本英汉对照的书就可以发现,英文一页的内容汉字大概只有1/3页。读汉字可以一目十行,读小说这类信息量不是很大的文字,经过简单锻炼完全可以一页一页的读,大概内容差不多都在脑子里了。没听说拼音文字可以做到这一点。
汉字还有没有其它神秘力量,比如竟然可以“测字”,这些我不太了解不敢瞎说。