2018-04-24摘自“龍的天空”(http://www.lkong.net/thread-715623-1-1.html)
發(fā)表于 2013-2-16 14:49?|本文最后由 冷酷的哲學(xué) 于 2013-09-14 15:23 編輯
首先要承認標題只是個噱頭葫隙,語言學(xué)一般認為語言沒有先進落后之分栽烂。大家都有自己的看法,見仁見智吧恋脚。但是總看到有人在爭論到底漢語是先進還是落后腺办。雖然我不是專業(yè)人士,但是就用點通訊和存儲上的概念來聊聊為什么漢語是一種非常先進的語言糟描。需要注意的是怀喉,雖然以下的論證都是基于實際的實驗數(shù)據(jù),但是計算都很粗糙船响,而且實驗的規(guī)模都不大躬拢。換句話說就是,雖然在這里漢語占優(yōu)见间,但是換一批實驗參與者估灿,可能就倒過來了。現(xiàn)在實在沒有什么特別全面的測試缤剧。所以下面的數(shù)字大家看看就行馅袁,不必太過認真。世界主要語言的效率其實都已經(jīng)達到當前人腦的一個瓶頸了荒辕,總體看差異不大汗销。我的目的也主要是打擊一下逆向民族主義者。
一抵窒、語言水平高低的評判準則
口語弛针,放在今天來分析,實際上是一種通訊協(xié)議李皇。就是說削茁,語言實際上是把人的思想通過發(fā)音器官變成一串頻率不同、波形不同的聲波掉房,然后有另一個個體的聽覺器官和相關(guān)的腦部組織重新轉(zhuǎn)變回思想茧跋。通訊協(xié)議,就是一個規(guī)則卓囚,一個規(guī)定了應(yīng)該如何把思想/信息轉(zhuǎn)變?yōu)橐子趥鬏數(shù)男盘柕囊?guī)則瘾杭。計算機上,通訊協(xié)議基本上有這么兩個評判標準:傳輸效率和抗噪能力哪亿。所謂傳輸效率粥烁,是說贤笆,在單位時間里,按照該通訊協(xié)議能夠傳輸多少信息讨阻。所謂抗噪能力芥永,是說這種通訊方式能夠在多大的噪音下仍然保證絕大多數(shù)信息正確傳輸。
傳輸效率又有兩個方面钝吮,一個是編碼效率埋涧,一個是傳輸速度。編碼效率是說搀绣,這個通訊協(xié)議能夠把一個信息用多短的一串信號來表達。傳輸速度是說一段信號戳气,能夠以多快的速度傳輸链患。
評價一種語言的口語是否先進,就要分析上面這幾個問題瓶您。
文字麻捻,則是一種數(shù)據(jù)存儲方式。存儲格式的要求與通訊協(xié)議不同呀袱。存儲格式要求存空間小贸毕、讀寫速度快。相比于讀取速度夜赵,書寫速度是次要的明棍。這是因為平均下來一次書寫對應(yīng)很多次閱讀,而人在閱讀文字上花的時間一般遠遠大于書寫寇僧。尤其是現(xiàn)代社會摊腋,手寫越來越少,計算機輸入嘁傀、打印兴蒸、印刷都大大加快了記錄文字的速度。而閱讀速度卻沒有多少提升细办。因此在現(xiàn)代社會橙凳,閱讀速度就在定義文字水平上占據(jù)了更重要的地位。
需要注意的是笑撞,下面的討論中“音節(jié)”均采用西方語言學(xué)定義岛啸。粗略地講就是一組連續(xù)元音與其前后的輔音共同構(gòu)成一個音節(jié)。比如To茴肥、Bliss值戳、Strength是單音節(jié),漢語Ba炉爆、Chuang也是單音節(jié)堕虹。雖然單音節(jié)詞的發(fā)音長度并不完全相同卧晓,但至少是可比的。
二赴捞、語言的分類
這個世界上的語言大致分為兩種逼裆,一種叫做分析語(或稱孤立語),一種叫做綜合語(其下又劃分為黏著語赦政、屈折語等子類型)胜宇。簡單地說,綜合語可以通過改變詞的形態(tài)來表達不同的意思恢着。而分析語則單純通過詞與詞之間的關(guān)系來表達不同的意思桐愉。
我們舉個簡單的例子:
中文(分析語):我昨天告訴他了。
英文(綜合語):I told him yesterday.
英文你首先可以看到told和him兩個變形掰派。其中把tell變成told表示過去發(fā)生的動作从诲,把he變成him表示客體。而中文用昨天來直接指明時間靡羡,如果不指明時間則需要用“已經(jīng)”系洛、“過”之類來表示過去,而并不改變詞的形態(tài)略步。中文還通過各自的位置來體現(xiàn)誰是主體誰是客體描扯。
實際上,英語已經(jīng)是綜合語中非常接近分析語的了趟薄。比方說英語的未來時態(tài)用的詞形和一般時態(tài)沒有區(qū)別绽诚。而很多其他語言中不同的時態(tài)都是用不同的詞形來表達的。再比方說英文對于各個詞的位置有明確的規(guī)定杭煎。而很多其他綜合語憔购,諸如拉丁語中,詞的位置可以不固定岔帽。換句話說就是可以說出這樣的句子:Him yesterday told I玫鸟。然后通過詞形里的主格詞形和賓格詞形來判斷究竟是誰告訴了誰。
這是非常糟糕的犀勒,因為在讀取的時候屎飘,總是有先后的差別。我們希望的讀取順序是:先讀取我們的大腦需要先處理的部分贾费。分析語天然就有這種優(yōu)勢钦购。很多綜合語在逐步的發(fā)展中也確立了類似的規(guī)則,比如拉丁語的后裔之一——法語褂萧。
上古古漢語也曾是一種綜合語押桃。但是由于漢字的限制,古漢語的詞形變化僅存在于口頭中导犹。比方說文言文中的使動用法唱凯,如“文王以百里之壤而臣諸侯”中的臣(使臣服)羡忘,在上古時期,是需要在漢字發(fā)音前加“s-”音來標識的磕昼。這就是一個典型的綜合語的詞形變化卷雕。
有人認為現(xiàn)在的漢語仍然帶有一定的綜合語色彩,他們認為加入諸如“了”票从、“的”這種助詞實際上就是詞的變形漫雕。這種看法就只能見仁見智了。
從整體發(fā)展趨勢來看峰鄙,世界各地的口語都是從綜合語向分析語發(fā)展浸间。雖然不能說分析語就一定優(yōu)于綜合語。但是這個趨勢說明分析語的某種特性符合歷史的發(fā)展吟榴。這個優(yōu)勢就是數(shù)據(jù)的壓縮魁蒜。
三、數(shù)據(jù)壓縮:分析語的高超之處
當年計算機發(fā)展到了新的時代煤墙,人們開始研究如何在計算機上存儲視頻文件梅惯。一開始的方案極其簡單宪拥,就是把一幀一幀圖像全部都存儲下來仿野。但是這無疑是低效的。因為這里面的冗余信息太多她君。舉個簡單的例子脚作。一個夜晚的場景,畫面上很多地方都是黑的缔刹。何必把每一個點的色彩反復(fù)記錄呢球涛?所以接下來的一個思路就是,不再存儲每一幀圖像的完整信息校镐,而存儲下一幀圖像與上一幀圖像之間的差異之處亿扁。兩幅圖像中顏色一樣的部分全部跳過。
分析語恰恰就具有這樣的效果鸟廓。舉個簡單的例子从祝。一個人在用漢語談?wù)撟蛱彀l(fā)生的事情時,只需要一開始提及“下面這些事情都發(fā)生在昨天”引谜,后面就再也不必提及時態(tài)了牍陌。而英文,則需要反復(fù)使用時態(tài)來表明這事情發(fā)生在過去员咽。在交流時你需要時刻考慮時間毒涧、主格/賓格、數(shù)量贝室、主動/被動契讲。這對交流是有影響的仿吞。當然熟練使用這種語言之后會大大降低考慮這些的時間,但是即便熟練的綜合語使用者還是會在這方面犯錯怀泊。在上下文的幫助下茫藏,這些變化都可以省掉。時間變形霹琼,可以依靠在第一句中加入時間狀語完成描述务傲,其后描述相同時間段的句子就再也不用考慮描述時間了。這就是分析語的數(shù)據(jù)壓縮能力枣申。
當然售葡,這并不是說分析語就一定優(yōu)于綜合語。在缺乏上下文的情況下忠藤,一句綜合語可以用比較簡單的形式傳遞比較多的信息挟伙。但是隨著人類社會交流量的上升,一次交流的上下文就變得豐富起來模孩,很多在單詞尖阔、單句的條件下很有效率的信息交流方式,也就顯得越來越冗余了榨咐。因此世界上的各個主要語言紛紛向分析語靠攏介却。
另外,有的人認為分析語劣于綜合語块茁,他們是這樣說的“綜合語只用幾個字母組成一個詞綴就能表示一個特定含義齿坷,而漢語做不到”。這就是沒有看到数焊,在當今世界上的實際交流中永淌,上下文總是很豐富。這種變形的方式在單句下很有價值佩耳,但在實際交流中就沒有什么意義了遂蛀。
關(guān)于各個語言的表意效率,也就是信息密度干厚,2011年法國里昂大學(xué)做了一個實驗李滴。http://www.time.com/time/health/article/0,8599,2091477,00.html(http://ohll.ish-lyon.cnrs.fr/ful ... o_2011_Language.pdf)
這個實驗里,研究者找了59位不同語言使用者萍诱,其中包括英語悬嗓、法語、德語裕坊、日語包竹、漢語、意大利語和西班牙語。為他們提供了20段文字周瞎,這些文字都翻譯成各自的語言苗缩。然后請這些人分別用正常語速朗讀。研究者全程錄音声诸。
然后研究者計算所有音節(jié)數(shù)量酱讶,計算朗讀中表現(xiàn)的義項(表意的基本單位)的數(shù)量,然后得出結(jié)論彼乌。當然泻肯,這個實驗并不能完全準確地表現(xiàn)各個語言的差異,但是還是可以用來定性的慰照。
其中灶挟,漢語信息密度為0.94,位居第一毒租。英語信息密度為0.91稚铣,位居第二。另外值得注意的是墅垮,距離分析語更遠的法語(0.74)惕医、德語(0.79)、意大利語(0.72)算色、西班牙語(0.63)的信息密度抬伺,都比到英語低。而日語信息密度為0.49剃允,有人認為這是因為日語的表意方式與其他語言不同沛简。
此處信息密度是通過計算每個音節(jié)所包含的義項數(shù)量來獲得的齐鲤。由于義項的數(shù)量是從原始文本——英文版里統(tǒng)計的斥废。而翻譯之后有可能會增加或減少義項。為了防止翻譯過程中的扭曲造成數(shù)據(jù)標準不統(tǒng)一给郊。各個語言的文本都被單獨翻譯為越南語牡肉,然后與各自越南語文本中每個音節(jié)所包含的義項數(shù)量相除,最終得到比較公平的數(shù)據(jù)淆九。
這讓我不由地想到统锤,經(jīng)過大規(guī)模注水的現(xiàn)代漢語信息密度還是這么高,那么文言文究竟已經(jīng)高到了何種地步炭庙?很遺憾沒有這方面的研究饲窿。不過,根據(jù)使用頻率進行加權(quán)平均焕蹄,現(xiàn)代漢語平均每個詞中的字數(shù)差不多是1.5左右逾雄。在文言文中,其中很多都是用單音節(jié)詞表達的。折中一下鸦泳,我猜想文言文的信息密度達到現(xiàn)代漢語的1.25倍應(yīng)該是不成問題的银锻。這在古代更是個恐怖的數(shù)字。因為拉丁語可不是比現(xiàn)代歐洲各主要語言簡單做鹰。受到古代文字記錄空間的限制击纬,漢語的顯然在文字記錄方面更加占優(yōu)。這也許就是我國古代文字記錄非常豐富的原因所在。
有人質(zhì)疑說,有時候一個很長的音節(jié)意思很簡單颠猴,而一個很短的單詞意思卻很復(fù)雜七婴。這種情況當然是存在的。我需要說明的是犁柜,所有復(fù)雜事物的優(yōu)劣都是一個統(tǒng)計概念,“高”并不是絕對在任何條件下都高,而是在大多數(shù)情況下高乎芳。如果一種語言平時交流平均下來就是比另一種語言多用一個音節(jié),那么很顯然其表意效率都是很低的帖池。
還有人說奈惑,音節(jié)不能作為衡量信息密度的單位,因為不同的音節(jié)睡汹,發(fā)音長度很不一樣肴甸。這個問題提的非常好。事實上我下一節(jié)就要講到英語與漢語發(fā)音長度的問題囚巴。英語單音節(jié)平均發(fā)音長度比漢語長原在。因此在口語的信息密度方面,漢語的優(yōu)勢更大彤叉。
值得注意的是庶柿,可能由于漢字與讀音是分離的,理解和朗讀無法同步進行秽浇,所以用漢語朗讀浮庐,就會比較慢。里昂大學(xué)的這個實驗中柬焕,漢語朗讀者每秒朗讀5.18個音節(jié)审残。大大慢于其他語言(英6.19,法7.18斑举,德5.97搅轿,意6.99,日7.84富玷,西7.82)璧坟。因此在朗讀中没宾,漢語傳遞信息的效率比較低,換算出來的朗讀信息傳遞效率為英1.08沸柔、法0.99循衰、德0.90、意0.98褐澎、日0.74会钝、中0.94、西0.98工三。
當然迁酸,以上里昂大學(xué)的研究也受到了一些批評。有人覺得做的太糙了俭正,而且有些地方不能自圓其說奸鬓。比如按文中數(shù)據(jù)明明日語表意效率明顯低,但作者又說其實一分鐘內(nèi)各個語言表達的信息量是差不多的掸读。
四串远、傳輸?shù)膬?yōu)勢:聲調(diào)
口語信息的傳輸,是通過聲音完成的儿惫。聲音一般分為四個部分:音質(zhì)澡罚、音高、音長肾请、音強留搔。對于語言的一個音節(jié)來說,音質(zhì)指的是其中輔音與元音的組合铛铁。其他三個都很好理解隔显。
一般現(xiàn)代語言不太規(guī)定音強,因為這實在無法在各個人之間得到統(tǒng)一饵逐,而且受到說話人的距離括眠、情緒、身體狀態(tài)等影響梳毙。此處需注意哺窄,英語中的“重讀”捐下,實際上是音高變化账锹。
而剩余的三個元素,則都在語言中得到了廣泛的運用坷襟。
我們拿漢語舉例奸柬,音質(zhì)很容易理解,就是發(fā)音除去聲調(diào)婴程。而聲調(diào)本身則分為音高和音長兩項廓奕。
漢語普通話的四聲,是四種不同音高變化模式。一聲是保持音高桌粉。二聲是音高由低到高變化蒸绩。三聲是音高從高到低再到高。四聲是音高由高到低铃肯。雖然我們當年語文課里說輕聲是沒有聲調(diào)患亿,但實質(zhì)上輕聲是縮短音長。輕聲一般是縮短音長的四聲或一聲(有時音高很低)押逼。不過輕聲很短步藕,比較難以聽清,所以普通話中僅作為特定用途使用(語氣助詞挑格、復(fù)數(shù)標志等)咙冗。
英語的重讀實際上是音高的差異。所以嚴格地說漂彤,英語是有聲調(diào)的雾消。只不過英語的音調(diào)只有兩個:高和低。但是英語中音調(diào)僅用于部分音節(jié)挫望。除了表示疑問仪或、強調(diào)等情況,通常英語單詞不變調(diào)士骤。除少量英語單詞(如Record)外范删,英語單詞不借助音調(diào)來區(qū)分不同的詞義。英語的確使用音長要素(如Sheep和Ship)拷肌。由于英語一般只用音質(zhì)和音長來區(qū)分詞義到旦,所以一般也認為是一種沒有聲調(diào)的語言。
首先從編碼效率上巨缘,我們可以說漢語就是世界上編碼效率最高的語言之一添忘。漢語是世界上為數(shù)不多的使用音高來區(qū)分不同單詞的語言。因此從編碼上說若锁,漢語發(fā)音的表意能力就比一般語言高出一個維度搁骑。也就是說,使用單個音節(jié)又固,漢語能夠表達的不同信息的種類仲器,理論上最高可以達到一般外語的4倍。
為什么外國人學(xué)漢語學(xué)得這么辛苦仰冠,而中國人學(xué)英語則沒有那么辛苦乏冀?就是中國人是已經(jīng)掌握了在發(fā)音是音高變化,現(xiàn)在再去學(xué)低級的兩個固定音高洋只。而在學(xué)習(xí)漢語中辆沦,很多外國人最吃力的問題之一就是聲調(diào)昼捍,因為只習(xí)慣于兩個固定的音高,而沒有聽到過肢扯、練習(xí)過在發(fā)音時連續(xù)變化音高妒茬。
有人提出,聲調(diào)本身會影響發(fā)音速度蔚晨。這當然是存在的郊闯。比方說二聲,要求發(fā)音時音調(diào)逐漸上升蛛株,要表現(xiàn)出這個团赁,發(fā)音時要表現(xiàn)出兩個音調(diào),自然是要比單一音調(diào)要費事谨履。但是聲調(diào)的好處在于欢摄,能夠在同一組輔音和元音組合的基礎(chǔ)上產(chǎn)生出多種不同的發(fā)音,所以就不必借助更多的輔音來區(qū)別兩個具有類似發(fā)音的詞(比如英文life和light)笋粟。英文音節(jié)中怀挠,輔音-元音組模式的音節(jié),發(fā)音確實比漢語略快害捕。但是其他模式绿淋,諸如輔音-輔音-元音組-輔音(Blight),或輔音-元音組-輔音尝盼,往往就比漢語發(fā)音慢了吞滞。而輔音-元音組模式的音節(jié),由于英語缺乏音調(diào)盾沫,所以數(shù)量遠小于漢語裁赠。整體平均下來,英語單個音節(jié)的發(fā)音應(yīng)慢于漢語赴精。
對于“英語單個音節(jié)的發(fā)音應(yīng)慢于漢語”這個結(jié)論佩捞,可能有的人覺得不是很信服。我們來舉一個非常簡單的例子蕾哟。普通中國人的初等數(shù)學(xué)能力往往超過歐美一忱。這并不簡簡單單是教育的問題。更關(guān)鍵地谭确,這是中文對數(shù)字命名結(jié)果帘营。
漢語所有數(shù)字均為單音節(jié),其中6和9有兩個元音(或按照國際學(xué)術(shù)標準琼富,三個元音)仪吧,發(fā)音稍慢;0有后鼻音鞠眉,發(fā)音可能稍慢薯鼠。還有幾個帶卷舌音,可能會稍慢械蹋。
英語所有數(shù)字出皇,除7以外,全部都是單音節(jié)哗戈。其中覆蓋了“輔音-元音”結(jié)構(gòu)(如4)郊艘、“輔音-輔音-元音”結(jié)構(gòu)(如3),“輔音-元音-輔音”結(jié)構(gòu)(如5)唯咬,“輔音-元音-輔音-輔音”結(jié)構(gòu)(如6)纱注,元音-輔音結(jié)構(gòu)(如8)、雙元音結(jié)構(gòu)(如0胆胰,注意一般數(shù)字里0讀“ou”狞贱,不讀zero,后者實在太費勁了)蜀涨,等等瞎嬉。可以說英語的這些數(shù)字大致包含了英語的各種單音節(jié)詞的音節(jié)結(jié)構(gòu)厚柳。當然這里還沒有最神奇的輔-輔-元-輔-輔結(jié)構(gòu)氧枣,但是那個和單元音結(jié)構(gòu)一樣比較少見。
那么平均下來英語的數(shù)字比漢語慢多少呢别垮?
首先我們需要知道便监,人對數(shù)字的短期記憶,實際上是對數(shù)字發(fā)音的記憶碳想。換句話說茬贵,你能記住的數(shù)字位數(shù),是由數(shù)字發(fā)音的總長度決定的移袍。研究表明(見http://deepblue.lib.umich.edu/bitstream/handle/2027.42/26140/0000216.pdf?sequence=1)解藻,中國人從小開始短期數(shù)字記憶能力就高過美國人。該文獻說明美國大學(xué)生的數(shù)字記憶長度平均為7.2位葡盗,中國大學(xué)生為9.2位螟左。美國大學(xué)生的短期數(shù)字記憶位數(shù),是中國學(xué)生的78.26%觅够。換句話說就是胶背,英語數(shù)字的平均發(fā)音長度比漢語數(shù)字高27.78%。去掉英文數(shù)字7(雙音節(jié))對平均音長的影響(10%)喘先,那么平均下來钳吟,單音節(jié)英語發(fā)音長度大概比漢語高17.78%左右。
更進一步窘拯,中國的數(shù)字都是徹徹底底的單音節(jié)红且,因此可以采用絕對邏輯的方式構(gòu)建整個數(shù)字表坝茎。九十六,就是九個十加一個六暇番。英語是“九十”(與九和十都不同的特殊詞)加一個六嗤放。法語是四個二十加十六。漢語種最簡潔而最富邏輯的結(jié)構(gòu)壁酬,在世界上是極為罕見的次酌。九九乘法口訣表,就是構(gòu)建在這個基礎(chǔ)上的舆乔。其他國家的兒童如果想背下來這張表岳服,可以說比中國兒童難了幾倍。這種語言上的優(yōu)勢就提高了中國人的初等數(shù)學(xué)能力希俩。
順便吊宋,還有人說,古漢語聲調(diào)更多啊斜纪,難道漢語越發(fā)展越回去了么贫母?這當然是錯誤的。有些音調(diào)受說話者情緒等條件的影響盒刚,在辨識的時候不確定性因素比較多腺劣。這個問題我們將在抗噪能力一節(jié)中詳細講解。
五因块、信息論上的優(yōu)勢
從信息論角度來考慮橘原,編碼是很有學(xué)問的。舉個例子涡上。我們知道計算機傳輸信息趾断,實際上傳輸?shù)亩际?和1。那么吩愧,如果我們傳輸?shù)母鞣N信息出現(xiàn)的頻率不一樣高怎么辦芋酌?答案是,出現(xiàn)越頻繁的雁佳,編碼越短脐帝。這樣就能提高總體效率。
比方說糖权,我們只有四種信息要傳遞堵腹。按一般的想法,自然是把這四種信息分別用00星澳、01疚顷、10、11來表示。每個信息都需要用兩位二進制數(shù)來表示腿堤,也就是說傳播100條信息需要發(fā)送200個二進制數(shù)阀坏。但是如果其中有一種信息出現(xiàn)的概率是91%,而另外三種分別是3%释液。那么就可以使用另一種編碼方式:1全释,01装处,001误债,000。平均下來這種傳播方式傳播100條信息需要發(fā)送1*91+2*3+3*3+3*3=115個二進制數(shù)妄迁。顯然比前面那種效率要高寝蹈。
世界各主要語言經(jīng)過了幾千年的進化,其詞匯的長度分布登淘,都比較符合信息論的要求箫老。你會發(fā)現(xiàn)各個語言中越常用的詞,一般就越短黔州。英語里耍鬓,我、你流妻、他牲蜀、她、我們绅这,都是單音節(jié)詞涣达。
英文的單音節(jié)詞非常豐富,實際上比中文的單音節(jié)發(fā)音要多证薇,這是因為英文可以在一個輔音-元音組合的前后都添加輔音度苔,來實現(xiàn)各種不同的單音節(jié)發(fā)音。這樣排列組合下來浑度,英文的單音節(jié)詞就是一個比較龐大的詞庫了寇窑。但是這就有一個代價,就是抗噪性能低箩张。這個問題我們放在下一節(jié)講解甩骏。
按西方音節(jié)定義,英語的單音節(jié)詞的使用比漢語要頻繁伏钠。根據(jù)統(tǒng)計分析横漏。漢語使用者平均詞長約為1.5字上下。(見《ReadingChineseScript: A Cognitive Analysis》這本書里有一個章節(jié)《Eye Movements in Reading Chinese andEnglish Text》)熟掂,而成年英語使用者平均每詞音節(jié)數(shù)約為1.4(見http://www.waisman.wisc.edu/phonology/pubs/PUB30.pdf缎浇,這也得到了另一個研究的支持:分析10小時的發(fā)聽錄音,平均每詞音節(jié)長度為1.38)赴肚。
所以素跺,就音節(jié)數(shù)而言二蓝,漢語詞平均比英語詞長7.14%。然而指厌,考慮到英語一個音節(jié)比漢語單音節(jié)實際上長得多(即便把上一節(jié)得到的17.78%折半刊愚,也有8.89%)。再加上漢語每音節(jié)信息含量大致比英語高3.30%(見第三節(jié)數(shù)據(jù))踩验。從信息論的角度講鸥诽,漢語的信息傳遞效率基本上比英語高。(是的是的箕憾,我知道信息論的計算還需要更多的數(shù)據(jù)牡借,只有平均值是不夠。但是實在找不到啊袭异,只能草草估計了钠龙。)
這一點也得到了另一個實驗的驗證(見http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3111932/)
這篇論文找了8個漢語使用者和8個英語使用者。然后讓他們兩人一組御铃。一組之中碴里,一個人描述圖片(描述者),另一個人根據(jù)描述來繪制(繪畫者)上真。最后對比圖片的準確度咬腋。同時觀察描述者的語言。
最后結(jié)果是谷羞,漢語描述者明顯比英語描述者先開始描述帝火。描述者開始描述與繪畫者開始繪畫之間的時間差,漢語使用者低于英語使用者湃缎。繪畫時間犀填,漢語繪畫者低于英語使用者。整體時間嗓违,漢語組顯著低于英語使用者九巡。所以漢語組所有都比英語組快。而且越復(fù)雜的繪畫蹂季,漢語組就快得越多冕广。
繪畫結(jié)果,144次繪畫偿洁。漢語組平均每次犯8.1個錯誤撒汉,其中描述者平均每次犯3.7個錯誤,繪畫者犯4.4個錯誤涕滋。英語組平均每次犯13.25個錯誤睬辐,其中描述者平均每次犯8.5個錯誤,繪畫者犯4.75個。兩者的差距仍然在統(tǒng)計誤差之內(nèi)溯饵。所以并不算顯著侵俗。(嗯?剛才誰說漢語沒有英語精確來著丰刊?)
之后隘谣,為了考慮繪畫者的技巧差異。讓每個繪畫者直接對照原圖繪畫啄巧。結(jié)果漢語組反而慢于英語組寻歧。
繪畫期間,漢語組使用音節(jié)數(shù)顯著少于英語使用者棵帽。兩組語速(每秒音節(jié)數(shù))接近(這個結(jié)論與前面的播音速度分析結(jié)果一致)熄求。
這雖然是一個初步的實驗渣玲,但是還是能看出漢語在交流上的優(yōu)勢的:用詞更少逗概,時間更短,描述精確水平差不多(如果不是更高的話)忘衍。這個實驗還說明了……我國人民美術(shù)水平還有待提高……
至于歐洲主要其他語言逾苫,根據(jù)第三節(jié)提到的數(shù)據(jù),它們發(fā)音頻率比英語高枚钓,信息密度比英語低铅搓。要那些語言在這方面超過漢語,我覺得可能性不大搀捷。
六星掰、組詞邏輯
由于英語單音節(jié)詞資源比較豐富,但平均發(fā)音長度較長嫩舟。所以你會注意到英語里單音節(jié)詞比例高于漢語氢烘,而多音節(jié)詞的使用比例就小于漢語。很多邏輯上非常相關(guān)的詞由于不得不全部擠入有限的單音節(jié)詞庫家厌,其發(fā)音就失去了聯(lián)系播玖。這就導(dǎo)致英語的常用詞往往缺乏組詞的邏輯。
比如我們可以很輕松地說“公雞”饭于、“母雞”蜀踏、“小雞”、“雞蛋”掰吕。而英語里就成了“Cock”果覆、“Hen”、“Chick”殖熟、“Egg”局待,毫無聯(lián)系。如果常用詞要建立聯(lián)系,那么英語就必須提高這些單詞的音節(jié)數(shù)燎猛,那么平均詞長就要上升恋捆,從信息論角度講,信息傳遞效率就更低了重绷。所以英語只能在組詞的邏輯性上進行妥協(xié)沸停。
相比之下,漢語就從容的多了昭卓,即便在當前這種信息效率下愤钾,漢語仍然能保證絕大多數(shù)詞語構(gòu)造具有邏輯性。因此相比于英語詞匯候醒,漢語詞匯就比較容易記憶能颁。這就產(chǎn)生了一個結(jié)果,那就是漢語的常用詞匯量遠遠多于英語倒淫。
英文使用者的單詞量和生詞辨識能力可見1995年的以下論文:http://jlr.sagepub.com/content/27/2/201.full.pdf
其中伙菊,大學(xué)生平均自稱單詞量為16141,經(jīng)過多項選擇測試發(fā)現(xiàn)敌土,平均能夠辨識其中71%的詞匯镜硕。也就是說平均大學(xué)生詞匯量估計為11460個單詞。老年人平均自稱單詞量為21252返干,經(jīng)過多項選擇測試兴枯,發(fā)現(xiàn)平均能辨識其中80%。也就是說老年人的詞匯量大致為17002矩欠。對于從未見過的詞的正確理解概率财剖,大學(xué)生為30%,老年人為39%癌淮。
沒有找到中國的相關(guān)研究躺坟。不過這里是商務(wù)印書館的《現(xiàn)代漢語常用詞表(草案)》:http://wenku.baidu.com/view/51636fec551810a6f5248676.html
大家可以進去看看自己的詞匯量。我感覺大學(xué)生達到五萬應(yīng)該不成問題该默。而且這肯定不是一個人的全部單詞量瞳氓。不過這里面有些詞是英語里幾個詞合起來的。所以中國人詞匯量未必比美國人高這么多栓袖。但我覺得定性的結(jié)論還是可以下的匣摘。
另外里面可能有你沒見過的詞,可以看看有多少你猜不出正確含義……我覺得除了極少數(shù)裹刮,確實沒什么難度……
另外音榜,漢語和英語都各自在組詞上有一個弱點。漢語有大量的同音詞捧弃,而英語有大量的多義詞赠叼。漢語有“攻擊”和“公雞”擦囊,英語的Ball既可以是球也可以是舞會,當然還有相關(guān)的一些列動詞含義嘴办。漢語中瞬场,曾經(jīng)在文言文中大規(guī)模使用的單音節(jié)多義詞現(xiàn)在大多變成了雙音節(jié)單義詞。漢語中真正的多義詞(各個意思之間沒有直觀邏輯聯(lián)系)是極少數(shù)涧郊。而英語里的同音詞也是極少數(shù)贯被。可以說這兩種語言在各自的發(fā)展路徑上都做了妥協(xié)妆艘。
由于英語多義詞比例比較大彤灶,所以盡管英語使用者詞匯量比漢語使用者低,也不能說明英語的描述能力不如漢語批旺。另外注意到幌陕,美國大學(xué)生的詞匯量遠低于老年人,這說明他們并不是已經(jīng)記下了所有能見到的詞匯汽煮,而是在那個年齡段搏熄,還沒有足夠的時間記下。因此可以看出逗物,英語一詞多義很多的原因搬卒,很可能就是英語單詞的記憶難度比漢語大。
所以總的來說翎卓,由于漢語精簡了發(fā)音,并且每音節(jié)信息密度較高摆寄,這就使得漢語可以有較長的平均詞長失暴,因此組詞邏輯相比于英語就有了一定的優(yōu)勢。至于其他主要語言微饥,信息傳遞效率與漢語相比差距更大逗扒。主要方面都無法相比,這種次要方面就不需要再比了欠橘。(不過話說回來法語之類組詞邏輯比英語確實要好)矩肩。
七、強勁的抗噪能力
前面講到肃续,英語依靠大量的單音節(jié)詞才能夠接近漢語的信息傳遞效率黍檩。但這不是沒有代價的。
構(gòu)造大量的單音節(jié)詞始锚,就需要在詞匯中使用大量的輔音刽酱。輔音分為兩種。一種屬于響音瞧捌,就是能夠持續(xù)發(fā)音的棵里,諸如m润文、n、ng(除這類輔音外殿怜,所有的元音也都是響音)典蝌,一類叫做阻礙音。阻礙音本身發(fā)音短促头谜、強度低赠法、音高也很低。只有當阻礙音與元音結(jié)合乔夯,才能發(fā)出強度比較大的音砖织。
漢語普通話中,所有阻礙音都是與元音結(jié)合的末荐。而英語以及歐洲所有拼音語言侧纯,都大量使用了不與元音結(jié)合的阻礙音。事實上甲脏,古漢語中不與元音結(jié)合的阻礙音是極度常見的眶熬,音節(jié)結(jié)構(gòu)比現(xiàn)代漢語的諸多方言都復(fù)雜。但是后來這種輔音用法就基本淘汰了块请。具體上古漢語的發(fā)音案例娜氏,大家可以自行搜索“《關(guān)雎》上古漢語朗讀”。雖然學(xué)界對上古漢語的具體發(fā)音還有很多爭議墩新,但古漢語音節(jié)的復(fù)雜度在那個朗讀中體現(xiàn)得很好贸弥。
消滅獨立的阻礙音,首先加快了發(fā)音速度海渊,第二保證所有音都具有很高的強度绵疲。但是其代價就是大大縮小了單音節(jié)詞庫。不過在上面的比較中我們可以看出臣疑,這個代價是值得的盔憨。漢語的信息傳遞效率仍然非常高。
那么我們繼續(xù)一個前面提到的話題讯沈,是不是音調(diào)越多越好呢郁岩?
有一個搞笑論調(diào)是這么說的,"我們的普通話叫“mandarin”缺狠,什么意思拔噬鳌?滿大人儒老,滿族人清朝入關(guān)之后蝴乔,說不出我們的口語,他就把很多調(diào)去掉了驮樊,把入聲去掉了薇正,說的發(fā)音越來越簡單了片酝。然后逼著全國人都這么說。所以我們現(xiàn)在的口語比粵語要簡單得多挖腰。"
這是一個非常愚昧的論調(diào)雕沿。首先逻悠,Mandarin這個英語單詞來自于葡萄牙語mandarim叙谨,葡萄牙語這個詞又來源于馬來語m?nt?ri,馬來語這個詞來源于梵語mantrin欧宜,而梵語這個詞的意思是官員辽俗。換句話說疾渣,mandarin的愿意是“官話”。而且Mandarin這個詞能查找到的最早的記錄出現(xiàn)于1589年崖飘。大家可以查查那時候“滿大人”在哪里呢榴捡。
很多人以為粵語是正宗的漢語發(fā)音。這話對朱浴,也不對吊圾。粵語具備一些中古漢語的發(fā)音特征翰蠢。但是它也是在中古漢語的基礎(chǔ)上發(fā)展而成的项乒,語音還是有相當大的差異。有人認為北方官話/中原官話的形成梁沧,是因為蠻族入侵“污染”了漢語檀何。這個說法同樣,對趁尼,也不對埃碱。北方官話之所以在中古漢語的基礎(chǔ)上進一步的發(fā)展,就是因為戰(zhàn)爭與征服酥泞,北方漢民與語言不通的外族加深的了交流,多種族的融合啃憎,教育芝囤,逐漸把一些發(fā)音變得更加容易。
舉一個例子辛萍,粵語里白菜的白是Baak6,普通話是Bai2辉阶∠群荆粵語里尾部的這個k是一個不發(fā)音的舌頭動作瘩扼。這個動作略微改變了原來Baa的發(fā)音。但是這個音垃僚,如果不費力就很難造成Baa明顯的變化。相比之下栽燕,Bai本身就容易發(fā),雙元音ai的發(fā)音是通過舌頭跟隨下顎動作完成的改淑。我們知道咀嚼肌的力量比舌頭大蔼啦,運動也快。依靠下顎完成的ai音顯然比依靠舌頭完成的aak音要容易發(fā)侍郭。當然這不是一個公平的比較询吴,相比之下普通話Liu、Lang的發(fā)音難度與粵語Baak相近亮元,但是這兩個音的尾部都是響音猛计,不需要費力就能發(fā)得很清楚。
與這個不發(fā)音的k類似的爆捞,還有粵語中p和t結(jié)尾奉瘤。這種發(fā)音方式正式名稱叫做不除阻的塞音尾。在亞洲很多國家和方言里都有煮甥。這應(yīng)該是古漢語流傳下來的特點盗温。這種塞音尾既不抗噪也不省力。在交流更廣泛成肘、更頻繁的北方方言里是很難見到的卖局,應(yīng)該是已經(jīng)演化成其他發(fā)音了。
粵語依具體方言不同双霍,有6-10個聲調(diào)砚偶。其音高變化模式并不超出普通話的四個音調(diào)。之所以多出來這么多音調(diào)洒闸,是因為粵語還引入了不同基準音高染坯。比方說在一些方言里,粵語的第1丘逸、3单鹿、6聲都是保持音高,但是這三個聲調(diào)各自保持的音調(diào)高度不同深纲。再比如粵語第2仲锄、5聲劲妙,都是音高由低到高變化,但起始音高不同昼窗∈桥浚粵語總共有四種不同的基準音高,分別是do澄惊、re唆途、mi和sol。類似的情況在很多南方方言里都存在掸驱。
這就是為什么有時候南方方言聽起來有些像唱歌肛搬。大概也就是為什么吳儂軟語聽起來很好聽。
然而粵語音調(diào)最大的問題就是毕贼,每一個人音調(diào)高低是不一樣的温赔。有的人說話音調(diào)高,有的人音調(diào)低鬼癣。沒有一個統(tǒng)一標準陶贼。甚至同一個人說話的時候,在低沉待秃、平靜拜秧、激動時,音調(diào)高低也是不同的章郁。因此枉氮,與一個不熟悉的人說話,出現(xiàn)單獨的一個音高或兩個音高暖庄,都很難分辨出到底是哪一聲聊替。必須要三到四個基準音高都繁出現(xiàn),才能判斷準確對方的音高究竟屬于哪一聲培廓。而這些基準音高是否會頻繁出現(xiàn)惹悄,這就是比較看人品的了。當然肩钠,就漢語的冗余度而言俘侠,一部分音高判斷不準是沒有太大關(guān)系的。但這就讓粵語發(fā)音多變的優(yōu)勢大大削弱了蔬将。
此外,粵語的7央星、8霞怀、9聲都是短促音,其音高和音高變化模式與1莉给、3毙石、6聲沒有區(qū)別廉沮。短促音抗噪能力不如普通音長的發(fā)音,但它們的發(fā)音速度更快徐矩。不過在現(xiàn)今人類口語交流中滞时,瓶頸是大腦的思維速度,發(fā)音速度太快并沒有明顯的好處滤灯。
有人問到底多少個聲調(diào)最合適坪稽。我覺得這很不好說。現(xiàn)在沒有客觀的評估鳞骤。但是無論如何有聲調(diào)的漢語(及其方言)總是要比沒有聲調(diào)的外語強窒百。。
那么漢語的抗噪性能有沒有什么證明呢豫尽?
有的篙梢。出了國,尤其是到了歐美的人美旧,就會發(fā)現(xiàn)一個問題渤滞。那就是中國人說英語,相比于當?shù)厝藖碚f榴嗅,總有點含混不清妄呕。外語老師總是要求中國人說英語的時候嘴巴要張大、舌頭的運動要有力录肯,甚至要求用牙齒咬住一根鉛筆來訓(xùn)練唇舌運動趴腋。這是為什么呢?因為中國人已經(jīng)習(xí)慣了唇舌微微運動的發(fā)音過程论咏。
首先漢語發(fā)音具有很高的信號強度优炬。而且由于舍棄了所有單獨發(fā)音的輔音,所以一個音節(jié)里的元音就能保持更長的時間(這也就是為什么我們一般覺得漢語說話比英語慢的緣故)厅贪。我們知道長時間保持一個信號蠢护,也有利于對抗隨機噪聲。發(fā)音強度大养涮、元音維持時間長葵硕,這就導(dǎo)致,同等發(fā)音強度時贯吓,漢語的抗噪能力更加強大懈凹。換句話說就是,同等噪音條件下悄谐,漢語所需要的音量更小介评。因此漢語使用者發(fā)音不必費力,唇舌運動幅度比英語之類明顯小。
八们陆、口語的速度
說到口語的速度寒瓦,我們先來看這篇論文:http://ldc.upenn.edu/myl/llog/icslp06_final.pdf
其中圖1顯示,根據(jù)一些談話樣本坪仇,當去掉沉默與噪音占據(jù)的時間后杂腰,英語會話者每分鐘一般能夠說160-280個詞。漢語會話者大致是250至400詞(這里不是字)椅文。這差不多是普通人不受思緒影響的最高語速喂很。所以可以看出,漢語的理論最高信息傳遞能力是遠遠高于英語的雾袱。
但實際上受限于思維速度恤筛,兩者的速度差距并不大。以下這篇論文研究了在不同語速下聽眾正確聽得每個字的概率芹橡。http://www.sciencedirect.com/science/article/pii/S0169814104001581
一般廣播節(jié)目的語速在4.3字每秒左右毒坛。也就是每分鐘260字上下。高于這個數(shù)字林说,就可能會聽眾接收語音時聽錯煎殷。從上文可以看出,年輕人在對方語速達到約650字每分鐘時(即吐字時間縮短60%)仍然能保持90%以上的正確接收率腿箩。但是老年人就會降低到約70%豪直。可以看出這個速度實際是受限于大腦的處理速度珠移。中國好聲音的華少弓乙,是47秒說350個字,也就是速度達到了446.8字每分鐘钧惧。這個速度上能說得字字清晰暇韧,這是很厲害的。
英文新聞播音一般在150-180詞每分鐘(當然浓瞪,也取決于詞的長度)懈玻。根據(jù)10個小時的法庭錄音的數(shù)據(jù)結(jié)果(http://languagelog.ldc.upenn.edu/nll/?p=1255),可以看出美國大眾90%的情況下說話速度低于200詞每分鐘乾颁,99.75%的情況下低于250詞每分鐘涂乌。平均水平差不多是160-170詞每分鐘。(因為僅靠10小時庭審記錄統(tǒng)計英岭,所以不會特別準確湾盒,這里就是看個大概。)
所以诅妹,按照平均每詞1.4音節(jié)計算历涝,基本上英文新聞播音一般每分鐘210-252個音節(jié)左右。這與庭審記錄中平均一分鐘226個音節(jié)接近。
英文播音平均每分鐘210-252個音節(jié)與漢語播音平均每分鐘240-260字沒有顯著區(qū)別荧库。
可以說,人類接受語音的速度赵刑,現(xiàn)在是受到了人腦處理能力的限制分衫。上面的播音速度,都不是播音員最快的說話速度般此,而是為了保證觀眾正常收聽才控制的速度蚪战。隨著交流的日益深入,人類說話的速度實際上在加快铐懊。40年前美國一般語速是145詞每分鐘邀桑。如今是160-170詞每分鐘。中國60年代播音185字每分鐘科乎,如今是240-260字每分鐘壁畸。這也許是信息的豐富讓人腦的處理能力上升的緣故。
九茅茂、漢字:偉大的基礎(chǔ)
漢語一開始也是一種綜合語捏萍。大量使用詞根、詞綴空闲。但是從文字角度令杈,漢字為漢語成為分析語提供了非常關(guān)鍵的基礎(chǔ)結(jié)構(gòu)。漢字導(dǎo)致詞形變化無法記錄在紙上碴倾。最后詞形變化就只能用額外的漢字來標記了逗噩。而這個增加的漢字就變成了一個通用的邏輯規(guī)則,也就與修飾的特定詞失去了必然關(guān)系跌榔。這樣漢語就逐漸變成分析語了异雁。
而正是由于漢字將讀音與書寫割裂,使得漢語的語音能夠相對自由地發(fā)展矫户。因此在漢語語音在幾千年中變化了如此之大片迅,而我們的文化卻沒有多少割裂。
更進一步地皆辽,由于漢字并不受限于讀音柑蛇,因此可以創(chuàng)造出大量同音異形字,幫助漢語降低平均音節(jié)長度驱闷、提高組詞的邏輯性耻台。而且,雖然在口語上空另,漢語的同音異形詞和英語的多義詞都屬于“同一發(fā)音可能包含不同含義”的情況盆耽,但寫到紙面上,同音異形詞就比多義詞更容易辨識,減少歧義的可能摄杂。
有人可能會問坝咐,漢語口語交流,并沒有多少歧義的問題析恢。那為什么文字中會需要額外的消除歧義的能力呢墨坚?這是因為一般情況下口語交流是一種雙向交流,如果發(fā)現(xiàn)有可能有歧義映挂,可以向?qū)Ψ皆儐栐罄海鲃酉缌x。而文字往往是一種單向交流(不包括網(wǎng)上文字聊天……)柑船,一旦出現(xiàn)歧義帽撑,就很難消除。因此文字里的歧義一般需要比口語更小鞍时。
所以我們的文字亏拉、我們的語音以及我們整個語言整體,都是有機結(jié)合在一起的寸癌。推崇漢字的拼音化或拉丁語話专筷,都是沒有看清這種密切聯(lián)系。因此盲目把文字拼音化的韓國就會出那種把防水材料搞成吸水材料的笑話(韓語里“防水”和“放水”讀音一致蒸苇,結(jié)果建筑公司錯誤理解了圖紙)磷蛹。
另外,由于漢字不需要空格溪烤,所以相比于類似字號的英文單詞味咳,同一個詞要高而窄。這在排版上有很大的優(yōu)勢(行距要占用額外的空間檬嘀,高而窄可以減少行數(shù))槽驶。加上漢語本身信息密度高。所以一般我們看到的中文版的書面文件都比外文版的頁數(shù)少鸳兽。
十掂铐、閱讀速度的比較
和語音一樣,閱讀速度同樣受到大腦處理速度的制約揍异。所以各個主要語言區(qū)別不大全陨。
在《ReadingChineseScript: A Cognitive Analysis》這本書里有一個章節(jié)《Eye Movements in Reading Chinese andEnglish Text》專門講閱讀中英文時的眼球移動。這是中科院和悉尼大學(xué)的兩位學(xué)者寫的衷掷。這其中發(fā)現(xiàn)辱姨。熟練的中文閱讀者能夠每分鐘閱讀386個中文詞匯(580個漢字),而熟練的英文閱讀者可以每分鐘閱讀382個英文詞匯戚嗅。一般人可能會低100詞左右雨涛。具體速度還取決于文章的復(fù)雜程度枢舶,文章簡單的話閱讀速度就更快。
漢語使用者眼睛每次凝視可以閱讀1.71個詞(2.57個漢字)替久,每次凝視平均257毫秒凉泄。英文閱讀者每次凝視可以閱讀1.75個詞,每次凝視平均265毫秒侣肄。
總體上說旧困,兩者閱讀速度不相伯仲。
在同一個章節(jié)中稼锅,作者提到,如果通過連續(xù)在同一位置顯示不同的詞(RSVP法)僚纷,就能免去眼睛的運動矩距。這樣,最高可以提升中文閱讀速度約33%(從640字每分鐘提升至853)怖竭。英文最高提升也基本上是33%上下(見http://www.handwritten.net/mv/papers/oqvist01adaptive_rapid_serial_visual_presentation.pdf)锥债。
十一、雙線并行讀取能力:更穩(wěn)定
經(jīng)過長期的研究痊臭,人們發(fā)現(xiàn)不同語言使用者在閱讀時使用的大腦區(qū)域是不同的哮肚。以下這篇文章提供了部分綜述:http://www.pitt.edu/~perfetti/PDF/Brain%20activ%20process%20Chinese%20char%20and%20words-%20Tan%20et%20al..pdf
閱讀自己母語時,閱讀漢語的人腦部激活范圍比閱讀英語的人大广匙。英語閱讀者在閱讀時主要激活左腦的一些部分允趟。而漢語閱讀者同時激活左右腦。這是一個很有意思的發(fā)現(xiàn)鸦致。因為潮剪,時序信號(語音就是個時序信號)的處理區(qū)域一般在左腦,圖像分唾、空間信息的處理區(qū)域一般在右腦抗碰。所以,很多人認為绽乔,漢語閱讀者的閱讀實際上有兩個處理通道弧蝇。就是說在閱讀漢語時,我們總是一邊通過圖像來直接識別文字含義折砸,一邊通過圖像轉(zhuǎn)換為讀音然后來識別文字含義看疗。而表音語言只有一條顯著的處理通道。
為了確認這個結(jié)果鞍爱。研究人員進一步研究了一個夾雜表意和表音文字的語言——日語鹃觉。在閱讀日語時,左腦在閱讀平假名/片假名有優(yōu)勢睹逃,而右腦在閱讀漢字時有優(yōu)勢盗扇。
有意思的是祷肯,中國人在讀英語、日語時腦部活動與英美人士讀英語是不一樣的疗隶。顯示出中國人長期閱讀中文后佑笋,養(yǎng)成的圖形、讀音雙路識別的習(xí)慣斑鼻。不過快速閱讀英文時右腦活躍度不高蒋纬,可見此時主要依賴讀音識別。具體內(nèi)容可見下面這篇文章http://www.pitt.edu/~perfetti/PDF/Brain%20activ%20process%20Chinese%20char%20and%20words-%20Tan%20et%20al..pdf
這些研究同時意味著坚弱,漢語的兩大處理途徑只有同時失效才會造成閱讀能力低下蜀备。這個結(jié)論受到近年來的研究支持。如下面這兩個報道:http://blogs.scientificamerican.com/observations/2009/10/12/its-all-chinese-to-me-dyslexia-has-big-differences-in-english-and-chinese/http://www.sciencedaily.com/releases/2009/10/091012121333.htm
學(xué)者研究了具有發(fā)展性閱讀障礙(失讀癥)的中國兒童荒叶,他們大腦的處理語音的部分和處理圖像的部分活躍度都比較差碾阁。而英文失讀癥的患兒,則不見得有圖像處理問題些楣。事實上脂凶,有一種療法就是把英文發(fā)音用漢字表示,然后讓患兒閱讀愁茁。取得了很好的效果蚕钦。具體可見1971年的這篇論文。http://www.eric.ed.gov/ERICWebPortal/search/detailmini.jsp?_nfpb=true&_&ERICExtSearch_SearchValue_0=EJ037129&ERICExtSearch_SearchType_0=no&accno=EJ037129
患閱讀障礙的兒童比例也說明了中國兒童不易得閱讀障礙鹅很。http://www.guardian.co.uk/education/2004/sep/23/research.highereducation2
根據(jù)上面這篇報道嘶居,英語區(qū)閱讀障礙者比例約為5-6%,而漢語區(qū)約為1.5%道宅。百度的數(shù)據(jù)不知道哪里來的食听,居然說中國失讀癥患者和美國相當。我看到的英文文獻沒有一個說兩者相當?shù)奈垡稹6际侵袊扔⒚赖陀1ā?赡苡捎跇藴什煌⒌保€有另一組數(shù)據(jù):中國7%迹蛤,美國17%。實在是沒有見到哪里有說兩者相當?shù)摹?/p>
不過值得注意的是襟士,漢語閱讀與英語閱讀使用不同的大腦區(qū)域盗飒,病變區(qū)域也不同。所以具體的致病機理仍然在研究中陋桂。目前只能通過患者的行為現(xiàn)象來論證逆趣。
也有人懷疑,正是由于漢語造成更大的腦部活動嗜历,所以在教育水平普遍落后于發(fā)達國家的情況下宣渗,中國平均智商仍然高于歐美抖所。關(guān)于全球各國平均智商,有兩位作者寫了很多本書痕囱。這些書的綜述可見這里:http://en.wikipedia.org/wiki/Nations_and_intelligence
不過以上這個智商研究的準確性受到了諸多質(zhì)疑田轧。所以大家看看就是了,不必太認真鞍恢。
十二傻粘、不夠嚴謹?
有人說漢語的劣勢就是不夠嚴謹帮掉。
這其實可以說是分析語和綜合語的差異弦悉。分析語對于詞的具體含義需要通過上下文確定。如果上下文給予信息不足蟆炊,就有可能出現(xiàn)歧義警绩。而很多時候,上下文只能表明這個詞更可能是什么意思盅称,而不能完全否定其他理解。
這雖然在交流中不會有什么問題后室,但是在那些防止別人鉆空子的文件里就可能造成問題缩膝。
我們舉個例子:“中國絕不會首先使用核武器“杜”
這句話有三種解釋:1疾层、在敵方?jīng)]有使用核武器之前,中國不會使用核武器贡避。2痛黎、中國在使用常規(guī)武器之前不會使用核武器。3刮吧、中國不會是世界上第一個使用核武器的國家湖饱。
很顯然理解應(yīng)該是1,但是并無法否定2和3的可能性杀捻。因此井厌,很多人認為漢語的這種不嚴謹性會妨礙法律條文和合同。
但是英文難道就很嚴謹么致讥?He ran into a girl with an umbrella.帶傘的是男的還是女的仅仆?I saw a car with a big flag, whichlooked really evil.?哪個看起來很邪惡,車還是旗子垢袱?China will not be the first to use anuclear weapon.?這應(yīng)該是上面的解釋1還是3墓拜?
想要做到嚴謹,都需要考慮到其他人閱讀時的想法请契,然后用其他語句來消除歧義咳榜。(順便推薦搞笑英語書籍《Anguished English: AnAnthology of Accidental Assaults Upon OurLanguage》夏醉,里面收錄了很多爆笑的歧義句,比如If you have not got any fresh vegetables, you may get canned.)
所以贿衍,漢語要想說的嚴謹授舟,也是沒有問題,只不過要比一般多一些口舌而已贸辈。分析語本身的表意效率就很高释树。多花一些筆墨,達到嚴謹?shù)男Ч嬗伲彩峭耆梢宰龅降纳萆丁K赃@方面如果有差距的話,差距也不大嘴拢。
十三桩盲、劣勢:難以學(xué)習(xí)
毋庸置疑,雖然漢字承載著漢語的諸多優(yōu)勢席吴,但是漢字本身最大的劣勢卻是不可回避的赌结。那就是不利于學(xué)習(xí)。
我在背英語單詞的時候孝冒,發(fā)現(xiàn)最好的記憶方法是把意思和讀音結(jié)合起來柬姚,然后通過讀音記憶拼寫。(完美的表音文字庄涡,應(yīng)該是讀音與拼寫的直接對應(yīng)量承。英語由于受到其他語言影響太多所以這方面相對較差,不過這種規(guī)律還是相通的穴店。)
相對與文字撕捍,人對讀音的記憶速度更快。而表音文字泣洞,一旦掌握了拼寫和讀音之間的規(guī)律忧风,就很容易記住文字。
而漢語在這方面是很差的斜棚。字和字之間缺乏聯(lián)系阀蒂,字和讀音之間很少有聯(lián)系,而且由于幾千年語音的變化弟蚀,經(jīng)吃橄迹看著是個形聲字,讀音卻與想象的相差甚遠义钉。這是我們文字的劣勢昧绣。當然,如前面所說捶闸,這也有使用上的優(yōu)勢夜畴。
我們可以看到拖刃,幾千年來文字的發(fā)展歷程。它總是首先于兩個因素:表意的需要贪绘,學(xué)習(xí)和書寫的難度兑牡。
一開始我們的老祖宗試圖用一個字代表一個特定含義。這是很自然的思路税灌。但是后來隨著需要表達的意思成幾何級數(shù)增長均函。漢字逐漸就不夠用了×獾樱或者說苞也,這樣的話,同音字實在太多粘秆,不利于傳播了如迟。于是多個字組成的詞才出現(xiàn)。在此之后攻走,一大批原來造出來的字都被拋棄了殷勘。
比方說騅、驪昔搂、騍這種專門為表示特定種類的馬的字劳吠。還有璇、璣等等一大堆帶王字旁(斜玉旁)表示特定種類的玉器的字巩趁。后者畢竟意思還不錯,還在名字里用一用淳附。
有一些人對漢字的簡化持有非常大的非議议慰。我覺得大可不必。漢字的簡化是必要的奴曙。越復(fù)雜的字形别凹,越難以學(xué)習(xí)。漢字幾千年的發(fā)展洽糟,使得字形與含義的距離也越來越遠炉菲。復(fù)雜的字形在表音、表意方面并無優(yōu)勢坤溃。進與進拍霜、從與從、后與後薪介,都沒看出來繁體字在表意方面有何優(yōu)勢祠饺,而簡體在學(xué)習(xí)的簡便性上優(yōu)勢倒是很明顯。每次看到“憂鬱的烏龜”汁政,我自己都快憂郁了道偷。
當然缀旁,漢字簡化還將一些意思完全不同的字合成了一個字。有個著名的繁體字愛好者嘲笑簡體字的段子是“我女朋友下面給我吃”有歧義勺鸦。而繁體字版并巍,因為能區(qū)分面和麵,是沒有歧義的换途。當然現(xiàn)實生活里是沒有人這樣說話的懊渡。一般對于“下麵”,我們不是說“下面條”就是說“下點面”怀跛。
而且距贷,拜托,我們是分析語好嗎吻谋?拜托有一點分析語的自覺好不好忠蝗?你覺得專門找一段孤立的話,有什么價值么漓拾?如果找個綜合語阁最,能用詞形變化把“(男性)我”和“(女性)我”分開,更可以輕易嘲笑漢語造成歧義骇两。分析語本身就要求有上下文提供必要的信息速种,因為分析語借助邏輯關(guān)系省略了大量的信息才實現(xiàn)了更高效率的信息傳遞。這點小小的歧義在現(xiàn)實生活中是不會造成什么影響低千。你要問為什么配阵,這很簡單,因為漢字簡化都不是幾十年前那些人坐在那里拍腦袋寫出來的示血,而是之前至少上百年就有人大規(guī)模使用的棋傍。如果頻繁造成歧義,早就沒有人那樣用了难审。
當語法發(fā)展完全瘫拣,使用充分之后,維持龐大而復(fù)雜的常用文字庫只能不利于學(xué)習(xí)告喊。適當?shù)暮喕潜匾聂镏簟h字本身的優(yōu)越性并不高,但是它為漢語的優(yōu)越性提供了必要的基礎(chǔ)支持黔姜。沒有漢字就沒有漢語拢切,但是漢字本身也是需要時不時進行改革的。畢竟學(xué)習(xí)的難度在目前條件下還是顯著高于其他語言秆吵。如果能在不傷害對漢語的支撐能力的情況下使得漢字更好學(xué)習(xí)失球,這無疑是一件好事。
另外,有人認為漢語的檢索非常困難实苞。但是現(xiàn)在都是計算機和智能設(shè)備了豺撑。有幾個人近年來還翻過字典呢?有幾個人還跑到圖書館里去查索引呢黔牵?連英文都不這么做了聪轿。直接計算機一查,你要的東西在哪個位置就顯示出來了猾浦。
十四陆错、漢語與拼音文字的起源對比
最后講個小問題。現(xiàn)在拼音文字大行其道金赦。有的人認為這意味著拼音文字是更先進的文字音瓷,所以拼音文字戰(zhàn)勝了表意/意音文字。事實上夹抗,單從兩者的發(fā)展歷史绳慎,是得不到這個結(jié)論的。
文字漠烧,從一開始就是記錄信息用的杏愤。所有文明的最原始的文字,如果是自然生成的話已脓,都是象形文字珊楼。這個原因并不難理解。一開始大家可能只要記錄今天是什么日子度液、我有幾頭牛之類厕宗。顯然是畫個東西上去最簡單。中國堕担、兩河流域媳瞪、古埃及、古印度照宝、瑪雅,一開始使用的都是象形文字句葵。
從象形文字出發(fā)厕鹃,一個文明可以發(fā)展出很多種不同的字形。但是隨著需要表達的意思迅速增加乍丈,就需要不斷添加新的字形剂碴。這時比較簡單的辦法就是讓一個字型一部分表音一部分表意。中國漢字在擴展時主要采用形聲字策略轻专。用形旁和聲旁組合成一個漢字忆矛。而埃及的圣書體也與此類似,圣書體的一個單詞包含兩個部分,一部分用象形符號表音泽疆,一部分用象形符號表意枫绅。
而歐洲現(xiàn)在主要語言都起源于拉丁文低匙,拉丁文又起源于希臘語。希臘人的字母表是腓內(nèi)基人教的亚兄。而腓內(nèi)基人的字母又是從埃及人那里來的。與此同時采驻,還發(fā)現(xiàn)了一種可能是拼音文字的“前西奈字母”文字审胚。這種文字與腓內(nèi)基文字類似,也與圣書體有相似之處礼旅。有學(xué)者認為膳叨,腓內(nèi)基文字就起源于“前西奈字母”,而“前西奈字母”則是圣書文的一種拼音簡化體痘系。這類似于拼音文和漢字的區(qū)別菲嘴。
所以說白了,從腓內(nèi)基開始碎浇,一直到現(xiàn)在歐洲諸國临谱。其拼音文字的起源,大概都由埃及的圣書體中的表音部分演化而來奴璃。
需要注意的是悉默,由于口語先于文字出現(xiàn),當一個民族還沒有自己文字的時候苟穆,接觸到外來文明抄课,就容易用外來文明的字符體系來構(gòu)建自己的文字。對于這些民族而言雳旅,最簡單的就是用先進文明的字母體系來直接表達自己語言的發(fā)音跟磨。
因此,自腓內(nèi)基而后的歐洲的次生文明自然紛紛使用字母來記錄自己的語言攒盈。
再比如抵拘,日本盡管很早就引進了漢字,但是漢字與其原有的語言(當時還沒有文字)并不兼容型豁。而漢語里根本就沒有簡單的拼音符號僵蛛。但是日本為了能夠真實記錄自己的語言,最終衍生出了平假名迎变、片假名為漢字注音(這個音是日語里同義詞的音充尉,不是漢字本身的音)。后來這些就變成了日語的基本符號衣形。
從這里就可以看出驼侠,當次生文明在沒有發(fā)展出自己的象形文字體系就被原生文明文化入侵時。無論他們先接觸到的是什么樣的原生文明語言,最終都會走上使用拼音文字的道路倒源。這樣的拼音文字苛预,同時也很適合直接囫圇吞棗地引進外語的詞匯,方便向先進文明學(xué)習(xí)相速。這種特點一直流傳到今天碟渺。比如日文“計算機”就是Personal Computer的音譯(實際上是PersoCom的音譯)。而英文的各種疾病的名字基本都可以追溯到希臘語突诬,比如腎炎Nephritis苫拍,就是從希臘語的腎炎經(jīng)過拉丁文倒買倒賣而來的。
順便旺隙,看到有人質(zhì)疑希臘是次生文明的這個說法绒极,不得不解釋一句。希臘是埃及和兩河流域的次生文明蔬捷,正是因為它同時受到了兩大原生文明的哺育垄提,才在古代具有高度發(fā)達的文化。但這改變不了希臘是次生文明的現(xiàn)實周拐。這也就是為什么各國論述古文明的書籍中铡俐,希臘文明總比古埃及、兩河妥粟、中國等原生文明低一個等級审丘。曾經(jīng)看到有人用希臘來否定中國在古文明中的地位,這是很可笑的勾给。
那么為什么這世界上的表意文字這么少呢滩报?很顯然,這世界上的原生文明本來就那么幾個播急,而次生文明卻要多幾個數(shù)量級脓钾。歷史大潮中三十年河?xùn)|三十年河西,原生文明也有可能被次生文明所征服桩警。在征服之后可训,語言也就有可能會逐漸消亡了。
所以捶枢,拼音文字廣泛使用握截,這并不說明拼音文字就優(yōu)秀。只能說這世界上的原生文明實在太少柱蟀。
后記
還是那句話,這文章里的數(shù)據(jù)不要太認真蚜厉,因為采樣的樣本都很小长已。但是我希望大家明白漢語從來就不是一種落后的語言。