? ? ? ? 抱著學習英語的目的,我最近在看一本英文小說《Fall of Giant》凄吏,中文譯為《巨人的隕落》远舅。 這個最近是多近呢?有點兒長痕钢,是半年图柏。而很多網(wǎng)站上說,全球讀者是平均用3個通宵讀完這本書任连,而我為什么會用了這么長時間呢蚤吹?這里交代下我的閱讀過程。因為比較深信一回随抠、二回生裁着,三回四回會有點熟的道理,在看書碰到不認識的單詞或是漢字時拱她,我習慣要從字典查到它的發(fā)音和解釋二驰,以期知識能有些積累。因為是想著擴展自己的詞匯量秉沼,我會有意識地在字典里顯示出這個單詞的釋義后桶雀,閉眼幾秒在大腦里重現(xiàn)下這個單詞(在電紙書選住一個單詞矿酵,就會彈出它的中英文解釋,查字典花費的時間并不多)矗积。說明這些全肮,是想說明我看這本小說的很大一部分目的是學習單詞,我確實也在有意識地學習棘捣。我一般是在上下班的路上辜腺,每天看1小時左右, 這樣的話乍恐,總共的耗時是:(30 - 8(周末不看))X 6 / 24 = 5.5個通宵達旦评疗。 你可以隨意鄙視我的學習方法噢。隨著閱讀逐漸向尾聲推進禁熏,我愈發(fā)覺得郁悶壤巷,因為在看到99%的時候,我還有單詞不認識瞧毙,還需要查單詞!下面列出最后一章(Chapter 42 December 1923 to January 1924)我仍需要查詞典的單詞:bounty, snub, plowed on, punch-up, jibe, sermon,subdue, peroration寄症。英語四六八級過了和沒過的宙彪,都可以評判下我的英語詞匯應該不算是菜到渣的那種。我也列出一些我通過這種方法掌握了的單詞:boo,bowler,cobblestone,ideology, constituency,pithead,M.P., luxurious, defiantly有巧,以說明我的學習方法释漆,對我確有些效果。
? ? ? ? 因為這種郁悶篮迎,我萌生了一個疑問男图,為什么在短短的一章中,我至少需要在8個地方停下來甜橱?我看中文小說可是一氣呵成逊笆,很少需要查字典的。也許你會說岂傲,這不是廢話么难裆, 你學習和使用中文多少年了?為了讓答案不那么淺顯和嘗試一個可能更加量化的結論镊掖,我做了一些對這篇小說的分析工作乃戈。我也一并把我的數(shù)據(jù)和分析代碼貼出來(以免感覺不適,代碼貼圖放在文末)亩进,以資備案和評審糾錯症虑。
數(shù)據(jù)材料:
統(tǒng)計分析的結果如下:
說明,在這個統(tǒng)計分析中归薛,我作了下面的簡化處理
1. 英語的構詞單位是字母:26個谍憔,中文的構字單位是筆畫:31個匪蝙,二者在記憶、識別的難度是一樣的韵卤。
2. 在發(fā)音上骗污,英語有元音,輔音沈条,中文有聲母需忿,韻母,二者量級相同蜡歹。
3. 因為在英語語法中有名詞的單復數(shù)屋厘,動詞的幾種時態(tài),詞性變化(比如:形容詞+ly --->副詞)等構詞法月而,18254是沒有考慮這些因素的詞匯量汗洒,這個數(shù)值還是有些大的, 其實我嘗試還找了一些其他理由以反駁英語的詞匯量實際沒那么大父款,比如溢谤,把人名,地名等不算作詞匯憨攒,但這理由又有些牽強世杀,完整敘事是不能沒有人物和地點等專有名詞的,而正是因為人名肝集,地名等詞匯的出現(xiàn)瞻坝,使得英語的可記憶性降低了。為了結果更公允杏瞻,我們假設有10000個單詞是派生出來的所刀。這樣英語的基礎詞匯是8000多,仍然大于中文的3590
前面的統(tǒng)計分析說明:在記憶容量的要求上來說:英語要遠高于中文捞挥,在精力消耗上來說浮创,英語也要高于中文。
下面的圖表明:有3000多些的漢字量树肃,基本就可以表示完成信息的傳達任務蒸矛,而英語要達到這一目標,則需要的詞匯量要大胸嘴,并且詞匯量的要求雏掠,隨著場景變化而增大。
把上面的圖換個角度劣像,可以看出:中文乡话,掌握單字量達到3500, 能夠表示的信息量將不受限制;
英語:單詞量掌握到7000耳奕,能表達的內(nèi)容還很有限绑青。
? ? ? 得出上面的結論:我是有些忐忑的诬像,但愿我不是站在中文作為母語的角度上為自己的文字的優(yōu)越性尋找冠冕堂皇的理由?如果闸婴,我的結論是正確的坏挠,文字也是一種技術,按照現(xiàn)在(比如KK)比較認同觀點邪乍,人在使用技術降狠,其實技術也在馴化人類。 兩種文字是不是已經(jīng)對它們的使用者完成了馴化庇楞?或者人類因為使用文字不同榜配,又將會向何方發(fā)展?
? ? ? 考察文字的起源吕晌,歷史蛋褥,可能會是一個好的開始。我還沒有研讀過相關的資料睛驳,設想文字的起源是沒有直接證據(jù)的烙心,現(xiàn)有的研究成果都是專家們在考古發(fā)現(xiàn)的基礎上推測出來的,我也不防大膽推測一把乏沸。數(shù)十億年前弃理,在地球上散落著多處遠古智人的聚集區(qū),智人已經(jīng)能直立行走屎蜓,經(jīng)過自然選擇,他們中有兩支的后代進化成了我們要考察的種族钥勋,中國的我稱為亞族炬转,歐美的,我稱為歐族算灸,這兩個種族誰先誰后扼劈,哪個早幾百萬年都不重要,重要的的是這兩幫人彼此隔絕菲驴,生存環(huán)境也相似荐吵,一樣危機重重,都靠打獵為生赊瞬,都沒有文字先煎,各自的語言和文字將從這個時候開始萌芽、進化巧涧。人類生存薯蝎,水必不可少,兩個種族必然會接觸的幾種水的形態(tài):河谤绳,湖占锯,海袒哥,雨,對應的英語單詞為:river,lake,sea,rain消略。從字面上來看堡称,我們就知道中文的河和湖是有些關系的,而英語的四個單詞艺演,如果不知道各自的意思却紧,不能看出它們之間的任何聯(lián)系,這就是中文表意文字系統(tǒng)和英語表音文字系統(tǒng)的典型區(qū)別钞艇。接下來啄寡,讓我們嘗試想象一下數(shù)十億年的場景,由于經(jīng)常用水哩照,歐人和亞人都能用嘴里發(fā)出聲音來指示這種生存的必需品挺物,歐人叫喊著 “wang te er,wang te er”飘弧,而亞人則是咕噥著“shui识藤,shui”。這個時侯次伶,水用哪種聲音表示是沒什么區(qū)別的痴昧。由于周圍危機四伏,遠古時候冠王,人類的祖先都會茍且囿于面積很有限的一片區(qū)域赶撰,他們對江河湖海四種水域的接觸必然有一個時間上的先后次序。假設柱彻,兩族人只認識他們所住地的一些小水灘豪娜,從沒見過“河”這種流動的水的樣貌。有那么一天哟楷,歐人的祖先老歐由于某個原因跑到一個離聚住地較遠的地方瘤载,發(fā)現(xiàn)了一條“河”,他很興奮卖擅,急切地想把這個發(fā)現(xiàn)告訴族人鸣奔。老歐幸運、安全地回到住地惩阶,激動地拉過來一個小伙伴挎狸,嘴里嚷著“rui wo er! rui wo er!”,那小伙伴應該是一臉懵懂琳猫,不停地表示“啥伟叛?啥?”脐嫂,老歐也許是太激動统刮,也許是已經(jīng)形成的行事習慣紊遵,他嚷著把小伙伴拉到了河邊。那小伙伴看到了河侥蒙,也很高興暗膜,小哥倆高興地回到住地,又把更多的族人拉到河邊鞭衩,認識了“河”学搜,至此“rui wo er”,這個發(fā)音论衍,表示河瑞佩,在歐族達成共識。 指示“河”坯台, 把事物直接呈現(xiàn)在受眾面前,? 無數(shù)類似場景炬丸,不時重演,累萬年蜒蕾,歷億年稠炬, 使得英語這種表音語言內(nèi)容系統(tǒng)逐漸豐富了起來。指給你看咪啡,也成了歐族人主要的思維方式首启。我們再來看看老亞,他也在某一天在遠處發(fā)現(xiàn)了一條“河”撤摸, 他也很激動毅桃,找到一個小伙伴,最里喊著“he准夷!he!”,小伙伴也是一臉迷眉残幔“啥?啥冕象?”,老亞很焦急汁蝶,你咋不懂我呢!該怎么辦?也許是他太笨了孔厉,沒有一下子想到要把小伙伴拉到河邊蒂窒,他抓耳撓腮半天,猛然看到邊上有一小灘水幔亥,忽來靈感耻讽,他找到一截樹枝,圍著水灘劃了彎彎曲曲的兩道土痕帕棉,小伙伴似懂非懂针肥,最終他們還是也來到了河邊饼记,小伙伴看到河,想象地上彎彎曲曲的兩條慰枕,覺得有道理具则,又照貓畫虎地向其他族人講解“河”,最后具帮,族人們也都來到了河邊博肋,也見識了“河”,在這個過程中蜂厅,族人們也有人隱隱感覺兩條彎彎曲曲匪凡,中間有水,跟“河”有點兒像掘猿。經(jīng)過河的事件病游,表意的文字系統(tǒng)有了萌芽。也許术奖,這種像的感覺礁遵,每次都很微,很弱采记,轉(zhuǎn)身就消失得無影無終佣耐。但是,經(jīng)過數(shù)百年唧龄,數(shù)萬年兼砖,數(shù)億年的類似場景的重現(xiàn),積累既棺,表意文字系統(tǒng)逐漸形成了讽挟。我猜想,在某些時候丸冕,亞族人是體會到表意這種表達方式好處了的耽梅,比如,族人正面臨食物短缺胖烛,有個人發(fā)現(xiàn)了一個湖眼姐,湖里有魚,而湖和魚佩番,族人以前是沒有概念的众旗,如果這個發(fā)現(xiàn)能在第一時間傳達出來,族人能節(jié)省無謂的往返勞頓趟畏,有時候贡歧,這種及時性甚至是種族延續(xù)的重要條件,比如描述從沒見過的正在向聚結地走來的重沒見過的野獸。體會到好處利朵,表達方式字面上的意義化律想,慢慢演變成一些族人有意識的行為。我猜想哗咆,表意蜘欲,慢慢也成為了一種亞族人的主要思維方式,在一個群體中晌柬,如果大多數(shù)人具有相似的思維方式姥份,他們會形成相似的交流方式,相似的習慣年碘,進而澈歉,一種習俗,一種文化慢慢的孕育屿衅,形成了埃难。
最后,附上相關程序:
CountWords.py
最后結果是涤久,單詞總數(shù)為369409萬涡尘,單詞量:18254
CountEnglishCharacters.py------統(tǒng)計人物用到的單詞量
運行結果為,人名的詞匯量為155:
CountCapitalWords.py-------統(tǒng)計英文版本中用于人名响迂,地名等專有名詞的單詞
統(tǒng)計結果考抄,3315個專有名詞詞匯:
CountChWords.py統(tǒng)計中文版的文字量:
結果為總字數(shù):595778, 單字數(shù):3598:
詞匯量是2500時蔗彤,表達的信息量:65163字數(shù)
詞匯量是3000時川梅,表達的信息量:181219字數(shù)
Overall_charts.py: 生成中英文對比圖
輸出: