一陵刹、基本聽懂需要認(rèn)識多少比率詞匯欢嘿?
根據(jù)語言學(xué)家各種測試,要基本聽懂/讀懂一般非專業(yè)英語內(nèi)容炼蹦,生詞量必須小于2%——也就是說100個單詞里掐隐,你只有2個以下的單詞不認(rèn)識[1]。 這2%僅僅是最低要求匿刮,而且是對于老美老英母語者來說;而對于一般非母語者日本緬甸人等的測試結(jié)果僻焚,即使98%的單詞你都認(rèn)識膝擂,也常常還不能聽懂/讀懂[2]。
二狞山、中國學(xué)生詞匯量夠嗎叉寂?
既然對于非母語者認(rèn)識98%的詞匯都不夠,咱就把99%定為一個比較理想的目標(biāo)屏鳍。那需要掌握多少詞匯量才夠呢?
不同的美劇用詞難度廣度其實都不一樣:比方《Friends》用詞就比較簡單:九季一共大概93萬個單詞驳遵,一共有13250個詞位(lexeme - 就是把runs, running都算成是一個詞run);而《the Big Bang Theory》就難上一個級別:前五季(第六季因為還在播堤结,哥還沒加入統(tǒng)計)一共大概22萬個單詞,詞位有約11892個唐责。
如何計算多少詞涵蓋99%的內(nèi)容呢瘾带?比方你認(rèn)識"I"這個單詞,它在《Friends》中用了35000次肴盏,也就是說相對93萬詞帽衙,你只要懂一個I就懂了約3.7%的內(nèi)容厉萝;以此類推榨崩,要聽懂99%的內(nèi)容,6079個詞位就可以涵蓋母蛛;而對于《the Big Bang Theory》彩郊,要涵蓋99%內(nèi)容需要9007個劇本詞匯。
一般中國學(xué)生的詞匯量大概有多少呢恕出?我把中國學(xué)生從小到大有可能背到的人教版中學(xué)課本违帆、高考單詞、四六級大綱的畴、王玉梅俞敏洪托福尝胆、GRE紅寶書、再要你命3000班巩,統(tǒng)計了下:一共有13000多個詞位——很多人說背完GRE單詞就有20000個單詞了嘶炭,其實沒有那么多逊桦,四六級强经、托福有很多重復(fù)單詞。
大家會說即使只有一萬三千個聽《Friends》也是小菜啊匿情,姐姐我GRE Verbal 165分,應(yīng)該閉著眼睛都能聽明白《Friends》炬称。且慢,前面的計算有一個關(guān)鍵問題:這6079個/9007個詞匯是美劇所用的詞匯据德,而你掌握的詞匯未必包含這些劇本中的詞匯跷车。對于聽眾詞匯能覆蓋多少美劇的內(nèi)容,除了詞匯量朽缴,還有一個很關(guān)鍵問題就是該聽眾的“詞頻結(jié)構(gòu)”。
三茅郎、中國學(xué)生的詞匯結(jié)構(gòu)合理嗎只洒?
單單說詞匯量沒有意義,比方你背了半本《牛津高階字典》號稱坐擁10萬詞匯量毕谴,但如果你專門挑別人根本不用的冷僻詞背涝开,你看書聽美劇依舊一頭霧水舀武。語言學(xué)有個理論是高頻詞一定會比低頻詞先掌握("High-frequency and wide-range words are generally learned before lower-frequency and narrower-range words.")其實這個假設(shè)不適用于大部分中國學(xué)生离斩,大部分中國學(xué)生掌握詞匯都不是通過和英語的自然接觸掌握的瘪匿,而是背誦詞匯書來的棋弥,里面很多詞不常用。而實際應(yīng)用中的大量高頻詞顽染,并不在中國學(xué)生常用詞匯書里面轰绵。不少中國學(xué)生通過紅寶書把minaret等生僻詞背得爛熟,卻連rinse這樣日常用詞都不知道唧垦。
按照按聽眾的詞匯而不是按照劇本詞匯來計算能聽懂多少才有意義:先把劇中聽眾懂的詞挑出來业崖,然后累加它們出現(xiàn)的頻率蓄愁,看看占全劇詞匯量多少比率狞悲,也就是能聽懂多少——這個才是規(guī)范研究的方法:
對于《Friends》來說,背完中學(xué)到GRE的13000個單詞丹拯,可以大概認(rèn)識里面大概97-98%的單詞荸恕。(計算機(jī)顯示可以涵蓋93%的《Friends》的內(nèi)容,我因為沒有剔除《Friends》3萬~4萬的人名融求,所以這個比率應(yīng)該會更高到97-98% )—— 中國學(xué)生就是GRE Verbal 滿分咬像,也未必能輕松搞定《Friends》啊:
1. 有2%-3%的詞你完全不認(rèn)識生宛。作為一個中國觀眾县昂,很多中學(xué)到GRE的單詞相對于《Friends》來說,算是“白背了”陷舅,比方“accumulate倒彰、accustom、acid莱睁、adapt待讳、adhere芒澜、adverse”等等一堆書面用詞,创淡;而《Friends》當(dāng)中常用的比方"freak痴晦、ass、dude阅酪、sweetie术辐、massage、stripper瑞躺、nap幢哨、aisle...”在中學(xué)到GRE詞匯中并沒有出現(xiàn)捞镰。
2. 有些詞盡管你認(rèn)識,但搖身一變和別的詞組合一下你就不認(rèn)得了:你可能知道freak是古怪的人凸丸,Chandler 有次說RossThe guy's a freak就是這個意思屎慢,但是freak out的意思就完全不同了,意思是突然變得很情緒化妖枚,美劇中常耻蹋可以聽到I'm not freaking out(我沒有生氣)莱没;有些詞意思很多饰躲,你可能只知道一個:比方freak除了變態(tài)之外,還有對某事特別著迷的意思寄狼,某次Phoebe嘲笑Monica是"an unbeliable control freak"就說她愛控制別人,不是說她是變態(tài)删咱,我有時候會告訴別人I'm kind of a neat freak腋腮,意思是我有點(diǎn)小潔癖徊哑。
上面1.體現(xiàn)的是詞匯頻率結(jié)構(gòu)低效;2. 體現(xiàn)的是詞語能力不足——這些都是單單通過背單詞書掌握詞匯禍害的啊~
中國學(xué)生的英語單詞結(jié)構(gòu)(這里假設(shè)僅僅通過背單詞書獲得),哥親自驗證過它的低效——即使是對于書面英語來說也是不理性萧豆。哥選擇同等詞匯量的別的詞匯表涮雷,比方BNC[3]詞頻top 13k样刷、古登堡高詞頻[4]置鼻、谷歌高詞頻等和中國的高中到GRE詞匯表相比較箕母,用幾本暢銷書比方《哈利波特》嘶是、《喬布斯自傳》等和經(jīng)典教科書比方羅素的《西方哲學(xué)史》作為樣本,發(fā)現(xiàn)幾乎每一本書授帕,中國學(xué)生詞匯表的涵蓋量都是最低的跛十。(只有一本心理學(xué)暢銷書打敗了古登堡高頻詞表——可能古登堡文本都很古舊的原因)。
順便說下奈偏,我2013下半年的計劃之一就是在水木EnglishWorld版貼出中國學(xué)生中學(xué)到GRE詞匯中缺少的常用高頻詞(用計算機(jī)先優(yōu)選各種詞頻表惊来,再人工篩選)裁蚁。
四、母語者的詞匯狀況如何室谚?
無障礙看美劇最理想的是擁有母語者那樣的詞匯狀況(量和結(jié)構(gòu))眨补。可能有同學(xué)馬上不服氣說甘晤,鐵牛哥難道你沒聽說美國中西部農(nóng)民只有4000單詞卻足以應(yīng)付大多數(shù)復(fù)雜社會需求线婚,哥對于在n多場合聽到中國學(xué)生津津樂道這個不知道是哪個培訓(xùn)機(jī)構(gòu)流出來的段子實在是跪服。
其實英美母語者的詞匯量要遠(yuǎn)遠(yuǎn)大于中國同學(xué)的想像:芝加哥大學(xué)的兩位研究人員Mary Jean Schulman和Robert J. Havighurst對美國中西部社區(qū)各個社會階層的人做過詞匯量測試游沿,就是來自最低社會階層的E組詞匯量也達(dá)到了28,800,而中上層的詞匯量超過了4萬[5]眯勾。研究者用不同的方法測試,結(jié)果會有不同郁轻,比方ROBIN GOULDEN(1990)的測試母語者的詞匯量是2萬左右厂庇,但是主流的說法是在2萬至2.5萬之間 (Crystal 1997). ——這個結(jié)果可以秒殺用GRE冷僻詞放到母語者而自豪的中國烤雞族权旷。也就是說一個勤奮刻苦的中國學(xué)生把能背的主流詞匯書都背完躲查,在詞匯量上離母語者還是有很大距離鄙麦;更不用說詞匯結(jié)構(gòu)了。
無論理論上還是實踐中都可以確切地說英美母語者可以輕松無字幕搞定美劇炎咖。哥經(jīng)歷過很多次旁邊不同背景的老美老英給我講解看不懂的地方影所,《House》這樣的專業(yè)醫(yī)療劇每一集也能吸引近2千萬的觀眾。
五矛双、到底需要多少詞匯量呢十减?
語言學(xué)家用BNC這樣詞頻從高到低排序的合理詞匯表測試,讀懂小說最低入門門檻詞匯量是8~9千芍锚,而聽懂美劇是6~7千[6]。這個標(biāo)準(zhǔn)用的是相對于母語者的98%的涵蓋標(biāo)準(zhǔn)荤西,其實對于非母語者要求會高很多皂冰,尤其當(dāng)是詞匯結(jié)構(gòu)低效時。
有同學(xué)會說那我背別的詞匯書怎么樣?比方劉毅的那套從基礎(chǔ)詞匯到20000貌似很流行啊嚣伐,其實哥也做過測試,并不比別的主流詞匯書來的效率高基茵⊙邕郑可以告訴大家的是烙肺,**語言學(xué)家在掌握詞匯方法VLS(Vocabulary Learning Strategies)上常年關(guān)注和推薦的是通過自然語言情境掌握(natural context)氧卧。也就是說如果你擴(kuò)大詞匯的方式是多讀英美報刊桃笙、多看電影、多和老外聊天假抄、多寫英文信怎栽,不僅語言應(yīng)用能力會提升、能獲得語言之外的知識樂趣宿饱、擴(kuò)大詞匯量...更重要的是你的詞匯結(jié)構(gòu)會更高效熏瞄。也就是說通過這樣方式掌握詞匯谬以,高頻詞會比低頻詞更早掌握。尤其對于中高級學(xué)習(xí)者泉沾,大量用英語妇押,是突破英語各個方面能力的最佳途徑俊马。 **
英鐵牛
注釋:
[1]"It was calculated that 98% text coverage (1 unknown word in 50) would be needed for most learners to gain adequate comprehension."
[2] "As Carver indicates, even 98% coverage does not make comprehension easy. Kurnia (2003), working with a non-fiction text, found that few L2 learners gained adequate comprehension with 98% coverage."
[3] BNC是全球最大的語料庫之一,收集了發(fā)生在英語世界的母語者使用英語的記錄,包括書面和口語的真實記錄。
[4] Project Gutenberg是一個收集了大量版權(quán)在公共領(lǐng)域的在線書庫疾牲。
[5] Relations between Ability and Social Status in a Midwestern Community. IV: Size Of Vocabulary
[6] "A vocabulary of 8,000 to 9,000 words is needed to read a novel, and even then, 1 word in
50 will be unfamiliar. ... 6,000–7,000 families for dealing with spoken text." I.S.P. Nation(2006)
母語人士詞匯量的圖表(來源testyourvocab)
1W詞匯量不過是國外8-9歲小孩的平均水平很泊,你們顫抖了嗎?