公眾號:你想看的World(Youw2s)
Derek最近搗鼓了一個學習英語的社群溯壶,糾集了一群有共同愛好的朋友一起利用閑暇的時間學習英語。通過這個學習群,Derek認識了很多很有毅力的英語學習者戚哎,于是,Derek的微信朋友圈里面多了一條另類的風景線嫂用,“背單詞打卡”型凳;現在幾乎所有背單詞的APP,都有分享朋友圈發(fā)送打卡信息給朋友的功能嘱函,于是甘畅,我開始每天看著很多人“我已經在XXAPP上背單詞xx天了,今天已經征服了xx個單詞”。一般看到這種情況疏唾,我非常喜歡給大家點個贊蓄氧,因為我知道,“背單詞”荸实,絕對是一個非吃让牵苦的差事,不管你使用什么APP准给,這種充滿了負反饋泄朴,不斷挑戰(zhàn)你耐心的學習活動,實在是值得上一個大大贊露氮。
或許是好為人師的緣故祖灰,身邊不斷有朋友向Derek請教背單詞的方法和技巧,企圖找到一個不那么痛苦的方式畔规。因為問的人太多局扶,我突然覺得應該寫個文章出來共同討論下這個問題。
我首先明確一下我自己的認知叁扫,背單詞雖然不是學習英語的全部三妈,但的的確確是英語水平提高必不可少的一個重要環(huán)節(jié)。所以莫绣,企圖從本文里找到一個捷徑的同學可能要失望了畴蒲,我確實拿不出一個“躺在床上就學好英語”的好辦法來。因此对室,我并不打算在本文討論是否需要背單詞的問題模燥,也不討論方法問題,我打算聊聊掩宜,如果要背單詞蔫骂,你應該選什么詞表。
實際上牺汤,本文是寫給那些準備真正提升英語能力辽旋,希望通過英語能更好的了解這個世界的朋友¢艹伲考試黨的選擇其實非常小戴已,幾乎所有的為考試準備的學習方法里面,都有一個對應的詞表锅减,需要考試的朋友可以略過了,因為你只需要關注大綱要求的詞表即可伐坏。
為什么我們需要一個詞表
現在怔匣,是一個移動智能終端極度發(fā)達的時代,幾乎所有成人朋友在打算重拾英語的時候,都會選擇使用手機APP來背單詞每瞒,而所有的APP背單詞軟件都有幾大必須存在的功能:
- 適合各個水平階段的詞表
- 有對應音標
- 帶發(fā)音金闽,例句
- 科學的記憶曲線,方便復習
這幾個功能剿骨,幾乎所有的背單詞APP都有代芜,結合我們今天的主題,我們聊聊詞表浓利。
在選擇開始背單詞前挤庇,這幾乎是你的第一個需要作出決定的事情,你選擇什么樣的詞表來背贷掖?準備考試的朋友還好辦嫡秕,考啥背啥,根據大綱來苹威,如果準備中考昆咽,就背中考詞表,如果準備高考牙甫,就找找高考詞表掷酗。
對成人學習者來說,這個選擇就比較尷尬了窟哺,很多的成人英語學習者對自己的英文水平其實并不了解泻轰,他們掌握英語的目的是使用它,而不是應付考試脏答。這個時候糕殉,大部分人的選擇就比較盲目。上過大學的朋友殖告,丟掉英語多年阿蝶,比較可能選的詞表是四級詞匯或者六級詞匯,沒有上過的呢黄绩,很多都是從什么小學詞匯羡洁,中學詞匯,新概念第一爽丹、第二冊開始筑煮,還有些朋友,估計是聽過一些英語學習的講座粤蝎,選擇了一些比較另類的詞表真仲,比如說,老友記詞表初澎,絕望主婦詞表來背秸应。
朋友們,既然是學習英語的目的是真正的使用,那么大家有沒有想過:
我們學了十幾年英語软啼,每個人心中都必然有個疑問:
想要流暢輕松的讀懂大部分的網頁桑谍,小說,報刊祸挪,新聞等原版材料锣披,大概需要多少詞匯量?
著名網站testyourvocab.com歷時幾年贿条,做了一個比較真實完整的調查雹仿。
調查結果如下:
- 絕大多數母語成年人士的詞匯量為20,000–35,000 words
- 8歲的母語人士平均詞匯量為10,000 words
- 4歲的母語人士平均詞匯量為5,000 words
- 母語人士的詞匯量大小主要是4到15歲之間的閱讀量決定
令人比較喪氣的結果如下: - 絕大多數外語人士的詞匯量僅為4,500 words
- 在英語國家居住的母語人士詞匯量平均僅為10,000 words
不少人看到這里肯定心存懷疑,考完專八背完托福詞匯卻無法流暢閱讀的也大有人在闪唆,與語言學家的研究“大相徑庭”盅粪。
究其原因,關鍵在于對“常用詞匯”的認知悄蕾。
語言學家發(fā)現的另一個有趣事實是:
英語使用頻率最高的9個單詞票顾,在任何一篇100詞以上的文章中出現的頻率達25%!
所以帆调,想要高效背單詞奠骄,必須了解每個單詞在母語使用者日常生活中出現的頻率高低。
詞匯量不在于你背了多少生僻單詞番刊,而在于你日常生活會用的有多少含鳞。Active vocabulary才是英語學習中最重要的部分。
問題浮出水面了芹务,到底有沒有一個詞表蝉绷,真正適合以實用為目的。寫到這里枣抱,聰明的大伙可能已經明白了熔吗,如果要說以實用為目的,顯而易見佳晶,就是根據英語詞匯使用的頻率統(tǒng)計出來的詞匯表了桅狠。那么,這樣的一個東西轿秧,存在嗎中跌?如果存在,它是否權威菇篡?
先給答案:存在d龇!驱还!絕對存在T山觥津滞!權威!W粕恕!絕對權威_湎省:摹!
COCA詞表的介紹
COCA疟丙,全稱Corpus of Contemporary American English颖侄,即當代美國英語語料庫,它是這個世紀里最大的美國語言學研究項目享郊,地位影響深遠览祖。
最重要的是,它研究的對象全部都是當代美國英語語料炊琉,基本不包括20世紀早期和19世紀的語料展蒂。
COCA項目至今還沒結束,目前收集了4億詞匯的文獻資料苔咪。這4億詞匯的基礎材料包括1990至2015年這幾十年里閱讀量最廣泛的小說和雜志(TIME, New Yorker等都是項目的參與者)锰悼,電影、電視節(jié)目团赏,大量的電話記錄和面對面談話記錄箕般,甚至還包括911報告等)。它根據使用時間舔清、文獻性質等使用統(tǒng)計學方法進行分類統(tǒng)計丝里,等于是在編一本帶詞頻和流行用法的新美國英語使用辭典。
在COCA當前成果基礎上体谒,美國楊百翰大學對這個資料庫用計算機方法篩選出了美語使用頻率最高的5000和20000個高頻詞匯杯聚。曾經有人用GMAT和GRE的資料驗證了一下這個詞匯表的覆蓋率,證明它的20000單詞覆蓋率真的很高营密,幾乎全部覆蓋械媒,只有一兩個很個別的詞沒查到。
這個詞匯表最好的地方在于是每個單詞不僅帶詞頻和同義詞评汰,而且還根據不同的詞性標注著collocation纷捞,也就是所謂的搭配用法。就是標出和這個詞使用最相關被去、密度最高的詞的集合主儡。
有了它,我們就知道美國人對這個詞的最常用的幾十種用法和使用環(huán)境惨缆。
比如說script排3315糜值,這個詞的搭配里丰捷,常見的形容詞搭配是final, original和feminine,常見的名詞搭配是movie, film, writer寂汇,常見的動詞搭配是write, read, follow. 所以我們知道這個詞的用法就有final script, write a script等等病往。這個比死記硬背好太多了。
這個語料庫涵蓋美國現當代時期的口語(spoken)骄瓣、小說(fiction)停巷、流行雜志(pop magazine)、報紙(newspaper)和學術期刊(academic)五大類型的語料庫榕栏,并且在這五個類型方面基本呈均勻平衡分布畔勤。
美國當代英語語料庫的文本內容包括:
- 口語(spoken):包括150個電視或廣播節(jié)目對話,約85000000字扒磁。
- 小說(fiction):包括短篇故事庆揪、戲劇/電影劇本妨托,約81000000字缸榛。
- 雜志(popular magazines):包括新聞、健康始鱼、家庭園藝仔掸、女性話題、財經医清、宗教起暮、運動等將近100種不同領域的雜志,約86000000字会烙。
- 報紙(newspapers):包括10家報紙不同版面(地方新聞负懦、評論、運動柏腻、財經)的文章纸厉,約81000000字。
- 學術期刊(academic journals):包括近100種不同種類的期刊五嫂,約81000000字颗品。
在這個龐大的語料庫中使用頻率最高的20000個單詞極具代表性,幾乎覆蓋所有權威英語考試的詞表沃缘。
COCA的詞表的樣子
COCA的最常用20000詞的詞表躯枢,是一個有2000多頁的文件,這份文件里面槐臀,沒有詞匯的解釋锄蹂,如下圖,主要包含幾個部分
- 詞頻
- 根據詞性的搭配水慨,如前面最經常搭配什么詞匯得糜,后面經常搭配什么詞匯敬扛;
-
近義詞;
- 189代表詞頻朝抖,也就是company做n(名詞)時啥箭,它出現的頻率在英語中是189位。
- 后面adj代表有哪些形容詞經常和company這個名詞搭配槽棍。小黑點代表詞的位置捉蚤,比如 drug company, phone company,不要理解成company drug, company phone炼七。至于為什么有的詞有小黑點有的沒有,我也沒搞明白布持。
- 后面的大黑點代表同義詞豌拙。company做公司解釋時,意思是business等题暖,做朋友解釋時按傅,意思是companionship等,等等胧卤。
- 后面的203345代表在4.5億中出現的次數唯绍。0.93代表分布均勻度。越接近1代表在各種文體中分布越均勻枝誊。詞頻排名=次數 * 均勻度况芒。
- 有些詞的均勻度后還有個類似S,M等后綴,代表這個詞主要出現在如下文體中:Spoken, Fiction, Magazines, Newspapers, Academic
如何使用COCA詞表
寫了這么多叶撒,終于找到一個真正按照語言實際使用情況的詞表了绝骚,這就意味著,這個兩萬的詞表拿下祠够,就掌握了英語世界的最高頻使用的詞匯压汪,這可比任何為考試準備的詞表更適合成年的英語學習者了。那么古瓤,這個詞表怎么使用呢止剖?怎么才能開始使用這個詞表呢?
扇貝單詞APP
扇貝上面有很多熱心人制作的各種詞表落君,有些免費穿香,部分收費,在扇貝上面就有這個COCA的20000詞表叽奥,大家搜索一下應該可以看到扔水,如下圖,如果手里還有貝殼的話朝氓,大家可以購買魔市。
自行導入
目前主届,有很多背單詞的APP,支持詞表的自行導入待德,你可以用一個包含了詞表的純文本文件君丁,直接導入到軟件里面背誦,據Derke所知将宪,“知米背單詞”這個APP就可以自行導入詞表。只要你的詞表是UTF-8格式的純文本较坛,都可以導入到“知米背單詞”。
如何獲得COCA詞表华嘹,下載資源
COCA詞表如果直接拿來背單詞,就是上面大家看到的那樣法竞,確實難以直接使用耙厚,為了方便大家岔霸,造福群眾,Derek秉承著不給解決方法只提出問題的任何干貨都是耍流氓的思路呆细,啟動了我的看家本領型宝,編程序,我從PDF文件中提取了20000所有詞表侦鹏,并對文件根據詞性進行了分類诡曙,還體貼的分成了10000略水,20000,兩個文件渊涝,并提供20000分詞性的版本,即按動詞胸私,形容詞,副詞等幾個大類進行了分解岁疼。做到這一步,如果你還不點贊我就真生氣了捷绒,現在提供如下幾個文件下載:
- 20000詞表純TXT版本
- 0-10000 詞表純TXT版本
- 10000-20000詞表TXT版本
- 20000詞表分詞性版
- COCA原版詞表2200頁PDF
注意:詞表不包含單詞解釋,大部分的軟件在導入詞表時暖侨,會自動添加解釋。
如何獲得:大家需要學習可以向我借閱,這是地址( https://pan.baidu.com/s/1bBcQr8 密碼: ti43)
公眾號:你想看的World(Youw2s)