文/ 文心說(shuō)
不知道你有沒(méi)有過(guò)這樣的經(jīng)歷:好不容易背下一堆單詞,寫(xiě)作時(shí)迫不及待地用出來(lái)垛膝,而發(fā)下來(lái)的批改卻被打上了幾個(gè)大大的紅叉鳍侣。
你問(wèn)老師丁稀,憑什么說(shuō)我錯(cuò)?
老師頭也不抬地說(shuō)倚聚,這個(gè)詞根本不是這么用的线衫。
那一瞬間,你突然很難過(guò)秉沼,辛辛苦苦背了這么多單詞桶雀,可自己根本就不會(huì)用矿酵。
然而唬复,有這樣一個(gè)工具、一種方法全肮,能讓你迅速學(xué)會(huì)一個(gè)單詞最為地道的表達(dá)方式敞咧。事不宜遲,讓我們趕緊來(lái)看看這個(gè)神奇的工具——語(yǔ)料庫(kù)吧辜腺。
什么是語(yǔ)料庫(kù)休建?
也許你是第一次聽(tīng)說(shuō)這個(gè)詞,也許你曾在不少地方邂逅這個(gè)詞评疗,卻從未了解過(guò)它测砂。不管怎樣,今天百匆,你都可以和它來(lái)一個(gè)親密接觸了砌些。
讓我們先來(lái)看一下維基百科上的解釋?zhuān)?/p>
語(yǔ)料庫(kù)一詞在語(yǔ)言學(xué)上意指大量的文本(text),通常經(jīng)過(guò)整理加匈,具有既定格式與標(biāo)記存璃;事實(shí)上,語(yǔ)料庫(kù)英文 “text corpus” 的含義即為 “body of text”雕拼。
簡(jiǎn)單來(lái)說(shuō)纵东,語(yǔ)料庫(kù)就是一個(gè)存儲(chǔ)語(yǔ)言數(shù)據(jù)的地方。
語(yǔ)料庫(kù)分為動(dòng)態(tài)和靜態(tài)兩種啥寇,動(dòng)態(tài)語(yǔ)料庫(kù)指里面的資料會(huì)不斷更新偎球,而靜態(tài)語(yǔ)料庫(kù)則不會(huì)。語(yǔ)料庫(kù)里收集的不僅僅是書(shū)面用語(yǔ)辑甜,還包含口語(yǔ)化語(yǔ)言甜橱,如演講、采訪等栈戳。
目前比較完善的語(yǔ)料庫(kù)多為英語(yǔ)單語(yǔ)語(yǔ)料庫(kù)岂傲,意思是只搜集了英文文本的語(yǔ)料庫(kù)。今天我們的重點(diǎn)也在英語(yǔ)語(yǔ)料庫(kù)上子檀。
語(yǔ)料庫(kù)可以很大镊掖,也可以很小乃戈。小的語(yǔ)料庫(kù)通常為了一些專(zhuān)業(yè)化的研究,而大的則有許多用途亩进。目前可用英語(yǔ)語(yǔ)料庫(kù)中症虑,最龐大的所搜集的文本單詞量大于5億」檠Γ可見(jiàn)里面有多少值得研究谍憔、學(xué)習(xí)的材料。
語(yǔ)料庫(kù)有什么用主籍?
語(yǔ)料庫(kù)的最初建立习贫,是為了研究語(yǔ)言,因此它被廣泛應(yīng)用于語(yǔ)言學(xué)各領(lǐng)域千元。然而苫昌,漸漸地,人們發(fā)現(xiàn)幸海,它對(duì)于語(yǔ)言學(xué)習(xí)同樣非常有幫助祟身。因此,越來(lái)越多的語(yǔ)言教學(xué)者開(kāi)始將語(yǔ)料庫(kù)應(yīng)用于教學(xué)物独。
我們不是教學(xué)者袜硫,但仍可以學(xué)習(xí)使用語(yǔ)料庫(kù)——它將大大提升我們的學(xué)習(xí)效率。
以個(gè)人經(jīng)驗(yàn)而言挡篓,語(yǔ)料庫(kù)對(duì)于英語(yǔ)學(xué)習(xí)最有用的幾方面在于:
1. 學(xué)習(xí)單詞用法
2. 辨析近義詞
3. 學(xué)習(xí)介詞用法
4. 背單詞
接下來(lái)婉陷,我會(huì)一一講解運(yùn)用語(yǔ)料庫(kù)進(jìn)行以上四種學(xué)習(xí)的方法。
不過(guò)瞻凤,在此之前憨攒,我們需要了解一下,哪些語(yǔ)料庫(kù)可以用阀参?
如何找到合適的語(yǔ)料庫(kù)肝集?
目前,可供大家免費(fèi)使用的大型語(yǔ)料庫(kù)并不多蛛壳,如果需要購(gòu)買(mǎi)語(yǔ)料庫(kù)的使用權(quán)限可不便宜杏瞻。在這里,推薦兩個(gè)可免費(fèi)使用一定次數(shù)的大型語(yǔ)料庫(kù):
The Corpus of Contemporary American English (COCA)
The British National Corpora (BNC)
以上兩種是不限領(lǐng)域的大型語(yǔ)料庫(kù)衙荐,也是我做研究時(shí)最常使用的兩種捞挥。需要注意的是,注冊(cè)后忧吟,根據(jù)賬號(hào)使用者的資歷砌函,每天每個(gè)賬號(hào)可搜索次數(shù)有限,如果真的有必要可申請(qǐng)多個(gè)賬號(hào)。
另外讹俊,為了不浪費(fèi)搜索次數(shù)垦沉,每次搜索完可將結(jié)果先保存下來(lái)。
除了現(xiàn)成的語(yǔ)料庫(kù)以外仍劈,我們還可以使用語(yǔ)料庫(kù)代替品厕倍,或者自建語(yǔ)料庫(kù)。這些在以后的文章中再作為重點(diǎn)講解贩疙。
運(yùn)用語(yǔ)料庫(kù)進(jìn)行學(xué)習(xí)
接下來(lái)讹弯,我們將學(xué)習(xí)語(yǔ)料庫(kù)最簡(jiǎn)單的幾種操作方式,幫助我們高效學(xué)英語(yǔ)这溅。舉例中使用的是COCA组民。
1. 學(xué)習(xí)單詞的地道用法
比方說(shuō),我們背了一個(gè)新單詞 military芍躏,我們想知道這個(gè)單詞在地道表達(dá)中該如何使用邪乍。這時(shí)降狠,我們只需要輸入單詞对竣,點(diǎn)擊搜索,查詢(xún)結(jié)果即可榜配。
在Frequency一欄否纬,我們可以看到這個(gè)詞的使用頻率,這個(gè)功能在這里不算重要蛋褥。我們重點(diǎn)看的是Context一欄临燃。這里展示出來(lái)的是句子的一部分,我們可以點(diǎn)擊每一行 “context” 的位置烙心,查看完整段落:
同時(shí)膜廊,你還能看到這段文本的來(lái)源。
如果你覺(jué)得這樣看有些不方便淫茵,那有一個(gè)更加直觀的方式爪瓜。
來(lái)到搜索頁(yè)面,點(diǎn)擊左側(cè)搜索欄上方的 KWIC (Keyword in Context)匙瘪,這時(shí)你將得到一個(gè)五顏六色的表格:
這個(gè)表格可就大有用處了铆铆。除了像上文一樣,你可以查看完整文本丹喻,網(wǎng)站還自動(dòng)將不同詞性的單詞標(biāo)注上了不同顏色薄货。于是我們可以看到,用在military這個(gè)單詞后面的碍论,一般是名詞(藍(lán)色方框)谅猾。
這個(gè)功能對(duì)于military這個(gè)單詞來(lái)說(shuō)可能不那么重要,但對(duì)于一些更高級(jí)、更具迷惑性的單詞來(lái)說(shuō)税娜,就十分實(shí)用了先煎。
如果你還想了解得更多,例如這個(gè)單詞通常用在口語(yǔ)中還是書(shū)面語(yǔ)中巧涧,你可以返回搜索界面薯蝎,點(diǎn)擊 “Chart” 搜索。
這時(shí)谤绳,你就能看到這個(gè)單詞在各種體裁占锯,甚至各個(gè)年代的使用頻率。
我們來(lái)看兩個(gè)對(duì)比非常鮮明的詞:talk缩筛,communication
著重看spoken和academic兩欄消略,我們就能輕易判斷出,哪個(gè)詞是口語(yǔ)化表達(dá)瞎抛,哪個(gè)詞是書(shū)面用語(yǔ)艺演。這樣,寫(xiě)作文的時(shí)候我們就能盡量避免使用口語(yǔ)化詞匯桐臊,而日常交流時(shí)胎撤,也就別勉強(qiáng)使用那些文縐縐的單詞了。
有空就拿著生詞表來(lái)這兒查一查断凶,地道的單詞用法就在不經(jīng)意間被你一一收入懷中了伤提,說(shuō)不定還能順帶提高你的寫(xiě)作能力。
2. 辨析近義詞
近義詞的辨析不僅是英語(yǔ)學(xué)習(xí)中的難點(diǎn)认烁,也常常作為各大考試的考點(diǎn)肿男。很多時(shí)候,我們查詞典查了很久却嗡,還是沒(méi)能弄清楚兩個(gè)單詞具體的差別舶沛。這時(shí),語(yǔ)料庫(kù)便可以派上用場(chǎng)了窗价。
舉兩個(gè)最簡(jiǎn)單的例子:tall vs. high
這兩個(gè)單詞翻譯為中文都可譯作“高”如庭,然而此高非彼高,英語(yǔ)中幾乎沒(méi)有真正意義上的同義詞舌镶。
相信不少人知道這兩個(gè)單詞的區(qū)別柱彻,不過(guò),如果需要讓你將它們的區(qū)別總結(jié)一下餐胀,教給學(xué)生哟楷,你有信心嗎?不妨還是先用語(yǔ)料庫(kù)來(lái)學(xué)習(xí)一下吧否灾。
我們使用的是上文提到的KWIC搜索方式卖擅,對(duì)兩個(gè)單詞分別進(jìn)行搜索:
這兩個(gè)詞都是形容詞,用來(lái)修飾名詞,因此我們著重看單詞右側(cè)藍(lán)色加框的詞匯(這些是名詞)惩阶。雖然截屏中只能看到很小一部分結(jié)果挎狸,但我們已經(jīng)能夠得出初步結(jié)論:
Tall后面加的詞語(yǔ)有building, tower, editor, fence, door等等,都是具體名詞断楷;而High后面常跟attendance, blood pressure, capacity, contrast, cost等抽象名詞锨匆。
有學(xué)者曾對(duì)這兩個(gè)詞做過(guò)更加專(zhuān)業(yè)的語(yǔ)料庫(kù)數(shù)據(jù)分析,結(jié)果顯示冬筒,在BNC語(yǔ)料庫(kù)中恐锣,tall與high的使用比率約為1:9,也就是說(shuō)high這個(gè)詞更常用舞痰。而在high的100個(gè)隨機(jī)例子中土榴,31個(gè)與“測(cè)量事物”有關(guān),例如海拔等响牛,而58個(gè)與抽象名詞相關(guān)玷禽,如質(zhì)量、頻率等呀打。
當(dāng)然矢赁,我們不需要做如此專(zhuān)業(yè)的分析,但語(yǔ)料庫(kù)的確能夠在我們對(duì)兩個(gè)近義詞的使用很不確定的情況下聚磺,作為字典的補(bǔ)充材料坯台,為我們提供更真實(shí)的數(shù)據(jù)炬丸。
3. 學(xué)習(xí)介詞用法
介詞是很多人英語(yǔ)學(xué)習(xí)道路上的攔路虎瘫寝。記得中學(xué)時(shí),一看到題目和介詞有關(guān)稠炬,便會(huì)馬上提高警惕焕阿。那么,我們?cè)撊绾谓柚Z(yǔ)料庫(kù)首启,解決介詞搭配的問(wèn)題呢暮屡?
首先我們要了解一個(gè)概念:collocation,詞的搭配毅桃。意思是一個(gè)單詞通常與哪些詞語(yǔ)搭配在一起使用褒纲。
接下來(lái),我們就可以使用搜索欄中還未使用過(guò)的“collocates”一欄了钥飞。
舉個(gè)例子莺掠,我們想學(xué)習(xí)put這個(gè)詞的介詞搭配。
首先读宙,我們要選擇Collocates這一欄(右側(cè)可以看到對(duì)collocates的解釋?zhuān)┏垢眩唤酉聛?lái),我們輸入單詞put;下一步很重要唇兑,我們需要在下一格中選擇prep.ALL這一欄酒朵,這是網(wǎng)站自定義的詞性,選擇以后扎附,我們搜索出來(lái)的就只有介詞(preposition)的結(jié)果了蔫耽。
在搜索之前,我們還看到了一排數(shù)字留夜,這一排數(shù)字的意思是针肥,你的搜索范圍控制在這個(gè)單詞左邊、或右邊的幾個(gè)詞以?xún)?nèi)香伴。例如我選擇了左邊0慰枕,右邊1,這樣即纲,網(wǎng)頁(yè)只會(huì)幫我統(tǒng)計(jì)出 "put+介詞" 的搜索結(jié)果具帮,不會(huì)顯示 "介詞+put" 或者 "put+其他成分+介詞" 的結(jié)果。
然后我們就能看到結(jié)果了:
這就是put最常見(jiàn)的介詞搭配低斋,想看具體用法蜂厅,還可以繼續(xù)點(diǎn)進(jìn)去研究:
那我們?cè)賮?lái)看看,如果我選擇了搜索右邊三個(gè)詞膊畴,會(huì)有什么結(jié)果呢掘猿?
這時(shí)再點(diǎn)進(jìn)去,你會(huì)發(fā)現(xiàn)唇跨,結(jié)果中的介詞并不一定是緊跟動(dòng)詞的了:
于是稠通,根據(jù)詞匯的不同規(guī)律,我們就可以自由控制自己的搜索范圍买猖,進(jìn)行搜索改橘、學(xué)習(xí)了。
4. 背單詞
如果你耐心地看到了這里玉控,你將會(huì)收到一份高效背單詞的秘訣飞主。
由于語(yǔ)料庫(kù)搜集了歷年來(lái)的英語(yǔ)材料,可以說(shuō)幫你網(wǎng)羅了所有英語(yǔ)刊物高诺、演講碌识、訪問(wèn)等。因此虱而,這里的高頻詞就是真正英語(yǔ)使用中的高頻詞筏餐。
你不必再擔(dān)心 “背這么多單詞是否用得上”,更不必費(fèi)盡心思挑選所謂權(quán)威的詞書(shū)薛窥。
COCA的詞匯覆蓋率非常廣胖烛,背完了20000高頻詞眼姐,已經(jīng)不需要再去專(zhuān)門(mén)記憶GRE、GMAT等詞匯了佩番。語(yǔ)料庫(kù)官方提供付費(fèi)的詞頻表下載众旗,網(wǎng)絡(luò)上有各路大神總結(jié)出來(lái)的COCA5000、7000趟畏、10000贡歧、20000等詞匯表,扇貝赋秀、歐路詞典上也能直接搜索到相關(guān)詞書(shū)利朵。在這里,我只介紹一下如何使用這些詞匯猎莲。
如果不使用app绍弟,又不愿意付費(fèi),通常你得到的只是一個(gè)詞匯表著洼,連釋義也沒(méi)有樟遣。
這時(shí),你可以借助一些能夠自主導(dǎo)入單詞表的應(yīng)用身笤,如ANKI豹悬,將詞匯全部導(dǎo)入。但我不建議大家直接使用app自帶的釋義功能液荸,而是自己查找一遍瞻佛,查詞的過(guò)程也是學(xué)習(xí)的過(guò)程。特別是對(duì)于基礎(chǔ)一般的朋友們來(lái)說(shuō)娇钱,如果能將5000高頻詞熟練掌握伤柄,英語(yǔ)水平會(huì)有一個(gè)質(zhì)的飛躍。
在背單詞過(guò)程中忍弛,我們還可以時(shí)不時(shí)使用語(yǔ)料庫(kù)進(jìn)行搜索响迂,結(jié)合上文提到的三種方法,學(xué)習(xí)高頻詞匯的多種搭配與表達(dá)细疚。
當(dāng)然,如果你下載了官方資料川梅,得到的詞頻表中不僅有詞匯疯兼,還有高頻搭配總結(jié),相當(dāng)于收獲了一本最地道的搭配詞典贫途。
語(yǔ)料庫(kù)還有許多更為強(qiáng)大的功能吧彪,例如學(xué)習(xí)翻譯、研究特定文體的文本等丢早,甚至可以間接教我們寫(xiě)作姨裸、創(chuàng)作歌詞秧倾。
如果你還想了解更多,或者也許你就是語(yǔ)料庫(kù)使用的大牛傀缩,歡迎留言分享那先。