研究生生涯已經(jīng)進(jìn)行了三分之一凹蜂,新鮮的小學(xué)妹們也大波來襲馍驯,對(duì)小方向語言測試由一無所知到初成體系阁危,本篇算是對(duì)已學(xué)專業(yè)知識(shí)的一個(gè)總結(jié)吧。既是自我交代汰瘫,也期能為后繼想學(xué)教育測量和語言測試的同門們提供一點(diǎn)小小的幫助狂打。
第一講 ??語言測試的基本概念
一、測試混弥、測量趴乡、評(píng)估和評(píng)述
在教育測量和語言測試的文獻(xiàn)中,有四個(gè)使用頻率很高又很接近的術(shù)語蝗拿,分別是測試(testing)浙宜、測量(measurement)、評(píng)估(evaluation)和評(píng)述(assessment)蛹磺。
1.測試(testing)
測試是一種特殊測量技術(shù)粟瞬,以獲取量化的信息為目的,該信息反映應(yīng)試者所掌握的某一方面的知識(shí)或能力的程度萤捆。一般來講裙品,測試由一系列問題構(gòu)成,每一個(gè)問題都有一個(gè)正確答案俗或∈性酰可以分為客觀性測試(題型有多項(xiàng)選擇、正誤判斷辛慰、配伍題等区匠,答案唯一)和主觀性測試(口試、作文等帅腌,答案不唯一)兩大類驰弄。
2.測量(measurement)
測量指收集量化信息來決定被測量之物(不限于知識(shí)或能力)存在的程度。測量包括測試速客,測試是測量的一種形式戚篙。
3.評(píng)估(evaluation)
評(píng)估不局限于量化手段,在評(píng)估過程中溺职,也經(jīng)常使用面談岔擂、問卷調(diào)查,觀察等定性手段來系統(tǒng)的收集信息浪耘,目的是作出價(jià)值判斷或決定乱灵。在語言教學(xué)效果評(píng)估中,語言測試也是常用的手段之一七冲。
4.評(píng)述(assessment)
評(píng)述是使用最寬泛的術(shù)語痛倚,廣義上值收集語言數(shù)據(jù),包括測試數(shù)據(jù)癞埠∽丛總之評(píng)價(jià)收集定量和定性信息,供評(píng)述人了解被評(píng)述物之現(xiàn)狀苗踪。
小結(jié):評(píng)述>評(píng)估(需作價(jià)值判斷的評(píng)述)>測量>測試
二颠区、測試的分類
1.按照作用/功能分類
(1)學(xué)業(yè)測試
考察學(xué)習(xí)者掌握教學(xué)大綱規(guī)定的學(xué)習(xí)內(nèi)容的情況。通常在一門課程結(jié)束的時(shí)候?qū)嵤┩ú瑴y試內(nèi)容以大綱規(guī)定的教學(xué)目標(biāo)和教學(xué)內(nèi)容為依據(jù)毕莱,不受具體教材和課程的影響。很多學(xué)業(yè)測試采用標(biāo)準(zhǔn)化測試形式颅夺。例如高中各科會(huì)考朋截,大學(xué)四六級(jí)考試等。
(2)進(jìn)展測試
又稱課程進(jìn)展測試吧黄,在一門課程的不同階段或結(jié)束時(shí)實(shí)施部服,目標(biāo)是考察學(xué)習(xí)者掌握課程或教材內(nèi)容的情況。一般由任課教師命制拗慨。
(3)水平測試
考察學(xué)習(xí)者掌握知識(shí)的水平廓八,不以教學(xué)大綱、課程計(jì)劃或者教材為依據(jù)赵抢,應(yīng)試者可以是不同的學(xué)習(xí)背景剧蹂。有考察一般知識(shí)或能力水平的,如我國的公共英語等級(jí)考試烦却;有考察應(yīng)試者是否具備接受某種教育或培訓(xùn)的學(xué)科知識(shí)水平的宠叼,如托福和雅思;也有考察應(yīng)試者是否具備其所從事的職業(yè)要求的語言水平其爵,如我國的職稱英語考試冒冬。
(4)學(xué)能測試
又稱預(yù)測性測試(prognostic tests),考察應(yīng)試者學(xué)習(xí)某一學(xué)科的潛能摩渺。一般在應(yīng)試者開始學(xué)習(xí)相關(guān)學(xué)科之前實(shí)施窄驹。著名的學(xué)能測試有J.Carroll和S.Sapon設(shè)計(jì)的MLAT(modern language aptitude test)和Pimsleur設(shè)計(jì)的PLAB(pimsleur language aptitude battery).
MLAT考察語音編碼能力、語法敏感性证逻、歸納式學(xué)習(xí)能力和機(jī)械記憶能力(后來機(jī)械學(xué)習(xí)能力被排除乐埠,只保留前三種),詳情鏈接:Modern Language Aptitude Test and Manual_百度文庫
PLAB考察言語智能囚企、學(xué)習(xí)動(dòng)力和聽覺能力丈咐。詳情鏈接:PLAB
(5)診斷測試
確定學(xué)習(xí)者學(xué)習(xí)中的困難和存在的問題,以便教師及時(shí)發(fā)現(xiàn)不足龙宏,在后續(xù)的教學(xué)活動(dòng)中采取補(bǔ)救措施棵逊。
(6)分級(jí)測試
有的地方也成為分班考試,考察應(yīng)試者學(xué)科知識(shí)水平银酗,并以此為依據(jù)把他們納入適當(dāng)?shù)恼n程計(jì)劃中辆影。
2.其他分類
(1)速度測試和強(qiáng)度測試(都測知識(shí)或能力)
速度測試測試應(yīng)試者解決問題的速度徒像,題目一般比較容易,但題目數(shù)量大且有時(shí)間限制蛙讥。應(yīng)試者不能完成測試中全部題目的原因往往是時(shí)間不夠锯蛀。
強(qiáng)度測試題目數(shù)量不大,但有難度次慢,應(yīng)試者不能完成測試中全部題目的原因不是時(shí)間不夠旁涤,而是應(yīng)試者不具備完成全部題目所要求的知識(shí)或能力。
(2)主觀性測試和客觀性測試(根據(jù)評(píng)分方式區(qū)分)
二者的區(qū)別是看評(píng)分者是否需要對(duì)應(yīng)試者提供的答案的正確性或滿足測試的程度作出主觀判斷迫像。
(3)分立式測驗(yàn)和綜合性測驗(yàn)
反映的是測試設(shè)計(jì)者的語言觀和語言能力觀劈愚。分立式測驗(yàn)認(rèn)為語言是由笑的語言成分(如語音、詞匯闻妓、語法等)構(gòu)成菌羽,人的語言能力是可以分解的,由具體的成分構(gòu)成由缆。在分立式測驗(yàn)中算凿,一個(gè)題目只測量應(yīng)試者掌握一個(gè)單獨(dú)的語言成分的情況,題目彼此獨(dú)立犁功。20實(shí)際中葉占據(jù)主導(dǎo)地位氓轰,但也從那時(shí)起遭到越來越多的批評(píng),人們對(duì)他的效度提出了質(zhì)疑浸卦。綜合性測驗(yàn)則要求應(yīng)試者再做一個(gè)題目時(shí)融合多方面的技能和知識(shí)署鸡。但其提供的診斷性知識(shí)有限。
(4)標(biāo)準(zhǔn)化測試和教師自主命題的測試
(5)形成期評(píng)估和終結(jié)性評(píng)估
(6)常模參照性測驗(yàn)和標(biāo)準(zhǔn)參照性測驗(yàn)
(7)直接性測試和非直接性測試