? ? ? 教學(xué)中教師需要一個(gè)能夠鼓勵(lì)學(xué)生學(xué)習(xí)而不僅僅是評價(jià)學(xué)生行為的可信淡诗、公平而易操作的評定系統(tǒng),以便給學(xué)生的學(xué)習(xí)提供及時(shí)反饋韩容】钗ィ《教育心理學(xué)》第十五章《教學(xué)評估與測驗(yàn)》考察了評估群凶、測驗(yàn)和等級評定的有效性插爹,研究了實(shí)踐中如何開發(fā)更有效的測驗(yàn)和評定的方法请梢。
? ? ? 一. 教學(xué)評估的基本含義
? ? ? 課堂評估是由教師選擇和創(chuàng)造的評價(jià)方式赠尾,其有許多不同的形式——單元測驗(yàn)毅弧、小論文气嫁、檔案袋、完成項(xiàng)目够坐、動(dòng)手操作、口頭報(bào)告等元咙。評估包含各種取樣和觀察學(xué)生知識、技能和能力的方式庶香。
? ? ? 按照功能或用途劃分甲棍,評估主要有形成性評估和終結(jié)性評估兩種形式赶掖。形成性評估發(fā)生在教學(xué)之前或教學(xué)過程中救军。形成性評估的目的是指導(dǎo)教師計(jì)劃和改善教學(xué)倘零,幫助學(xué)生改善學(xué)習(xí)唱遭。終結(jié)性評估發(fā)生在教學(xué)之后呈驶,目的是讓教師和學(xué)生知道任務(wù)達(dá)成的水平拷泽。形成性評估和終結(jié)性評估的主要區(qū)別在于運(yùn)用評估結(jié)果的方式不同袖瞻。任何一種評估類型都可以用作形成性或終結(jié)性的目的。如果評估的目的是為了提高教學(xué)水平聋迎,幫助學(xué)生指導(dǎo)自己的學(xué)習(xí)脂矫,評估就是形成性的霉晕;如果目的是為了評價(jià)最后的成就庭再,評估就是終結(jié)性的。
? ? ? 評估過程中在形成測驗(yàn)和解釋結(jié)果時(shí)拄轻,信度、效度和無偏性是必須考慮的三個(gè)重要因素恨搓。
? ? ? 信度指測試結(jié)果的一致性。有些測驗(yàn)比其他測驗(yàn)更可信斧抱,能夠做出更穩(wěn)定和一致性的估計(jì)常拓。測量的標(biāo)準(zhǔn)誤需要考慮誤差的可能性辉浦,這是測驗(yàn)信度的一個(gè)指標(biāo)墩邀。
? ? ? 效度是指測驗(yàn)測到想測事物的程度盏浙。一個(gè)測驗(yàn)需要考慮的重點(diǎn)之一是基于測驗(yàn)結(jié)果進(jìn)行決策和判斷的效度問題眉睹。效度的證據(jù)可以和內(nèi)容废膘、效標(biāo)和構(gòu)念有關(guān)竹海。構(gòu)念效度的范圍最廣丐黄,并包括了內(nèi)容效度和效標(biāo)效度斋配。
? ? ? 評估應(yīng)該具有無偏性灌闺。當(dāng)測驗(yàn)包含的材料對某些群體具有冒犯性或不公平性時(shí),偏見就會(huì)出現(xiàn)桂对,這些群體包括不同性別甩卓、不同社會(huì)經(jīng)濟(jì)地位蕉斜、不同種族和不同宗教信仰的學(xué)生逾柿。文化公平性測驗(yàn)并沒有解決評估偏見問題宅此。
? ? ? 二. 課堂測驗(yàn)評估
? ? ? 學(xué)習(xí)受到一定頻率的測驗(yàn)支持机错,這些測驗(yàn)使用累積性的問題讓學(xué)生運(yùn)用和整合相關(guān)知識父腕。記住這些測驗(yàn)的目的弱匪,教師就可以更好地設(shè)計(jì)這些測驗(yàn)或者評價(jià)課本的配套測驗(yàn)璧亮。
? ? ? 兩種傳統(tǒng)的測驗(yàn)類型是客觀題測驗(yàn)和論述題測驗(yàn)斥难。客觀題測驗(yàn)包括多選題财搁、判斷題躬络、填空題尖奔、連線題穷当、簡答題等提茁,得分的答案不需要解釋馁菜,教師需要記住這些題目的編寫規(guī)則茴扁。論述題的編寫需要仔細(xì)的計(jì)劃汪疮,需要擬定評分標(biāo)準(zhǔn)峭火,以避免評分的偏差智嚷。
? ? ? 三.真實(shí)課堂評估
? ? ? 真實(shí)性評估要求學(xué)生在真實(shí)生活中運(yùn)用技能和能力。傳統(tǒng)測驗(yàn)的批評者認(rèn)為盏道,教師應(yīng)該使用真實(shí)性測驗(yàn)以及其他的真實(shí)測驗(yàn)程序稍浆。真實(shí)性測驗(yàn)要求學(xué)生完成與真實(shí)的校外生活情景相關(guān)的任務(wù)和問題解決猜嘱。
? ? ? 檔案袋和成果展示是真實(shí)性評估的兩種形式衅枫,兩者都強(qiáng)調(diào)在有意義的背景下實(shí)施與真實(shí)生活相關(guān)的任務(wù)朗伶。真實(shí)性評估并不能保證信度、效度和公平性论皆,使用準(zhǔn)則是讓評估更可信孤钦、更有效纯丸。
? ? ? 非正式評估是不需要評分的評估方式偏形,主要用來收集多種信息以幫助教師進(jìn)行決策觉鼻。非正式評估包括學(xué)生觀察和核查表俊扭、提問坠陈、學(xué)生自我評估等萨惑。
? ? ? 四. 評分
? ? ? 教師無論怎樣評估學(xué)生,最終都需要給出分?jǐn)?shù)庸蔼。
? ? ? 評分既可以是常模參照,也可以是標(biāo)準(zhǔn)參照姐仅。在常模參照評分中花枫,分?jǐn)?shù)主要受到參加這門課程的其他學(xué)生表現(xiàn)好壞的影響掏膏。一種流行的常模參照評分系統(tǒng)就是根據(jù)曲線分布進(jìn)行評分,這種方式是把學(xué)生的成績與平均表現(xiàn)水平相比進(jìn)行等級排序馒疹。標(biāo)準(zhǔn)參照評分是根據(jù)學(xué)生對課程目標(biāo)的掌握程度進(jìn)行評估佳簸。標(biāo)準(zhǔn)參照評分的成績單颖变,通常描述了每個(gè)學(xué)生每門功課學(xué)習(xí)的怎么樣生均。
? ? ? 學(xué)生在學(xué)習(xí)過程中難免會(huì)遇到挫折和失敗腥刹,學(xué)生需要面對失敗的經(jīng)驗(yàn)马胧,教師應(yīng)該高標(biāo)準(zhǔn)要求學(xué)生肛走,以鼓勵(lì)他們努力學(xué)習(xí)漓雅。如果能夠提供合適的反饋朽色,偶爾的失敗將具有積極的意義邻吞。
? ? ? 如果分?jǐn)?shù)與有意義的學(xué)習(xí)相聯(lián)系葫男,分?jǐn)?shù)也能夠激勵(lì)學(xué)生的學(xué)習(xí)動(dòng)機(jī)。作為教師梢褐,我們可以運(yùn)用分?jǐn)?shù)來激勵(lì)學(xué)生的學(xué)習(xí)旺遮,幫助他們?nèi)〉眠M(jìn)步盈咳。
? ? ? 五. 標(biāo)準(zhǔn)化測驗(yàn)
? ? ? 教師應(yīng)該具有關(guān)于測驗(yàn)的知識耿眉,理解標(biāo)準(zhǔn)化測驗(yàn)分?jǐn)?shù)的真實(shí)含義鱼响,知道如何正確地使用這些分?jǐn)?shù)來促進(jìn)教學(xué)。
? ? ? 平均數(shù)(算術(shù)平均數(shù))、中數(shù)(中間的分?jǐn)?shù))和眾數(shù)(出現(xiàn)次數(shù)最多的分?jǐn)?shù))都是對集中趨勢的測量筐骇。標(biāo)準(zhǔn)差反映了分?jǐn)?shù)與平均數(shù)的離散程度。正態(tài)分布是一種鐘形曲線的頻數(shù)分布铛纬。
? ? ? 標(biāo)準(zhǔn)化測驗(yàn)分?jǐn)?shù)有幾種不同的類型: 百分等級表明有百分之多少的人的分?jǐn)?shù)等于或低于某個(gè)體分?jǐn)?shù);年級當(dāng)量表明學(xué)生得分跟某個(gè)年級平均分的匹配程度告唆;標(biāo)準(zhǔn)分是基于標(biāo)準(zhǔn)差得到的棺弊。
? ? ? 當(dāng)前測驗(yàn)客觀上也存在問題悔详,關(guān)于標(biāo)準(zhǔn)化測驗(yàn)的矛盾主要聚焦于以下幾個(gè)方面: 測驗(yàn)的作用及其解釋镊屎、過多通過測驗(yàn)來評估學(xué)校茄螃、對測驗(yàn)分?jǐn)?shù)的不當(dāng)解釋以及對教師的測驗(yàn)。教師應(yīng)運(yùn)用測驗(yàn)的結(jié)果著力去改善教學(xué)归苍。
? ? ? 高質(zhì)量的教學(xué)和高質(zhì)量的評估遵循著相同的原則,這些原則有用于所有學(xué)生运怖。要想達(dá)成好的教學(xué)和測驗(yàn)效果,教師應(yīng)該意識到并對學(xué)生的差異作出反應(yīng)摇展;制定明確的學(xué)習(xí)結(jié)果;使用前測和形成性評價(jià)監(jiān)控學(xué)生的進(jìn)步咏连;采用多樣化的教學(xué)方式確保每一個(gè)學(xué)生都能取得進(jìn)步;確保學(xué)生知道終結(jié)性測驗(yàn)成功的標(biāo)準(zhǔn)祟滴;提供不同的評估形式振惰,讓學(xué)生能夠有機(jī)會(huì)垄懂、無障礙地展現(xiàn)自己學(xué)到的內(nèi)容骑晶。
? ? ?