教學(xué)工作評估不僅是對學(xué)校人才培養(yǎng)質(zhì)量的一次綜合檢閱,也是對學(xué)校辦學(xué)治校含鳞、事業(yè)發(fā)展的全方位影锈、立體式診斷。
一蝉绷、教學(xué)評估的基本含義
區(qū)分測量與評估鸭廷。
測量是指用數(shù)字描述一個事件或特征;評估雖包括測量,但比測量范圍更寬廣,因為評估包
含各種取樣和觀察學(xué)生知識、技能和能力的方式潜必。
區(qū)分形成性評估與終結(jié)性評估靴姿。
在課堂中,評估可能是形成性的(不評分診斷性),也可能是終結(jié)性的(需要評分)。形成性評估有助于制訂教學(xué)計劃,終結(jié)性評估可總結(jié)學(xué)生的學(xué)習(xí)成就磁滚。
區(qū)分常模參照測驗與標(biāo)準(zhǔn)參照測驗佛吓。
在常模參照測驗中,一個學(xué)生的表現(xiàn)需要和其他學(xué)生的平均表現(xiàn)進(jìn)行比較。在標(biāo)準(zhǔn)參照測驗中,分?jǐn)?shù)需要與事先制定的標(biāo)準(zhǔn)進(jìn)行比較垂攘。雖然常模參照測驗涵蓋了大量的一般目標(biāo),但其結(jié)果并不能告訴你學(xué)生是否做好了學(xué)習(xí)高級知識的準(zhǔn)備,這種測驗不適合測量情感目標(biāo)和動作技能目標(biāo)维雇。標(biāo)準(zhǔn)參照測驗可以測量對具體目標(biāo)的掌握程度
什么是測驗信度?
個測驗需要考慮的重點之一是,基于測驗結(jié)果進(jìn)行決策和判斷的效度問題。效度的證據(jù)可
以和內(nèi)容晒他、效標(biāo)和構(gòu)念有關(guān)吱型。構(gòu)念效度的范圍最廣,并包括了內(nèi)容效度和效標(biāo)效度。為了讓測驗有效,測驗首先需要達(dá)到信度要求,然而信度并不能保證效度陨仅。
什么是無偏性?
評估應(yīng)該具有無偏性津滞。當(dāng)測驗包含的材料對某些群體具有冒犯性或不公平性時,偏見就會出現(xiàn),這些群體包括不同性別铝侵、不同社會經(jīng)濟(jì)地位不同種族和不同宗教信仰的學(xué)生。文化公平性測驗并沒有解決評估偏見的問題
二触徐、課堂測驗評估
測驗怎樣支持學(xué)習(xí)?
學(xué)習(xí)受到一定頻率的測驗支持,這些測驗使用累積性的問題讓學(xué)生運用和整合相關(guān)知識咪鲜。記住這些測驗的目的,教師就可以更好地設(shè)計這些測驗或者評價課本的配套測驗。
描述兩種傳統(tǒng)的測驗撞鹉。
兩種傳統(tǒng)的測驗形式就是客觀題測驗和論述題測驗疟丙。客觀題測驗包括多選題鸟雏、判斷題享郊、填空題、連線題,教師需要記住這些題目的編寫規(guī)則孝鹊。對論述題的編寫需要仔細(xì)的計劃,同時需要擬定評分標(biāo)準(zhǔn),以避免評分的偏差炊琉。
三、真實課堂評估
什么是真實性評估?
傳統(tǒng)測驗的批評者認(rèn)為,教師應(yīng)該使用真實性測驗以及其他的真實測驗程序惶室。真實性測驗要求學(xué)生完成與真實的校外生活情景相關(guān)的任務(wù)和問題解決温自。
描述檔案袋和成果展示。
檔案袋和成果展示是真實性評估的兩種形式皇钞。檔案袋是對學(xué)生作品的收集,有的時候需要選擇體現(xiàn)學(xué)生成長改進(jìn)的作品,有的時候需要選擇學(xué)生的“最佳作品”悼泌。成果展示是對學(xué)生理解程度的公開表現(xiàn)
檔案袋和行為表現(xiàn)評估的信度、效度和公平性如何?
真實性評估并不能保證信度夹界、效度和公平性(無偏性)馆里。使用準(zhǔn)則是讓評估更可信、更有效的一種方式可柿○伲可是,基于準(zhǔn)則的評估結(jié)果并不一定能預(yù)測與任務(wù)相關(guān)的行為表現(xiàn)。同樣,評分者可能基于個體的外貌复斥、談吐進(jìn)行打分,也可能對少數(shù)族群學(xué)生的行為表現(xiàn)或資源匱乏的群體抱有偏見,這些偏見會讓少數(shù)族群學(xué)生在形成性評估中處于不利的地位营密。
教師應(yīng)該怎樣使用非正式評估?
非正式評估是不需要評分的評估方式,主要用來收集多種信息以幫助教師進(jìn)行決策。非正式評估包括學(xué)生觀察和核查表目锭、提問评汰、學(xué)生自我評估等。在非正式評估中,日記是被非常靈活和廣泛使用的方式痢虹。學(xué)生常常需要按照一定頻率完成個人或小組日記被去。
四、評分
描述兩種評分的方式奖唯。
評分既可以是常模參照,也可以是標(biāo)準(zhǔn)參照惨缆。種流行的常模參照評分系統(tǒng)就是根據(jù)曲線分布
進(jìn)行評分,這種方式是把學(xué)生的成績與平均表現(xiàn)水平相比進(jìn)行等級排序。一般不推薦這種方式。標(biāo)準(zhǔn)參照評分的成績單,通常描述了每個學(xué)生每門功課學(xué)習(xí)得怎么樣坯墨。
失敗對學(xué)習(xí)的好處
學(xué)生需要面對失敗的經(jīng)驗,教師應(yīng)該高標(biāo)準(zhǔn)要求學(xué)生,以鼓勵他們努力學(xué)習(xí)寂汇。如果能夠提供合適的反饋,那么偶爾的失敗是具有積極意義的。從不知道如何面對失敗的學(xué)生,一旦面臨失敗他們往往會很快放棄捣染。
“社會升級”和“留級”哪一個更好?
讓一個學(xué)習(xí)有困難的學(xué)生簡單地留級或升級都不能保證這個學(xué)生學(xué)習(xí)的進(jìn)步健无。除非與班里其他學(xué)生相比歲數(shù)更小或情感上不成熟而不得不留級外,一般而言最好的方法是讓學(xué)生繼續(xù)升級,并在暑假為他提供額外的教學(xué)支持。差異化教學(xué)能夠阻止問題的發(fā)生液斜。
分?jǐn)?shù)能夠促進(jìn)學(xué)習(xí)和動機(jī)嗎?
對錯誤本身或錯誤策略的使用進(jìn)行具體的口頭或書面反饋,同時提供給學(xué)生如何提高的建議,并對積極的行為表現(xiàn)進(jìn)行表揚,這些方式都能夠增強(qiáng)學(xué)習(xí)。如果分?jǐn)?shù)與有意義的學(xué)習(xí)相聯(lián)系,那么分?jǐn)?shù)也能夠激勵學(xué)生的學(xué)習(xí)動機(jī)叠穆。
五少漆、標(biāo)準(zhǔn)化測驗
什么是平均數(shù)、中數(shù)硼被、眾數(shù)和標(biāo)準(zhǔn)差
平均數(shù)示损、中數(shù)和眾數(shù)都是對集中趨勢的測量,標(biāo)準(zhǔn)差反映了分?jǐn)?shù)與平均數(shù)的離散程度嚷硫。正態(tài)分布是一種鐘形曲線的頻數(shù)分布检访。
當(dāng)前測驗存在的問題是什么?
關(guān)于標(biāo)準(zhǔn)化測驗的矛盾主要聚焦于以下幾個方面:測驗的作用及其解釋、過多通過測驗來評估學(xué)校仔掸、對測驗分?jǐn)?shù)的不當(dāng)解釋以及對教師的測驗脆贵。如果測驗符合重要的課程目標(biāo),接受測驗的學(xué)生在某個合適的階段確實學(xué)習(xí)了這些課程,測驗本身沒有偏差,學(xué)生能夠理解測驗文字,施測方法正確,那么測驗結(jié)果就能夠提供一些反映學(xué)校質(zhì)量的信息∑鹉海可是對實際測驗的行動研究發(fā)現(xiàn)了一些令人擔(dān)憂的結(jié)果,它可能會限制課程內(nèi)容的擴(kuò)展或逼迫學(xué)生盡早退學(xué)卖氨。教師應(yīng)該運用測驗的結(jié)果去改善教學(xué),而不是對學(xué)生形成刻板印象或僅僅證明自己對學(xué)生的低期望。
學(xué)生能變成更好的應(yīng)試者嗎?怎樣做?
如果學(xué)生擁有相應(yīng)的測驗經(jīng)歷或者接受過測驗技巧和問題解決能力的培訓(xùn)的話,那么學(xué)生在標(biāo)準(zhǔn)化測驗上的成績就可能提高负懦。很多學(xué)生都能夠從有關(guān)如何準(zhǔn)備和如何參加考試的直接教學(xué)中獲益筒捺。讓學(xué)生參與設(shè)計測驗,也能夠?qū)W(xué)生有所幫助。很多學(xué)生在接受了全面的應(yīng)試準(zhǔn)備訓(xùn)練后,尤其是當(dāng)測驗技巧與具體問題纸厉、學(xué)習(xí)內(nèi)容系吭、測驗內(nèi)容密切相關(guān)時,測驗成績提高了。