關(guān)注 | 你知道什么是教育評(píng)測嗎？

一提到評(píng)測，人們想到的便是考試。一群人坐在房間里，拿著筆在試卷上勾選選擇題的答案。沒錯(cuò)，紙筆考試的確是一種評(píng)測，但它僅僅是一種評(píng)測的方式。評(píng)測的本質(zhì)，是我們用以理解學(xué)習(xí)者理解程度的方式（how we understand what learners are understanding）。這里的“我們”不僅僅是指教師，還有學(xué)生和研究者。

評(píng)測的三種類型

形成性測驗(yàn) formative assessment：

當(dāng)一個(gè)測驗(yàn)是主要用來輔助學(xué)生的學(xué)習(xí)時(shí)，這個(gè)測驗(yàn)就是形成性測驗(yàn)。老師在課堂上的提問，學(xué)生的家庭作業(yè)，都是形成性測驗(yàn)。形成性測驗(yàn)?zāi)茏寣W(xué)生檢驗(yàn)自己是否真的學(xué)懂了知識(shí)點(diǎn)。老師也能利用形成性測驗(yàn)了解學(xué)生的學(xué)習(xí)進(jìn)度，以便進(jìn)行針對(duì)性的教學(xué)。形成性測驗(yàn)的難度不會(huì)太高，也不會(huì)計(jì)入學(xué)生的最終表現(xiàn)成績。

總結(jié)性測驗(yàn) summative assessment：

總結(jié)性測驗(yàn)是在課程結(jié)束后施驗(yàn)，用以評(píng)估學(xué)生究竟學(xué)到了多少東西。期中考試和期末考試都是總結(jié)性測驗(yàn)。全國性的高考等考試也都是總結(jié)性測驗(yàn)。總結(jié)性測驗(yàn)可以檢驗(yàn)學(xué)生的水平是否達(dá)到了某個(gè)標(biāo)準(zhǔn)。通常來說，總結(jié)性測驗(yàn)的難度比較高。

表現(xiàn)性測驗(yàn) performance assessment：

表現(xiàn)性測驗(yàn)是指把學(xué)習(xí)者置于一個(gè)模擬環(huán)境下，以評(píng)判其解決問題的表現(xiàn)。比如讓學(xué)生設(shè)計(jì)物理實(shí)驗(yàn)，動(dòng)手操作一個(gè)物理實(shí)驗(yàn)，然后根據(jù)實(shí)驗(yàn)數(shù)據(jù)得出結(jié)論。這樣就能評(píng)判學(xué)生在該物理學(xué)實(shí)驗(yàn)上的表現(xiàn)究竟如何。表現(xiàn)性測驗(yàn)既可以是形成性測驗(yàn)，也可以是總結(jié)性測驗(yàn)。

評(píng)測真的有效嗎？

廣義地說，教育領(lǐng)域的評(píng)測就是以數(shù)字為抽象能力賦值。我們想要以數(shù)字的形式來表征學(xué)習(xí)者的知識(shí)量，表征學(xué)習(xí)者的能力水平。但是，知識(shí)量和能力水平并不像身高體重一樣，拿尺子和秤就能簡單地測量出來。所以我們需要為這些抽象的能力發(fā)明一把專用的尺子。在心理測量領(lǐng)域，這些尺子就叫做量表。

我們有抑郁癥量表、人格量表、智商量表等等量表。學(xué)生在學(xué)校里參加的紙筆考試，其實(shí)也是一種量表。托福雅思考試，GRE考試等等，也都可以看做量表。但無論是哪種量表，我們都會(huì)遇到一個(gè)問題，這些發(fā)明出來的尺子，真的能有效地丈量我們想要丈量的東西嗎？智商測驗(yàn)得分高的人就真的更聰明嗎？通過GRE考試的人就真的更擅長做學(xué)術(shù)研究嗎？

在心理測量學(xué)中，我們有一個(gè)關(guān)鍵概念，叫做效度（Validity）。它是指測量工具能準(zhǔn)確測出我們想要測量的東西的程度。完美的測驗(yàn)，效度的值就應(yīng)該等于1。可在所有的心理測量和教育測量中，都不存在這樣完美的測驗(yàn)。效度能達(dá)到0.7就已經(jīng)是非常好的測驗(yàn)了。

或許，我們并不需要完美的評(píng)測。日常生活中的變量實(shí)在是太多太多，我們無法將之全部納入考慮中來。但是評(píng)測是我們用以理解學(xué)習(xí)者學(xué)習(xí)情況的非常有效的輔助手段。

黄色一级视频在线_国产最爽的乱淫视频国语对白1_无码专区—VA亚洲V天堂_亚洲精品影视_精品国产精品久久_一区二区美女视频

關(guān)注 | 你知道什么是教育評(píng)測嗎？