教育評測，該如何做是好？

小U說

一提到評測，人們想到的便是考試。一群人坐在房間里，拿著筆在試卷上勾選選擇題的答案。沒錯，紙筆考試的確是一種評測，但它僅僅是一種評測的方式。評測的本質，是我們用以理解學習者理解程度的方式（how we understand what learners are understanding）。這里的“我們”不僅僅是指教師，還有學生和研究者。

評測的三種類型

形成性測驗（formative assessment）：當一個測驗是主要用來輔助學生的學習時，這個測驗就是形成性測驗。老師在課堂上的提問，學生的家庭作業，都是形成性測驗。形成性測驗能讓學生檢驗自己是否真的學懂了知識點。老師也能利用形成性測驗了解學生的學習進度，以便進行針對性的教學。形成性測驗的難度不會太高，也不會計入學生的最終表現成績。

總結性測驗（summative assessment）：總結性測驗是在課程結束后施驗，用以評估學生究竟學到了多少東西。期中考試和期末考試都是總結性測驗。全國性的高考等考試也都是總結性測驗。總結性測驗可以檢驗學生的水平是否達到了某個標準。通常來說，總結性測驗的難度比較高。

表現性測驗（performance assessment）：表現性測驗是指把學習者置于一個模擬環境下，以評判其解決問題的表現。比如讓學生設計物理實驗，動手操作一個物理實驗，然后根據實驗數據得出結論。這樣就能評判學生在該物理學實驗上的表現究竟如何。表現性測驗既可以是形成性測驗，也可以是總結性測驗。

評測真的有效嗎？

廣義地說，教育領域的評測就是以數字為抽象能力賦值。我們想要以數字的形式來表征學習者的知識量，表征學習者的能力水平。但是，知識量和能力水平并不像身高體重一樣，拿尺子和秤就能簡單地測量出來。所以我們需要為這些抽象的能力發明一把專用的尺子。在心理測量領域，這些尺子就叫做量表。

我們有抑郁癥量表、人格量表、智商量表等等量表。學生在學校里參加的紙筆考試，其實也是一種量表。托福雅思考試，GRE考試等等，也都可以看做量表。但無論是哪種量表，我們都會遇到一個問題，這些發明出來的尺子，真的能有效地丈量我們想要丈量的東西嗎？智商測驗得分高的人就真的更聰明嗎？通過GRE考試的人就真的更擅長做學術研究嗎？

在心理測量學中，我們有一個關鍵概念，叫做效度（Validity）。它是指測量工具能準確測出我們想要測量的東西的程度。完美的測驗，效度的值就應該等于1。可在所有的心理測量和教育測量中，都不存在這樣完美的測驗。效度能達到0.7就已經是非常好的測驗了。

或許，我們并不需要完美的評測。日常生活中的變量實在是太多太多，我們無法將之全部納入考慮中來。評測是我們用以理解學習者學習情況的輔助手段，它并不是唯一的手段。

通過評測來學習

（Inq-ITS內某個產品的試用頁面）

Inq-ITS是一個針對中學生的科學學習平臺。學生可以在這個平臺上學物理學、生命科學以及地球科學。在這個平臺上，學生需要操作一系列的程序，來檢驗他們提出的科學假設是否正確。例如，改變球的質量會不會改變球在一定距離進行自由落體的速度。

Inq-ITS以一種動畫的方式，模擬真實環境下的科學實驗。它同時也是對學生的一個評測平臺。每次實驗過后，都會向學生反饋其假設是否正確。而且記錄下來的數據還會反饋給教師。教師可以以此來判斷學生是否掌握了某個知識點，掌握程度又有多少。Inq-ITS不僅僅是一個評測學生科學研究能力的平臺，它同時也是一個為學生學習科學提供幫助的適應性的智能輔導系統。

科技的發展改變了評測的形態。我們可以利用計算機評測系統對學習者進行適應性的評測，利用大數據為學習者的學習情況作出詳細的描繪和評價。教育評測可以以游戲的形式進行，也可以以傳統的紙筆測驗的形式進行。只要它能實現我們的目標：實現更好的教育。

作者：洛克
內容來源：芥末堆看教育（ID：jiemoedu）

精

彩

推

薦

1. 優學云測評推出培訓機構個性化教學解決方案

2. 優學云測評推出中小學校個性化教學解決方案

3. 優學云測評推出招生平臺流量提升方案

4. 優學云測評推出企業人才發展平臺解決方案——人才庫管理

5. 優學云測評幫助個性化教育成為現實

優學云測評精選的每一篇文章都會注明來源和作者（除非找不到），文章版權歸原作者所有，若有侵犯權益，請聯系我們刪除。本文所述內容僅代表作者觀點，不代表優學云測評立場。對于本文以及其中全部或者部分內容、文字的真實性、完整性、準確性和合法性本公眾號不作任何保證或承諾。

黄色一级视频在线_国产最爽的乱淫视频国语对白1_无码专区—VA亚洲V天堂_亚洲精品影视_精品国产精品久久_一区二区美女视频

教育評測，該如何做是好？