今年早些時候,教育部下發(fā)了《關于深入推進教育管辦評分離促進政府職能改變的若干意見》,這標志著深化教育督導體制改革、轉變教育管理職能和部署構建“政府管教育、學校辦教育、社會評教育”的新格局正式上路。但是如何構建政府、學校、社會的新型關系、如何將教育管辦評分離從紙上藍圖變?yōu)楝F(xiàn)實等問題還需進行深入探討。在日前由北京大學中國教育財政研究所主辦的“管辦評分離背景下的教育評價新視野”國際研討會上,來自國內外專家學者就對這些問題進行了討論。
教育評價的落腳點仍是學生發(fā)展
談及教育評價,遼寧省大連市西崗區(qū)教育局局長李生濱從教育管理者和教育評價需求方的角度,講了一個真實故事。
有一次,李生濱去一所學校聽一堂研究性學習的課。那堂課上,老師講完海豹的故事后,問學生有沒有不同意見。一個孩子舉手了,老師問:為什么圖片上有的海豹長斑,有的海豹不長斑?這個小孩回頭看圖片時,恰好看到長斑的那只海豹是小海豹,于是孩子很自信地回答:海豹小的時候長斑,長大了就不長斑了。孩子回答完畢,老師帶著同學們一起鼓掌。老師說:你看這位同學知識多淵博,研究得多透徹,我們大家應該向他學習。
“實際上,海豹中確實有一種背部灰黑色且分布有不規(guī)則棕灰色或棕黑色斑點的斑海豹。這究竟是老師無知,還是老師無法應對當下的知識爆炸?這個問題怎么來解決?這樣的事情在學校的課堂里經(jīng)常出現(xiàn)。”李生濱疑惑地發(fā)問,“不管怎樣評價,我個人認為還是要把學校教育落實到課堂中去,課堂中的問題,我們怎么去解決?評估能否把這些問題反映出來,進而反饋回去找到解決的辦法?”
日常教育管理中積累的大量鮮活案例,使得李生濱意識到:教育評價不是一把簡單的“雙刃劍”,而更像是一個“多棱錐”,既有導向的功能,又有激勵的作用,既有避免傷害無辜、傷害自身的功能,又有促進實現(xiàn)課程標準現(xiàn)代化、課程內容科學化、評估標準和評價工具科學化等現(xiàn)實需求的功能。
有此困惑的,不只是李生濱。今年5月,江蘇省教育評估院副院長袁益民在英國與世界39位評估學科專家編寫《評估的未來》時,對世界教育評價,大家給了一個形象比喻:多年來的評估,就像飛機已經(jīng)飛出去了,但一些部件還沒有安裝好,技師也沒登上飛機,這很危險。
“教育評價不論是為學生發(fā)展提供信息,還是為經(jīng)費投入方提供各個項目的績效信息,或者是為政府管理和決策提供教育質量水平、教育公平實現(xiàn)程度等信息,其最終的落腳點還是以學生發(fā)展為本。”北京大學中國教育財政研究所教育評價中心主任黃曉婷說,“現(xiàn)在的教育評價已不是原來單一考學生,而是拓展到了考試成績之外的道德品行、心理抗壓能力、問題解決能力、批判思考能力等非認知領域,我們不希望我們的學生是草莓族,一壓就扁。”
“其實,發(fā)展中國家所面臨的最大挑戰(zhàn)就是教育質量問題。如果沒有教育質量,這些國家就沒有辦法進入到中等收入國家的行列,同時也更難成為高收入國家。”從事教育評估40年的世界銀行東亞與太平洋地區(qū)教育部門前主管魏愛德認為,一個好的教育評價體系,就可以識別出這些問題。
世界一些國家在教育評價領域的先行先試,對于中國這樣的后發(fā)國家,或許有一定的路標價值。就教育評價而言,目前世界大部分國家的教育評價測試都是篩選功能,主要把后進生淘汰出局。而新加坡的做法則與之相反。新加坡是借助教育評價工具精確找到“有問題的孩子”或者后進生,并投入人均6倍以上的經(jīng)費,將后進生送入一些特殊學校,而特殊學校的校長都是精挑細選出來的最優(yōu)秀的校長,以確保這些后進生能獲得好的教育。
這或許是新加坡這樣的一個連水資源都要從馬來西亞進口的小國家,為什么能始終保障他們有充足的、技能超常的人才資源的秘密。因為,新加坡利用教育評價工具盡量將人的潛力發(fā)揮到極致。
事實上,關注學生發(fā)展正成為國內一些機構開展教育評價的重要監(jiān)測點。在應試教育環(huán)境下,傳統(tǒng)的學校教育管理和評價往往很難“發(fā)現(xiàn)”學生分數(shù)之外的成長。
一次入校評估,給成都市教科院副院長秦建平留下了深刻印象。在成都市近郊的雙流縣一所農民工子弟校進行教育測評時,秦建平發(fā)現(xiàn),這所學校學生的行為習慣“很特別”:雖然教室、走廊都看不見垃圾桶,但整個學校非常整潔干凈。原來,學校學生每天產生的垃圾都是用一個小塑料袋自己裝走,中午或放學時自己扔到學校指定位置的兩只大垃圾桶里。結果,測評組對該校學生行為習慣的評價分在全縣最高。
誰能成可信賴的教育評價第三方?
評估,說到底是一部分人到另一部分人家里去翻箱倒柜,并且離開后還不能阻止他們說什么。我們有時評估的目的很正確,但往往是拿著勺子去刨地,拿著鋤頭去吃飯,拿的工具是錯誤的。
10多年前,袁益民就有這樣一個夢想:中國能否建立一個類似于英國質量保障署一樣的獨立、專業(yè)、權威的教育評估部門,監(jiān)管教育質量。它具有專業(yè)的不可替代性,既不是中介機構,也不是研究機構。
10多年過去,各類教育評估機構如雨后春筍般誕生。以上海浦東新區(qū)為例,2005年時,教育類的社會組織、專業(yè)化組織僅9家,而今達到47家。即便教育評估機構發(fā)育較快,但在教育管辦評分離的大背景下,與會的專家學者和教育管理者們心中都有一連串的問號:我們評估機構到底是誰?世界范圍內的教育評估是怎么做的……
“教育評價是一個世界性難題,是一門專業(yè)性很強的科學,不是政府行政措施所能完成的。在中國之所以具有特殊性,就在于教育評價在中國教育中實際上有指揮棒的作用。因此,教育怎么評價,在一定程度上是影響和決定如何辦教育的,尤其是對基礎教育影響更為明顯。”國家教育咨詢委員會委員談松華說,教育評價在中國整個教育制度建設中是一個薄弱環(huán)節(jié),現(xiàn)在中國教育評價主要是通過考試測評,而考試測評又更多地側重在學業(yè)知識的考評上,它很難去全面評價學生和學校,更難全面評價地方教育部門,所以需要建立一種能適應學校、教師、學生發(fā)展的科學評價制度。
相對于內地剛剛起步的教育評價,香港在教育評價方面的探索已經(jīng)先行一步。在香港,從一開始就不是由政府推動的,而是委托考評局。在香港,考評局是具有法律意義的獨立法人,獨立于教育局之外,是一個社會公共機構,所以考評局從一開始就是第三方。
“第三方機構能不能是私立的?是不是一定要公立?第三方機構能不能是一個賺錢機構?”香港考評局總監(jiān)羅冠中先生連續(xù)發(fā)問:“我想恐怕還不行,我看了這么多國家和地區(qū)的第三方機構,大部分都是非營利機構。假如有一個大財團,通過風險投資,以第三方機構的身份出來做教育評價,行不行?我表示懷疑。”
事實上,上海浦東10年的管辦評分離改革對于“摸著石頭過河”的其他地區(qū),具有一定的借鑒意義。早在10年前,浦東根據(jù)自身地域特點,啟動了管辦評分離改革。彼時的浦東新區(qū),基礎教育學生46.7萬人,中小學幼兒園632所,若算上分校、分園,學校總數(shù)超過1000所,且校際差異較大,既有全國、全上海市頂尖的重點學校,又有典型的農村學校。這種現(xiàn)狀,使得浦東的教育局長不可能像其他區(qū)縣教育局長那樣,經(jīng)常逐個學校指導工作,甚至有的校長除了開大會外,三五年都難得見局長一面。
“客觀的現(xiàn)實,倒逼我們浦東只能選擇放棄精細化管理,選擇‘小政府、大社會’的管理模式,試圖構建一個政府宏觀管理、學校自主辦學和社會專業(yè)評價的教育管辦評分離之路。”浦東新區(qū)教育局基教處劉文杰介紹說,改革之初,浦東新區(qū)對管辦評中各方的角色進行了簡單梳理,把區(qū)域事業(yè)規(guī)劃、資源配置、公共財政投入、政策設計、質量監(jiān)控、服務平臺建設等屬于政府職能的,劃歸政府;把教職工聘任、課程開發(fā)、教育教學組織、自我評價等屬于學校職能的,讓給學校;把知情權、參與權、監(jiān)督權以及社會對教育的評估等屬于社會職能的,還給社會;把可供多元選擇的教育服務、多元多層次國際教育、民辦教育等市場職能的,劃轉給市場。
在此基礎上,政府以購買服務、通過持續(xù)給項目等方式培育教育評估、教育培訓服務等專業(yè)化的社會中介組織。截至目前,浦東新區(qū)額外投入財政專項經(jīng)費5850萬元,實施了65個委托管理項目。“在推進第三方教育評估方面,我們有一套完整的招投標制度,教育局和第三方委托機構之間是一種協(xié)議關系、契約關系,第三方評估機構依據(jù)協(xié)議對學校開展初態(tài)評估、中期評估、終結性評估,然后進行前后比較,通過觀測被評估學校在同類學校中是否有明顯進步,來反映我們額外的委托管理經(jīng)費的實際效益。”劉文杰說。
然而,對于管辦評分離背景下的第三方教育評價中的一些誤區(qū),一些學者有著清醒的認識。“評估,說到底是一部分人到另一部分人的家里翻箱倒柜,然后離開后還不能阻止它說什么。所以,我們評估的意愿和評估的結果有時相去甚遠。我們有時目的很正確,但往往是拿著勺子去刨地,拿著鋤頭去吃飯,拿的工具是錯誤的。”袁益民說,“質量保障實際是一個連續(xù)題,更多的不是需要贊揚我們的被評者,也不是需要給出改進意見,更多的是要靠被評者自己回答我們學校在哪里?它正往何處去?但是,我們一些評估被扭曲了,學生的很多壓力是地方政府給教育系統(tǒng)施加的,教育系統(tǒng)再把壓力轉給學校,學校再傳遞給老師,老師再傳遞給學生,最終可能使我們的評估無效、失范、失真甚至失信。”
合理的機制和明確的責任,是培育可信賴的第三方教育評價的重要環(huán)節(jié)。袁益民對此作了一個類比:“南京古長城幾百年后,甚至幾千年后,人們都知道每塊磚是誰負責的,這樣質量就有保障。”
第三方評價怎么評?
第三方評價須先要了解為什么要做評估,并制定一個評估戰(zhàn)略,同時還要了解誰要參與到這個評估中來,以及一項評估產生的信息交由誰來接收和使用。然后運用一套科學、及時、準確的評估體系,在恰當時間內給需求方提供足夠透明且有用的評估結果。
談到第三方教育評價,國內很多人對于歐美國家的做法大多耳熟能詳,而對于香港則了解不多。其實,1997年香港回歸后,就啟動了以“終身學習、全能發(fā)展”的系列教育改革。其中,推動評核機制建設以輔助教與學,成了這一時期香港教育改革的一個亮點。其評核機制的基礎功能是輔助教與學、提供學歷證明及篩選。在評核形式上,分為校內自評和校外第三方評核兩種,前者主要是通過評估幫助學校教師了解學生的學習進度,及早識別學生的學習需要,以便及早針對學生的學習問題提供適當?shù)膸椭?/p>
與大陸高考側重升學的功能不同,香港的文憑考試成績是要伴隨學生終身的,不論學生申請公務員、私營機構職位,都必須填寫文憑考試的成績。
“要讓第三方機構去評價管和辦的質量,就必須確保第三方機構自身的質量。而第三方測評機構的質量保證來自其合理的組織架構、運轉經(jīng)驗積累和評核的專業(yè)性、權威性。每一行都有其自身的專業(yè)性,不能說我從小學考試考到研究生,我百戰(zhàn)沙場,我就是考試評核專家,就可以說三道四,就可以任意評說。”羅冠中坦言,香港的評核也面臨不少挑戰(zhàn),比如每年考評結束后向社會發(fā)布很厚的評估結果報告,只向外公布合格率,更詳細的結果則一般由學校“內部掌握”。但現(xiàn)實是,每所學校成績好的都喜歡把自己的好成績告訴他人,所以如何真正讓學校保得住密,就是個不小的難題。
讓香港考評局感到頭疼的,遠不止于此。比如,在全港性系統(tǒng)評估中進行年度與年度之間的評核結果比較時,就面臨一個兩難選擇:雖然對所有學生進行的普測比抽樣評測的效果最好,但是成本很高,可能會對學校正常的教育教學造成干擾,還有可能導致原意是促進教學最終卻無意中變成了指揮教學的“指揮棒”。
對于世界各地現(xiàn)行的第三方教育評價,魏愛德總結了一條經(jīng)驗。魏愛德認為,第三方評價必須先要了解為什么要做評估,并制定一個評估戰(zhàn)略方案,同時還要了解誰要參與到這個評估中來,以及一項評估產生的信息交由誰來接收和使用。然后運用一套科學、及時、準確的評估體系,在恰當時間內給需求方提供足夠透明且有用的評估結果。同時,第三方機構離政治影響越遠越好,每一次評測都要考慮用戶的需求,評測結果能得到很好地推廣和使用。此外,評估體系要能告知對象的現(xiàn)狀是什么,并持續(xù)跟蹤一系列指標的變化。
魏愛德總結的經(jīng)驗,或許是管辦評分離背景下第三方教育評價的發(fā)展路向。
事實上,近幾年隨著計算機技術的快速發(fā)展,大數(shù)據(jù)已被大量引入教育評估。6年前,重慶市教育評估院建立了數(shù)據(jù)平臺,并搜集了大量數(shù)據(jù),既有學生發(fā)展、學校硬件、教師人數(shù)、學生人數(shù)等常態(tài)數(shù)據(jù),又有學生綜合素質評價的動態(tài)數(shù)據(jù),而且從這些動態(tài)數(shù)據(jù)中能看到學生每一天的變化,既能看到學生的興趣特長,又能看到他們對某種價值觀的認同度,還能看到學生心理健康、學業(yè)負擔指數(shù)、師德師風指數(shù)變化,看到學生家長的相關狀況等。同時,通過一些模型評測不同學校、區(qū)縣的教育質量發(fā)展現(xiàn)狀。
“當你看到琳瑯滿目的數(shù)據(jù)時,也會看到我們在評價教育質量時不是一個簡單的分數(shù)概念,其中既包括師生成長的數(shù)據(jù),也包括教學設備對學習成績影響等所有的數(shù)據(jù)。這個系統(tǒng)現(xiàn)在可以支撐到每個區(qū)縣,甚至每所學校,我們可以給每所測評學校提供一份報告,幫助學校改進教育教學。”重慶市教育評估院院長龔春燕介紹說,“借助這個大數(shù)據(jù)平臺,我們做了義務教育均衡發(fā)展等評估模型。今后,一所學校要辦多大規(guī)模,不是哪個領導說了算,而是用這個模型去計算和統(tǒng)籌。”
英美等國家也正在通過引入大數(shù)據(jù)技術推進新類型教育評估的相關實驗。據(jù)英國的培生集團教育專家格雷戈瑞博士介紹,歐美國家的許多教育評估機構目前正在用數(shù)據(jù)技術,跟蹤學生實時的學業(yè)進展,并進行隱性評價,而且會去跟蹤學生在一個學期或一年的進展,觀察他們掌握技能的狀況,同時對學生學習規(guī)律、怎樣進一步改進學習等方面展開隱性評估。這種隱性評估既不是說把學習和評價分割開,也不是以考試為目的,而是自然而然地將考試整體納入到學習過程中。
“先把評價做起來,邊做邊探索”
評價正面臨一系列懸而未決的難題——如何把好的教育和特色教育評價出來;如果政府職能不轉變,評價是否會把學校綁得更緊、管得更死,進一步收窄學校自主發(fā)展的空間;如何尊重評價的獨立性,支持學校開展自我評價,等等。但是,我們提倡先做起來,邊做邊探索。
“理想很豐滿,現(xiàn)實很骨感。”這是不少與會學者的相似感受。
研討會上,教育部政策法規(guī)司司長孫宵兵說:“當前中國教育面臨的最重要問題,就是質量評價問題。我們的學校大家都在辦學,我們的教育行政部門都在管理,按照一個什么樣的要求進行辦學?按照什么樣的要求進行管理?我們辦學的標準是什么?管理標準是什么?好學生應該是什么樣子的?核心問題還是沒有解決質量評價問題。所以,我覺得今后教育研究的一個中心任務就是要聚焦于質量及其評價的問題。”
不只是孫宵兵有此困惑。國家教育發(fā)展研究中心教育體制改革研究室主任王烽認為,從宏觀上來說,政府評價教育的初衷,主要是要保證我們的辦學方向、提高財政資金的使用效率以及保證公共教育的基本質量和公平。但是,在實際的評價中也會面臨一系列懸而未決的難題——如何把好的教育和特色教育評價出來;如果政府職能不轉變,即便成立一個評價機構,賦予其很多評價職能,那么評價是否會把學校綁得更緊、管得更死,進一步收窄學校自主發(fā)展的空間;如何尊重評價的獨立性,支持學校開展自我評價……
“政府管理部門不是專業(yè)機構,但可以利用專業(yè)化評價檢測結果,實施管理,調整政策。政府不宜自己出去搞評價,評價也不應進入政府的權力清單。”王烽提醒說,“我們的教育評價應當給學校預留足夠的自主發(fā)展空間。一般而言,好的學校沒有統(tǒng)一的標準,好的學校各具特色,好的學校需要個性發(fā)展。所以,政府出臺的質量標準應是基本質量標準,不應是高的質量標準。如果一個高的質量標準,大家都追求的話,所有學校就很有可能都辦成一個模樣。”
面對這些問題,中國現(xiàn)階段的教育評價究竟如何做,才算科學合理呢?王烽就此建議,檢測和評價要分開,檢測以政策改進為目的,就是要對政府提供的教育服務進行檢測,弱項在哪里,以便政策改進;學校評價則要以學校改進為目的,將關注和支持的重點轉向相對薄弱的學校。同時,要明確評價的結果是提供給政府和學校使用,而不是發(fā)布到社會上去,避免因大尺度的信息公開而影響學校正常的教育教學行為。
王烽的擔憂不無道理。東南沿海某省教育評估院負責人透露:“目前委托我們做評估的,絕大多數(shù)都是教育行政部門,既有教育廳層面的,也有地方教育局,但沒有學校。在這種情況下,我們開展的項目中有大部分是流于運動式的評估,評估的結果經(jīng)常和縣市區(qū)年度教育考核等績效掛鉤,所以在這些地方政府或地方教育行政部門政績思維和急功近利思想引導下,往往就會出現(xiàn)一些和實際評估相左的評價結果,而且對于自上而下的外部評估,學校有時疲于應付,甚至煩不勝煩。”
(來源:中國教育報 作者:柯進)