摘 要:教育评价事关教育发展方向,分析国际基础教育评价改革发展趋势,可以为我国教育评价发展提供借鉴。通过对大量文献的分析梳理,归纳出基础教育评价改革的六大国际趋势,包含教育监测、对政府的评价、教师评价、学生评价、教学评价、信息技术在评价中的应用等,以促进中国式教育评价体系的建立,牵引基础教育的高质量发展。
关键词:中国基础教育论坛;国际教育评价;高质量教育体系;教育监测;教师评价;学生评价
2020年,中共中央、国务院印发《深化新时代教育评价改革总体方案》(以下简称《方案》)。《方案》要求,“完善立德树人体制机制,扭转不科学的教育评价导向,坚决克服唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾”;教育评价改革的目标是,“到2035年,基本形成富有时代特征、彰显中国特色、体现世界水平的教育评价体系”。2022年,党的二十大报告将教育、科技和人才三大战略融为一体表述,并置于我国社会主义现代化建设的基础性、战略性支撑地位,要求自主培养拔尖人才、办人民满意的教育,建立高质量的教育体系。报告特别强调要“完善学校管理和教育评价体系”。
当前,全国各地教育评价改革如火如荼,涌现出了许多典型案例。然而,评价问题的解决是一个长期的过程,教育评价改革目标的实现任重道远,需要我们以海纳百川的宽阔胸襟借鉴吸收人类文明的一切成果,边学习边实践边探索。作为比较教育研究者,笔者研读了来自国际组织和多国政府关于基础教育评价改革的文献,其中包括来自联合国(UN)、世界银行(IBRD)、联合国儿童基金会(UNICEF)、经济合作发展组织(OECD)、欧盟(EU)和东盟(ASEAN)发布的文件,以及很多发达国家的文献、报告和成果。通过大量文献的梳理分析,笔者归纳出基础教育评价改革的六大国际趋势,我们可以从中汲取营养,以促进中国式教育评价体系的建立,牵引基础教育的高质量发展。
一、趋势一:基础教育评价正在从一次性、单项性的评价,转变为持续性、综合性的监测
对基础教育的评价正在从一次性、单向性的评价,转变为持续性、综合性的监测。为什么要强调“监测”呢?因为评价的特性之一是“滞后性”,即常常是“事后检查”。对教育来说,滞后往往是致命的问题,其根本原因在于人的生命只有一次,滞后不仅意味着在教育上浪费金钱和人力,更意味着导致浪费儿童的生命和社会潜在人才的流失。因此,人们开始研究思考,能否从另一个方向或教育的全过程来思考,于是就有了“监测”。
“监测是一种在项目实施过程中开展的评价,旨在改善项目设计和行动功能”,“监测是一种精心设计的内生性活动,通过对项目实施过程持续提供信息反馈,从而发现问题和效率效益”。(Bamberger,1986,2004)教育监测是一种教育评估,在教育事业(项目)的实施过程中进行。教育监测通过在第一时间向决策者和实施者提供早期、具体、多维的操作信息,不断修正偏差,以完善教育实施目标与方案、调整过程与配置、选择恰当的教学方法技术,从而确保既定教育目标的实现(在必要时,甚至可以修正教育教学目标)。
从评价转向监测的标志,是2002年联合国教科文组织(UNESCO)开始聘请第三方机构监测各国教育发展状况,每年发布监测评价报告,并生成新词M&E(监测评价,monitoring & evaluation)。该系列报告在对各国教育发展状况进行全面统计的同时,每年在主题上会有所侧重。
此外,OECD也从2000年起组织开展“国际学生评估项目”(PISA)。PISA项目每三年开展一次,每次在阅读、数学和科学三个领域中一科主测、两科辅测,以后又逐渐增加了“问题解决”“协作性问题解决”“全球胜任力”等领域的测评。一方面,监测成员国和各参与国的教育发展状况;另一方面,从测评中提取来自各国的经验,供各国政府和教育部门参考。
根据上海教育自身的发展需要与国际教育监测评价的趋势经验,上海市教育委员会于2011年制定《上海市中小学生学业质量绿色指标(试行)》(以下简称《绿色指标》)。监测评估每三年开展一次,测评并不局限于学生学业成绩,还采集影响学生学业成绩的其他因素,从10个向度进行测评监测,并将数据反馈给政府和学校,引导教育管理部门和学校不断调整发展方向。2018年,上海又修订形成《绿色指标》2.0版。将10类指标修订为:学生品德和社会化行为;学生身心健康;学生学业水平;学生学习动力;学生对学校认同度;学业负担与压力;教师课程教学能力;校长课程领导力;教育公平(家庭与社会);跨时间发展变化。同时,监测评价的方式方法也更为多元合理,既对三年级和七年级学生的学业水平进行测试,也用师生访谈、现场考察和学校档案记录和学生健康记录来开展多维度多重聚焦式监测。
二、趋势二:基础教育评价正从对学校和教师的评价,转向同时关注对地方政府的评价
越来越多的国家和国际组织发现,尽管人们常说“一位好校长就是一所好学校”,但义务教育学校发展水平,不但有赖于学校教师和校长的智慧与努力,而且与地方政府的教育政策、经费、师资和学生配置等因素密切相关。因此,PISA和教师教学国际调查(TALIS)测评中都包含对政府政策的检视,政府的政策与投入是影响一个地区基础教育能否实现公平优质发展的重要因素。
政府通常从四个方面影响学校的资源配置。第一,管理资源的配置,包括校长选配、财政经费、学校办学自主空间等;第二,物质资源配置,包括校舍场地、实验设施、信息资源等;第三,人力资源配置,包括师生比例、优秀师资、进修机会等;第四,环境资源配置,包括学生来源、专业合作、社会支持等。可以说,这四大配置在很大程度上会影响甚至决定学校的发展水平。UNESCO 2017-2018年全球教育监测报告的主题是“教育问责”,指向政府到底做了什么、怎么做。
我国发布的《方案》包括政府评价、学校评价、教师评价、学生评价和用人单位评价,构成了一个完整的评价系统。《方案》还特别强调了“各级党委和政府要坚持正确政绩观”。因为,如果地方政府的政绩观出了问题,那么学校教育不仅会出现教育经费资源不足的问题,还有可能出现教育资源仅仅集中在少数几所学校而其他学校资源不足的问题。因此,我国已经将“督政”纳入教育督导的重要内容。评价学校和评价政府并举,是办好每一所学校的重要举措,也符合国际教育评估的发展趋势。OECD对发达国家教育评价的现状所提出的归纳模型(图表略)与我国评估方案的框架结构基本一致。
三、趋势三:教师评价正从“对教师的评价”,转向“为教师的评价”和“教师自己的评价”
欧美国家有学者认为,相对于学生测评和课程评价的兴起,“教师评价”出现最晚,始于19世纪80年代。其主要原因在于美国19世纪60年代教育改革后,新课程被束之高阁、改革结果与预期成效相去甚远,于是,教师就成为问责的对象,对其进行评价。学者们认为,“对教师的评价”的核心功能在于以行政管理方式或按绩效奖惩教师。但这类教师评价对教育质量提升所起到的作用有限,“教师评价”更应转变为“为了教师专业发展的评价”。上述观点获得了UNESCO、OECD和EU等国际政府间组织及许多教育专业团体的支持。教师评价到底怎么评?大致可以分为三类。
第一,对教师的评价。这种评价的特点是行政管理色彩浓厚、指标明确、公平奖惩。这类评价以教师为评价对象,检验教师的履职程度,其本质上是由外向内、自上而下的问责。评价重点包含教师遵纪守法、履约敬业、目标达成、绩效高低等情况,以此奖优惩懒、提升效率。其本来目的是监测,但结果也有可能变成了“评什么就干什么”,久而久之会产生竞争内卷或“躺平”。
第二,为教师的评价。促进教师专业发展的评价,则是一种协作互信、讲究反馈和改进、内外结合的专业指导。其重视教师的发展过程,重视发现教师间的差异,并据此完善教师的行动,提供反馈建议。这种评价的条件是看轻利害、力求真实、行为分析、建议指导、互帮互学。
第三,教师自己的评价。教师自主参与的评价。这种评价的特点是通过专业服务赋能教师专业发展,需要主体的内在需求升华,愿意自己测评。教师参与评价指标的设定,进行反思研究,凸显自身的特色优势,提升评价能力。这就需要为教师提供方法参照、技术支持,帮助其进行自诊自评,发现自身优势和不足,提高自我效能。
上海市中小学校紧跟世界先进评价发展趋势,在实践上取得了一定成效。上海市第一师范学校附属小学开展的教师发展性评价,让教师个人和集体都明白自己的起点在哪里,可以到哪里去,如何达成发展目标,如何知晓是否已经达到。晋元中学和奉贤中学设立了“教师挑战性项目评估”,充分调动教职工的积极性和创造性,让他们把教师评价从被动接受转为主动投入,把专业发展从外在要求变为内在需求,从制度规范走向文化自觉,从单纯掌握学科知识、教学技能转向注重提升专业素养与境界。操作流程是“个人申报-立项审核-中期指导-总结评价”。闵行实验小学采取基础性评价(70%)与发展性评价(30%)并举的方式开展教师评价,其宗旨是“在成事中成人、以成人促成事”,其操作方式可总结为适度“留白”:在设计评价方案时邀请教师参与,留出发展空间、鼓励教师首创;多创设个性化发展平台,多提供专业成长的选择性路径;激活每一位教师的内在发展自觉,扬其“长”展其“能”。
四、趋势四:学生评价正从“基础知识的测评”,转向“基础知识”与“核心素养”并举的测评
以PISA项目测评领域的演进为例。上海市从2009年开始在测评中一直领先,有人就片面地认为上海的教育是世界上最好的,其实不然。英语中有个词literacy,可以理解为初识字、有初步能力,其反义词为illiteracy则是“文盲”的意思。而PISA项目完整的测评框架还包含批判性思维、问题解决、交流能力、协作能力、创造和创新能力,上海市在这些维度的测评成绩并非居于前列。而学生除了基础素养,还要具备将所学的基础知识和技能运用到不同场景中去的能力。
如在PISA2012“以计算机为工具的创造性问题解决测试”中,上海的成绩是第六名(536分),看上去还不错。17个国家(地区)的专家对测评结果做了一项研究,假设“阅读、数学、科学知识学习越好,成绩越高,就越能够解决问题”,这样问题就变得复杂了。其得出的数据是:韩国13.9分、美国10.6分、新加坡10.4分,与PISA的分数是正相关的,即“阅读、数学、科学学得越好,解决问题的能力也越强”;而中国的数据与PISA的分数是负相关的,而且是最严重的负相关。由图2(图表略)可知,上海市在PISA测试中,学生的阅读、数学、科学测评成绩位居第一,但是与“阅读、数学、科学知识学习越好,成绩越高,就越能够解决问题”这一假设的结果是-51.1分,“问题解决能力”的成绩就排到18位了,这也说明“高分低能”的现象是真实存在的。
问题出在哪里?主要在于我们对教师培养学生解决问题的能力没有进行深入研究。什么叫培养学生解决问题的能力?学生有没有意愿参与这样的认知过程,是不是有利于学生个人潜能的发挥?问题有没有不同的情境?问题解决过程是什么样的?配置与解决过程需要哪些思维能力?(图表略)……这些问题不研究清楚,老师们光有愿望,但并不了解应该如何教,如何评。这就难以提高学生解决问题的能力。OECD为了组织“问题解决能力测试”专门邀请了多国专家开展了深入的研究,获得了测试框架。
五、趋势五:教学评价仍是教育核心任务,教学水平尚需提高,教学评价需要多维
目前,教学评价仍是重要的评价方式,但是评价维度在不断精细化。2018年,OECD与9国开展了“教师课堂教学视频研究”(TVS),每个国家推荐85位数学教师,每人上两堂课(“一元二次方程”),录制上课视频,进行同课异构,分析教师的课堂教学行为,观察其中差异。课堂教学视频录评分析包括课堂管理、教学质量和社会情意支持三大维度(图表略)。这三大维度又细分为若干维度。这种利用先进信息技术的方法,真实可视地记录和比较不同国家、不同教师教学理念、方法与水平的方法,为教学评价开辟了新的途径、提供了新的支撑。
从图3(图表略)可以看到4个国家和地区的分析数据,上海教师的课堂管理测评分值高于其他国家,而且教师分布非常集中。但是,各国教师的教学质量都不尽如人意,教学水平普遍较低,处于及格水平,上海教师教学质量与各国相似,没有明显优势。这表明,虽然很多国家在过去几十年一直在推进教学改革,但课堂教学仍比较传统,并未起到立竿见影的效果。在社会情意支持方面,上海水平低,与其他国家存在差距。
如果再把教学水平与质量测评细分为四个维度,我们可以看到,上海只有在“学科教学内容把控”上质量第一,“学生认知参与”质量分值排名中游,“基于学生理解的评价与反馈”稍好,在“课堂对话”方面,我们仍然较差。
再看教师“对学生的社会情意支持”,这是社会发展中的一个新问题、对教师的新要求。“视频研究”认为,对学生社会情意的支持有助于克服困难危机、促进学生的学习发展。研究将教师对学生的社会情意支持细分为四个指标:创设舒适学习环境、相互尊重、鼓励坚持、良好关系。(图表略)是关于教育对学生社会情意支持的分析,图中曲线越向右偏,说明对学生的支持越大。可以看出,在8个国家和地区中,上海教师对学生的社会情意支持较为薄弱。分析视频发现,我们的课堂里,教师经常问学生“懂了没有?”而德国教师经常问“还有哪几位不懂?”德国学生都愿意也敢于在课堂上说“我不懂”,但是我们的学生大多不敢说、不轻易说自己不懂。令各国专家感叹的是,日本教师对学生社会情意支持的水平出乎人们的预期,已经处于参与国家的领先地位。
六、趋势六:信息技术的运用正成为教育变革和教育评价的新杠杆
首先,信息技术已经成为教育机构和教师评估的重要内容。UNESCO在2008年编制了《教师信息通信技术素养标准》,旨在帮助教育决策者和课程开发人员确定教师在使用技术时所需的技能。标准按照获取技术素养、知识深化、知识创造三条教育变革路径(方式)展开,从课程与评估、教学法、信息通信技术、组织与管理、教师专业发展五个方面构建教师信息素养框架与能力模块。为适应信息技术的迅速发展,UNESCO多次修订标准,最新版本为2019年版。
其次,信息技术日益成为教育学习的重要助手,成为教师和学生的资料来源与教学手段。在运用信息通信技术提供教学资源方面,我们走在世界前列。新冠肺炎疫情防控期间,我国坚持“停课不停学”并为每个学生免费提供线上教学服务,信息技术的应用成为常态。2012、2018年的PISA测试设立了“以计算机为工具的创造性问题解决测试”,考查学生是否能在计算机上解决问题,特别是“人机互动”的问题。2013、2018年的TALIS检测了教师在教学过程中使用信息技术的频率和如何使用的情况,考查教师是否能掌握信息技术、乐意使用信息技术,并教会学生在学习中运用信息技术,运用IT/AI技术解决复杂问题。PISA和TALIS的测评结果显示,上海的学生和教师在运用信息技术方面并无优势。例如:TALIS2013关于“我每周让学生用信息与通信技术(ICT)完成作业”这一项的调查结果显示,国际平均值为52.7%,上海教师平均值为24.3%;TALIS2018关于“我经常让学生用ICT技术完成项目”这一项的调查结果显示,国际平均值为68.2%,上海教师平均值为36.4%。在大数据、算法和算力要素加入后,形成的以过往数据为基础的精准测评和预判,以及在此基础上形成的学习资源的精准、多模态推送,有助于推动教育的个别化、个性化,真正实现因材施教。这就对学校和教师提出了新的能力要求。
再次,信息技术正在成为教育评价的重要工具,成为教师和学习者自测自评的工具。目前,世界各国的教育信息化已经向数字化方向发展(图表略),即为学生创建“学生助学系统”,为教师创建“教师助教系统”,这些系统在大数据的支持下实现不断反馈。
2021年,欧盟(EU)在研发推广了“数字能力框架指南”(教育机构、教师与教育者)的基础上,又开发了一套名为SELFIE的数字化教育自我评价工具(分学校、职教、教师和学前版),可以供学校、教师和学生自测自评使用。
学校自评版内容包括领导力、协作与网络、基础设施与设备、持续专业发展、课堂教学方法实施、技术支持与资源、技术赋能评估与实践、学生数字能力8个方面和学校的基础数据。学校自评通过对校长、教师和学生三方进行网上问卷调查,最后自动生成学校优势与劣势的分析报告和可视图像。
教师自评版内容则包括专业投入、数字资源使用、教与学、学生测评、赋能学习者、提升学生数字素养6个方面共计32项指标,以及教师的基础数据。每项分为6个熟练水平,教师通过网上自测,也可获得个性化、可视化的分析报告,自评报告还会提出若干建议。借助现代信息技术和数据分析,EU不仅对28个国家的教师进行测评、提供自评工具,还可以基于数十万中小学教师的自评数据,提供指导,提出专业提升的建议,助力教师成长。
百年大计,教育为本。笔者希望通过比较研究,总结和把握国际基础教育评价改革发展趋势,以期为我国教育评价发展提供借鉴,为促进中国式教育评价体系的建立、牵引基础教育高质量发展贡献力量。
参考文献:
[1]Monitoring and Evaluating Urban Development Programs, A Handbook for Program Managers and Researchers: World Bank Technical Paper: No 53[DB/OL].
[2]EU. Education and Training Monitor 2022[DB/OL].https://op.europa.eu/webpub/eac/education-and-training-monitor-2022/en/.
[3]EU. Digital Education Plan 2021-2027[DB/OL].https://education.ec.europa.eu/focus-topics/digital-education/action-plan.
[4]Holmes, W. etc. Artificial intelligence in education: Promises and implications for teaching and learning[M]. Boston: The Center for Curriculum Redesign, 2019.
[5]Norris, N. Understanding educational evaluation[M]. New York: St. Martin’s Press, 1990.
[6]OECD. Synergies for better learning: An international perspective of evaluation and assessment[M]. https://www.oecd.org/education/school/Synergies_for_Better_Learning_summary_Polish.pdf.
[7]OECD. TALIS 2018 results: Teachers & school leaders as valuable professionals[M]. Paris: OECD, 2020.
[8]OECD. TALIS Video Study Policy Report[M].Paris: OECD, 2020.
[9]Scleicher, A. PISA 2018: Insights and Impressions[M].Paris: OECD, 2019.
[10]UNESCO. Education Accountability: M & E Report 2017-2018[M]. Paris: UNESCO, 2018.
[11]UNESCO. Reimaging our futures together: A new social contract for education[M]. Paris: UNESCO, 2021.
[12]国际学生评估项目上海项目组.公平与质量:上海2012年国际学生评估项目(PISA)结果概要[M].上海:上海教育出版社,2014.
[13]教师教学国际调查上海项目组.专业与卓越:2015年上海教师教学国际调查结果概要[M].上海:上海教育出版社,2017.
[14]上海市教育委员会.上海市中小学生学业质量绿色指标(试行)[EB/OL].http://edu.sh.gov.cn/xxgk2_zdgz_jcjy_01/20201015/v2-0015-gw_402152011007.html.
[15]习近平.高举中国特色社会主义伟大旗帜为全面建设社会主义现代化国家而团结奋斗——在中国共产党第二十次全国代表大会上的报告[EB/OL].http://www.gov.cn/gongbao/content/2022/content_5722378.htm.
[16]中共中央国务院.深化新时代教育评价改革总体方案[EB/OL].http://www.gov.cn/zhengce/2020-10/13/content_5551032.htm.
初审:王远琦
复审:孙振东
终审:蒋立松