摘 要:教育评价及其改革是一项关乎国家未来、民族命运的事情,涉及到一个国家的历史文化传统、经济社会发展水平以及思想观念等多重因素,对教育发展和社会进步具有重大战略意义。教育评价改革应立足于立德树人这根主线,着眼于全面贯彻党的教育方针,把培养德智体美劳全面发展的社会主义建设者和接班人作为根本的价值追求,确保育人目标的实现。当前,教育评价中存在的“五唯”顽瘴痼疾,只是教育评价不合理的“表象”。要扭转不科学的教育评价导向,必须遵循教育评价改革的规律,坚决地“去三化”(即功利化、标签化、官僚化)”和“兴三化”(即科学化、个性化和多样化)。新时代高等教育评价应着眼于完善基于多元主体的高等教育评价体系,高度重视高等学校整体办学质量评价,加快推进高等教育评价技术和方法的研究,进一步落实高等教育评价反馈机制和持续改进策略。在学科评价方向上,要从对学科产品的评价走向对学科生产能力的评价,从纯粹的学术标准走向立德树人的根本标准,从专注学术影响评价走向关注社会影响评价。同时,新时代高等教育评估改革要致力于规范评估边界、回归评估初心、聚焦真实质量,并基于直接证据开展评估。从公共治理的角度来看,新时代教育评价改革的重点在于构建教育评价的价值体系、结构体系、功能体系、制度体系和运行体系,有针对性、有步骤地推进教育评价改革总体方案的逐步落实,最终建构起富有时代特征、彰显中国特色、体现世界水平的教育评价体系。
关键词:教育评价改革;教育评价导向;破除“五唯”;立德树人;教育评价体系;多元主体评价
教育评价改革的“去三化”与“兴三化”
靳玉乐
教育评价在我国已有数千年的历史,比如汉代的察举制、三国两晋的九品中正制、隋唐以来的科举制等等,都涉及官方对教育教学质量的评价,而且历史上每一次教育评价改革都促进了教育质量提升与社会发展。可以说,教育评价及其改革是一项关乎国家未来、民族命运的事情,涉及一个国家的历史文化传统、经济社会发展水平以及思想观念等多重因素,对教育发展和社会进步具有重大战略意义。因此,中共中央、国务院高度重视新时代背景下教育评价的改革问题,制定了《深化新时代教育评价改革总体方案》这个纲领性文件,旨在构建符合中国实际、具有世界水平的教育评价体系。在认真学习这个总体方案之后,我对教育评价改革的问题有以下几点认识,和大家交流。
一、教育评价改革应坚持立德树人导向
评价是对评价对象进行的价值判断。从哲学上看,价值属于关系范畴,是指客体能够满足主体需要的效益关系,表示客体的属性和功能与主体需要间的一种效用、效益或效应关系。因此,教育评价的本质就是要判断教育活动满足教育主体需要的程度。以往的教育评价过于专注教育主体的功利性需要,对育人的本体价值重视不够。比如,某普通高中的升学率高,就意味着教育质量高。反之,则被认为是教育质量不高或一般;某大学产出的CSSCI论文和SSCI论文数量多或者承担的课题多、研究经费多、获奖多、高层次人才多,就意味着办学质量高,反之,则被认为是教育质量不高或一般,等等。这种取向的评价活动虽简便可行,但却难以衡量教育质量的真实情况。毕竟,这种“唯分数、唯升学、唯文凭、唯论文、唯帽子”的评价结果具有很大的片面性,忽视了教育作为社会实践过程的复杂性,况且教育的很多作用是不可能量化的。比如学生的思想道德水平能量化吗?学生的创新能力可以量化吗?学生的综合素质又如何量化?即便要进行量化评价,其标准合理吗?显然,这样舍本逐末的教育评价必须“拨乱反正”,真正转向对人的成长的关注。教育的目的在于实现人的全面发展,因此教育评价的改革应立足于立德树人这根主线,着眼于全面贯彻党的教育方针,把培养德智体美劳全面发展的社会主义建设者和接班人作为根本的价值追求,确保育人目标的实现。
二、教育评价改革要着眼于“去三化”
改革即革新,是一个吐故纳新的过程,即改变不适应事物发展的要素或者关系,舍弃旧的,吸收新的,不断创新。《深化新时代教育评价改革总体方案》明确指出,教育评价改革就是要扭转不科学的教育评价导向,坚决克服“唯分数、唯升学、唯文凭、唯论文、唯帽子”的顽瘴痼疾。但是,破“五唯”只是教育评价不合理的“表象”,隐藏在背后的病根,是“三化”,即功利化、标签化、官僚化。
其一,功利化。实际上,分数、升学、文凭、论文、帽子等评价指标体现的都是教育的外在工具价值,这些指标的确反映了教育质量的一些关键因素,但是一旦和评价对象的利益挂钩(如分数高就是示范性学校、论文多就是一流大学等),必然导致教育本体价值的疏离,进而诱使被评价者通过追求分数、升学、文凭、论文、帽子等来换取短期利益,久而久之,评价带来的不是教育教学质量的提升,反而是办学质量的下降。
其二,标签化。在现实的教育评价活动中,给评价对象贴标签的行为经常发生。比如,通过评价,把中小学贴上不同的标签,诸如“优质学校”“示范学校”“重点学校”“省级示范校”“市级名校”,把大学按行政级别分成副部级大学、正厅级大学、副厅级大学或按水平分成“‘双一流’大学A类”“‘双一流’大学B类”、有一流学科的大学等,把学科、专业、课程贴上“一流”“优势”“特色”“精品”等标签;或者通过评价,把学生分成“三六九等”;或者通过评价,给人才戴上高低大小不同的帽子,诸如“长江”“黄河”“珠江”紫江”等大江大河类学者、“黄山”“泰山”等大山类学者,还有国家级、省市级等不同层次的学者,可谓五花八门,令人眼花缭乱;或者通过评价,把科学研究的课题也分成不同的级别,拿到国家级课题就比拿到省级课题高明,争取到的横向课题比纵向课题“低人一等”,如此一来,就把科学研究分出了等级、贴上了标签,实在荒唐,也着实可笑。这种通过评价给被评价者贴上“好或坏”“高或低”“优和劣”“重点和一般”等标签的做法,既脱离了教育评价的初心,也给某些被评价者带来了“心灵的创伤”。更有甚者,这种缺乏学理性的评价是在误导被评价对象“跑门路”“找关系”“寻捷径”,对提升教育教学质量毫无益处。从某种意义上说,当前高等教育领域存在的重科研轻教学等现象,与“标签化”盛行有很大的关系。
其三,官僚化。由于我国有着两千多年的封建史,某些教育行政部门、教育官员在开展教育评价活动的时候,官僚味十足。甚至在某些时候,教育评价的结果并不完全是由评价专家或评价专家组决定的,而是由主管部门或某些官员的主观好恶决定的,当然也有可能是某些领导拍脑袋决定的,评价因此变成了管理的手段,更可悲的是,还可能变成“权力的游戏”。中国特色社会主义进入新时代以来,教育评价中的“官本位”现象正在好转,但行政官员干扰评价的现象仍时有发生。
上述“三化”现象是教育评价的弊端所在,应着力加以革除。只有这样,教育评价改革才会有针对性,才能产生好的效果。
三、教育评价改革须立足于“兴三化”
国家把深化教育评价改革作为重点攻坚任务,视为“龙头之战”“最硬的一仗”,希望着力破解各种顽瘴痼疾,从根本上解决教育评价指挥棒问题,因此必须把握好教育评价改革的正确方向。大家知道,改革就是要尊重事物发展的基本规律以促进事物的可持续发展。如果我们背离了事物发展的基本规律,改革必然迷失方向,达不到应有的目的。那么,教育评价改革的规律是什么?我们可以从很多方面去探讨这个问题。但至少可以讲,新时代的教育评价改革,须立足于科学化、个性化和多样化,以体现教育的规律和特点。
其一,教育评价的科学化。教育评价是理性的活动,是一个科学探究的过程,评价是否具有科学性,关乎教育评价结果的可靠、可信程度,也影响着评价作用的发挥。因此,新时代教育评价改革应从评价理念现代化、评价制度科学化、评价管理高效化、评价内容全面化、评价文化人文化、评价主体多元化等方面着力,不断提高科学化水平。诚如《深化新时代教育评价改革总体方案》指出的那样,教育评价应该是客观的、准确的、公平的、公正的,应该具有科学的理性。教育评价的方法、手段和标准都应该科学化。为此,要不断创新评价工具,充分利用人工智能、大数据等现代信息技术,改进结果评价、强化过程评价、探索增值评价、健全综合评价,切实发挥教育评价的导向、鉴定、诊断、调控和改进作用。
其二,教育评价的个性化。教育的根本任务是立德树人,而人的发展是非常有个性的,不可能是一个模板、整齐划一地发展。事实上,由于受到历史、文化、民族、地域等因素的影响,我国在教育发展观、人才成长观、选人用人观上都存在偏差,特别是在学生评价中存在以分数给学生贴标签的错误倾向,教育的目的变成以追求高分数取代个性发展,这显然不利于拔尖创新人才的培养。然而,这些人才又是我们特别需要的。因此,教育评价改革必须打破这种不尊重个性、追求中庸和整齐划一的弊端,为促进人的个性发展创造条件。
其三,教育评价的多样化。事物是多样化的存在,教育现象也是复杂的,人民群众对教育的美好需求也是丰富多彩的,因此不可能用一个标准、一把尺子评价教育活动。然而,在以往的评价中,往往存在抹杀事物个性的弊端。比如学科评估,各大学为了追求更好的学科排名,普遍追求“大而全”,忽视“小而精”。一些学校搞“拉郎配”“东拼西凑”,美其名曰“整合资源”“做大做强”。更有一些学校围绕学科评估指标体系,千方百计搞“大而全”。如此一来,学科发展的特色被弱化,学校缺少了个性发展,学科发展的多样性和丰富性也不复存在,这不能不说是个遗憾。因此,《深化新时代教育评价改革总体方案》明确提出,要根据不同学科特点,坚持分类评价;要推行代表性成果评价,完善同行专家评议机制;要淡化论文收录数、引用率、奖项数等数量指标,突出学科特色、质量和贡献,等等。总之,要积极推进教育评价的多样化发展。
对新时代高等教育评估改革方向的思考
朴雪涛
我国社会发展已经进入新时代,作为社会大系统之一的高等教育系统必然要作出相应调整,以适应新时代、拥抱新时代和迎接新时代。教育评估制度是我国高等教育内外部治理的一个重要手段,也必然要按照新时代的要求进行改革,以便充分发挥我国高等教育根本制度、基本制度和重要制度的“制度优势”,提高高等教育治理的效能。
一、高等教育进入新时代的主要标志
我国高等教育进入新时代有四个方面的具体表现:一是我国社会主要矛盾发生变化。新时代我国社会主要矛盾转化为人民群众日益增长的美好生活需要和不平衡不充分的发展之间的矛盾,这必将导致高等教育的需求发生重大改变。一方面,人民群众不仅需要更多的高等教育服务,而且希望有更高质量的高等教育服务;另一方面,由于现代社会群体分化和分工的客观存在,不同社会群体对高质量高等教育的理解和认识也会有很大不同,对高质量高等教育的需求也必将呈现多样化的特点。二是高等教育进入普及化阶段。2019年我国高等教育毛入学率已经达到51.6%。未来几年,随着人口基数的减少和高校招生能力的提高,高等教育毛入学率还将持续增长。从大众化高等教育转向普及化高等教育必将从根本上重塑高等教育的观念、结构与制度安排。三是“双一流”建设与高等教育强国建设进入了攻坚期。我国高等教育在新时代已经开始从单纯的“跟跑”向“并跑”甚至“领跑”转变,高等教育的理念创新和制度创新也因此被赋予了新的历史方位,高等教育的制度自信和文化自觉也因此成为“双一流”建设和高等教育强国建设的重要内容。四是“双循环新发展格局”正在逐步形成。我国经济在未来将形成“以国内大循环为主体、国内国际双循环相互促进的新发展格局”。这种情况下,高等教育各类资源的流动也必将体现双循环的根本要求和特征。
二、新时代对高等教育评估改革提出的新要求
新时代对我国高等教育发展也提出了四个方面的新要求:一是要深化对高等教育质量标准多样化的认识,建设增值评估系统,承认众多“非学术标准”的合理性;二是要根据社会不同人群和不同组织对高质量高等教育的不同理解和需求,确定高等教育评估的标准;三是要完善高等教育的“中国之治”,建设中国特色世界一流的高等教育评估体系,从而将中国特色现代大学制度的制度优势转为治理效能;四是要对新发展格局下的高等教育战略目标进行分解,并根据新目标,重新确定高等教育评估的功能定位和标准。
三、新时代高等教育评估改革的基本方向
新时代高等教育评估改革应关注和推动如下四个方面的工作:
第一,规范评估边界。新时代我们开展高等教育评估要从根本上解决为什么评估(Why),评估什么(What)和谁来评估(Who)这几个关键问题。如果对上述问题的认识模糊或处理不当,就一定会带来高额的管理成本和制度创新成本,不仅评估的预期效能得不到实现,而且还会对高等教育发展的生态系统造成破坏。目前我国高等教育评估存在的主要问题并不是评估的技术性和程序性的问题,而是上述几个关键性问题还没有解决好,具体表现为评估偏好过热、评估指向过宽、评估主体过泛。改革开放以来,我国高等教育管理体制发生重大改变,在央地关系维度确立了两级管理、以省为主的宏观管理体制;在府学关系上确立了政府宏观管理和学校自主办学相结合的新体制。在这种新体制下,评估就成了中央政府管理地方政府和地方高等学校的重要手段。地方政府因为具有统筹发展地方高等教育的责任与权力,因此也会参照中央政府的办法通过评估手段来促进区域内高等教育改革发展。这种新体制与国际上高等教育管理主义和绩效问责的潮流形成了合流,从而导致了我国高等教育评估偏好过热,中央政府、地方政府、社会机构都积极开展高等教育评估。上述机构不仅开展总体性的质量评估,也开展专项评估。虽然说政府和社会对高等教育进行评估的初衷是好的,但如果“过热、过宽、过泛”的问题解决不好,就必然造成评估成本与评估效能不对称,评估成本高于评估收益。譬如过去5年,笔者所在的二级学院就接受了近10次评估,有中央政府的、有地方政府的,有学校开展的,有总体的,有专项的。每次评估都要填写大量的表格,要准备大量的佐证材料,这些繁忙工作浪费了基层管理工作者和教师很大一部分时间。更为重要的是,基层教育工作者似乎并不认同很多评估工作,经常带着负面情绪“被”参与到评估工作中,从而使评估难以起到“以评促建”的目的。因此,我们有必要出台专门化的政策法规,以规范高等教育评估行为,抑制评估偏好,给高等学校建立和完善质量保障体系和自我约束机制创造空间。
第二,回归评估初心。目前,在我国高等教育领域流行“排名情结”,从政府到社会机构都热衷于此。譬如,一些省份近年来开展的专业综合评价就是典型代表。这种评价是将区域内各个高等学校相同或相似的专业编为一组,然后通过数据分析和专家赋分的方式来决定各专业的分数,最后按照分数从高到低进行排名。专家是来自被评估学校相关学科的老师,因此他们既是运动员,也是裁判员。评估中将国家“双一流”建设高校的专业与省属、市属本科院校的专业一起进行评价。这种方式得出的专业排名往往很难被认可,还会造成大量的“制度意外”,譬如排名的目的本来是激励,可
结果却是挫伤。因此,我们应该清醒地认识到:评估不是目的,而是手段,并且也不是无所不能的手段,特别是有必要迅速终结高等教育评估的“排名情结”,回归评估初心。从高等教育质量保障的目的来看,高等教育评估可以分为三种:一是准入性条件评估。这类评估考察的是高等学校开设新专业或学位点时是否达到了相应的国家标准,结果是“允许”或“不允许”;二是周期性合格评估。这类评估是对高等学校开办的专业和学位点定期进行评估,追踪其办学资质是否达标,结果是“合格”或“不合格”,合格则允许继续举办,不合格则作撤销处理;三是项目制的绩效评估。这类评估是对各级政府和各类社会机构针对特定高等教育项目进行投入后的绩效考核,结果可分优秀、合格和不合格三级,用作决定是否继续支持的理由。除此之外的各类排行榜应该休止,特别是不应该由政府来制造越来越多的排行榜。
第三,聚焦真实质量。现阶段高等教育评估质量标准异化现象严重,具体表现为:以以往的“排名”为质量;以办学条件为质量;以政府“项目”和“帽子”的大小与数量多寡为质量;以表格填写的好坏为质量。不可否定,这几个方面能够在一定程度上体现质量,但这些都是质量的条件,而不是质量本身。在评估质量标准和实施程序内卷化严重的情况下,具有质量条件并不一定必然产生质量。因此,高等教育评估要从简单地依靠质量条件得出结论的误区中走出来,聚焦真实质量。那么,真实质量是什么?其实很简单,从专业建设来说就是学生的学习成果,从学科建设来说就是教师的学术成果。如果我们的专业和学科评估能认真研究如何从学生学习成果和教师学术成果中得出质量,那么就能真正做到“破五唯”,也才能真正得出科学的结论。
第四,基于直接证据。目前高等教育的评估依据和程序存在一些问题,大体上可归结为三个方面:一是教育评估迷信技术,且将计算方式和过程神秘化;二是教育评估面向表格,将评估抽象化;三是教育评估以数据为王,将评估简单化。甚至一些评估工作还将专家不进校作为一种经验来推广,认为这不会“扰民”,不影响正常的教学工作。
判断高等教育质量高低主要是一种主观判断,客观数据和表格审读的方式只是一种间接的证据,不可能将诸如立德树人成效等评估出来,立德树人效果评价的直接证据则体现于现场中感受到的“质量文化”。对学科建设质量的评估而言,官产学共同认可的东西可作为直接证据;对专业建设而言,学生的作业、试卷等可测量的东西应该作为质量的直接证据。
教育现代化背景下我国高等教育评价的特点、问题与对策
赵婷婷
中共中央、国务院印发的《深化新时代教育评价改革总体方案》,是新中国成立以来首次以国家名义颁发的关于教育评价改革的文件,因此它必将成为新时代我国各级各类教育评价活动及改革实践的指导性纲领。对高等教育来说,该文件对新时代高等教育评价的目的、宗旨、意义、评价对象、评价方式等做出了详细的阐释,也提出了很多新的要求和改革方向。如今,我们正处于实现教育现代化的重要历史时期,因此结合教育现代化的要求,深入思考我国高等教育评价存在的问题,按照方案的总体要求推进高等教育评价改革,破解高等教育评价中的难题,已经成为当前高等教育界的迫切任务。
一、把握教育现代化背景下高等教育评价的主要特点
新时代高等教育已经发生了巨大变化,相应地,高等教育评价所赖以存在的环境、所评价的内容、参与评价的主体、所使用的评价方法等都发生了很大变化。概括起来,我认为教育现代化背景下的高等教育评价具有以下两个主要特点:
一是高等教育评价日益多元化。首先是高等教育评价主体的多元化。评价是对事物属性满足实践主体需要程度或效果的评定与测量,评价主体需求、目的、价值观的多元性会导致评价目标、方式方法、侧重点等的不同。在教育现代化背景下,参与到高等教育中的利益主体日益多元化,从大的方面看就有政府、高校、社会等不同利益主体。即使在政府这一主体中,各级政府以及不同政府部门的评价目的和关注重点也是不同的,这就形成了不同的高等教育评价。其次是高等教育评价客体的多元化。由于当今高等教育的复杂程度日益提升,因此评价的对象和客体也变得越来越多元,教学、科研、教师、学生、高校管理、办学质量等都需要评价。可以说,高等教育评价几乎覆盖到高等教育的方方面面。最后是高等教育评价方式的多元化。由于评价主体和评价内容的不同,高等教育评价方式也日益多元化,既有过程性评价,也有结果性评价;既有基于专家判断的评价,也有基于数据分析的评价,还有基于大数据等技术手段的评价。应该说,教育现代化背景下教育评价方式已经发生了很大的变化。二是高等教育评价更加智能化。所谓教育现代化,既包括教育内容和制度体系的现代化,也包括教育技术和手段方法的现代化。高等教育评价是一个高度依赖信息收集、数据采集分析的领域,可以说,没有信息和数据就无法完成评价。因此,在当今时代,受到信息技术变革影响,高等教育评价也变得更加智能化,这主要体现在收集评价信息、分析评价结果和利用评价反馈等方面。首先,以往的高等教育评价信息主要来源于学校教务部门的问卷调查和数据统计,而今天大数据时代下的高等教育评价还可依托智能教学平台,通过搜集教师和学生的行为数据信息来进行评价。这不仅提供了高等教育评价的全新视角,而且提升了评价的客观性和全面性。其次,大数据时代信息技术的发展可以为分析高等教育评价信息提供更智能的方法。譬如,传统评价方法更侧重对现状的描述,而数据挖掘技术则不仅能展现更为多元和个性化的现状,更能深入分析发展变化的过程,并对未来发展做出预测,这无疑将为过程性评价和诊断性评价等提供更有力的支撑。最后,当今信息技术的发展将为高等教育评价结果的反馈提供更便捷的通道。在传统的高等教育评价反馈环节,一直存在着反馈不及时、无法很好体现个性化等问题。但是随着信息技术的发展,评价反馈变得更便捷,可以在课前、课中、课后任何时段进行;翻转课堂、及时教学等模式都是建立在及时反馈教学评价信息基础之上的。对整个高等教育系统来说,也能更及时地根据搜集来的信息进行调整和改进。
二、当前我国高等教育评价存在的问题及对策
当前我国高等教育评价主要存在以下四个方面的问题,必须采取有针对性的举措加以改进。
第一,基于多元主体的高等教育评价体系尚待完善。近年来,在高等教育评价领域,以政府为主的单一评价主体已有较大改变,社会各界、教师、学生等都参与到高等教育评价中来。但是应该看到,多元主体的评价体系还没有建立起来,表现在:一是各评价主体的参与程度有很大差别,以用人单位为代表的社会主体参与评价尚需制度化,教师在高等教育评价中的地位也需进一步提升;二是第三方评价机构的独立性仍需提升,大部分第三方机构仍具有较强的政府背景,无法真正实现管办评分离;三是还没有树立起构建基于多元主体的高等教育评价体系的意识,没有汇聚多方信息判断质量、从多主体视角评价质量、整合多主体评价提升质量的制度举措。
为此,未来高等教育评价应着重在以下几个方面改进:一是要认识到多元主体参与高等教育评价的必要性和重要性,尤其在教育现代化背景之下,高等教育的发展要与国家和社会发展紧密相连,而评价是反映和整合各方需求最重要的手段之一,因此多元主体参与评价是未来高等教育评价改进的方向;二是要将多元主体参与高等教育评价制度化,将用人单位评价、毕业生跟踪调查等评价常态化,并将其作为高校人才培养质量提升的重要依据;三是教师不应只是被评价对象,相反地,他们应是高等教育评价的重要主体,应充分发挥他们在学生学习成果评价、高校教学管理服务评价以及同行评价中的作用。
第二,部门思维导致高等学校整体办学质量评价成为盲点。长期以来,政府对高校实施的最主要的评价是本科教学评估,近年来又出现了关注学科发展、科学研究和研究生教育的学科评估。高等教育评价内容的这种划分主要还是基于政府部门内部的分工,教育部高等教育司负责本科教育工作,因此着重评估本科教学;而学位与研究生教育司负责学科建设和研究生教育,因此着重开展学科评估。这种划分高等教育评价内容的思路依然带有计划经济时代的部门思维。然而,教育现代化背景下,本科教育与研究生教育、教学与科研应该更好地融合在一起,高等教育评价也应努力促进其融合而不是割裂其融合。同时,部门思维也使得我国高等教育评价中缺乏对高校整体办学的评价,政府部门均局限在自己的业务范围内,高等学校的整体办学情况就成为评价中的盲点。
深入考察欧美高等教育评价会发现,其评价更多依赖民间组织、协会等机构。尤其是在美国,大量高等教育评价和认证工作都由民间协会、各种委员会承担。这种机制的好处,一是可以吸纳大量的社会力量参与到高等教育评价中来,二是可以更充分地反映各种评价需求,如不同类型高等学校可以组成认证协会,评价同类型高等学校的质量;各个专业也可组成协会,评价本专业人才培养质量。当然,我国高等教育有自己的传统和特点,但政府主导尤其是政府部门主导的高等教育评价已经显现出一些问题(如无法真正实现管办评分离,自上而下的政府评价难以兼顾不同类型高校的特点等)。因此,未来可考虑推动各类民间机构对高等教育的评价,政府可通过管理民间评价机构保证高等教育评价的有序运行。
第三,在高等教育评价技术和方法上的研究及推进比较缓慢。正如前面所说,任何评价都高度依赖信息和数据的搜集及分析,因此评价技术和方法在任何评价中都起到非常关键的作用。西方从19世纪中叶开始出现了教育测量运动,其核心主要是教育测量和评价技术的发展,他们对这一领域的研究至今一直在不断推进。反观我国教育评价研究发展历程,尤其是高等教育评价,关注的重点大多是评价政策、制度和体系,而对高等教育评价技术和方法关注不够。评价技术和方法不仅指定量方法和信息技术,它包括的内容很广泛,诸如运用各种手段对数据进行采集、筛选指标、研制测试、指标加权、增值计算、建立数据系统等。高等教育评价只有不断拓展评价的技术和方法,才能对所评价的对象有全方位的深刻认识。
近年来,国外的一些教育评价技术和手段已经进入我国教育领域,比如我国已经连续几年参加了国际中学生学术能力测试(PISA),测试结果也产生了较好的国际影响。未来我们应进一步结合中国高等教育人才培养状况,研制更多的这类高等教育评价和测试工具,为客观分析我国高等教育人才培养状况提供依据。政府应组织研究力量、依托智库和重大研究项目,研制适合我国大学生特点的教育评价和测量工具;学术界也应充分意识到这一研究领域的必要性和重要性,抓住机遇,在评价技术和方法的推进方面贡献自己的力量,从根本上提升我国高等教育评价的科学化水平。
第四,在高等教育评价反馈和持续改进方面仍需进一步落实。高等教育评价的目的是为了持续改进,但目前我国高校对待迎接评价和持续改进的态度差别巨大。在准备和迎接评价阶段,大部分高校都全员动员、一齐上阵,但是在持续改进阶段,一些高校的重视程度则急剧下降。学校内的教学评价也是如此,学生评教、听课督导、同行评价等的结果更多地只是用在绩效考核上,却很少根据评价结果扎扎实实地做持续改进的工作。这些做法使得评价流于形式,无法发挥评价的真正作用。
为此,高等学校应进一步转变观念,深刻认识高等教育评价在高等学校办学中的作用,杜绝形式主义,坚决破除“五唯”,将评价作为高等学校不断提升办学质量的重要一环,以评促建,以评促改,充分发挥高等教育评价在高等教育现代化建设中的促进作用。
“简化还原”的学科评价如何回归?
刘小强
中共中央、国务院印发的《深化新时代教育评价改革总体方案》提出要“改进学科评估”。那么,当前学科评估(价)的主要问题在哪里,应该如何改进?通过分析国内外几家主流学科评价的指标体系可以发现,当前我国学科评价中存在的最突出问题就是“简化还原”,将整体的学科层层简化、还原成几个片面的“核心”要素,严重歪曲和误导了学科建设。本文在这里采用“剥竹笋”的方法,按逻辑简要地分析当前学科评价中三个层次的“简化还原”问题,并尝试提出改进学科评价的方向。
其一,把对学科的评价“简化还原”为对学科
最终“产品”的评价——从对学科产品的评价走向对学科生产能力的评价学科水平当然最终表现为学科的产出水平,而学科产出的水平则体现在学科的“产品”上,诸如培养的一流人才、承担的高水平项目、产出的高水平论文、奖励、专利等等。学科水平决定了学科产品的数量和质量,反过来,学科产品则是学科水平的重要标志,也是判断学科水平高低的重要尺度和标准。所以,把对学科的评价“简化还原”为对学科产品的评价似乎没有错。
但是,这种“简化还原”在实践中却推动形成了“产品导向”的学科建设,引导高校仅仅围绕学科产品、甚至只盯着学科产品来建设学科,纯粹追求学科的“学术GDP”产出,在客观上带来学科建设的两个严重倾向:一是不顾及生产成本投入的学科建设,从而导致学科资源的极大浪费和学科生产的效率低下;二是“目光短浅”的学科建设,为了产品而产品,盯着产品做产品,忽视了学科本身素质和能力的提升,使得学科一旦建设激情消褪和大规模经费投入消失就失去了持续产出高质量产品的能力。显然,“产品导向”的学科建设仅仅是对学科产品的建设,而没有对学科本身进行直接建设。
虽然学科水平和学科产品关系密切,学科水平甚至决定了学科产品的质量和数量,但学科水平并不只是学科产出水平,学科产品并不等同于学科本身。对学科的评价不能只看学科产品的数量和质量,还要考虑其他几个因素。一是学科生产的成本效益。学科生产各种产品,它是要消耗资源的。学科评价需要考虑学科生产消耗的资源,这个问题在今天开始凸显。过去几十年来,学科建设一路都是“高歌亢进”,政府和高校对学科的投入不断增加。但是,随着近年来经济转入中高速增长,特别是新冠疫情爆发以来,政府提出要过“紧日子”“苦日子”,学科建设经费再保持以前那种年年增长、大幅增长的势头已经不可能了,今天很多高校预算甚至开始出现下降、打折运行的情况了。在这种情况下,学科建设的预算绩效和成本效益评价已经不可避免。二是学科生产的可持续性。社会对学科产品的需要不是短期的、权宜的,而是长期的、持续的,学科的产出水平不能简单绝对地表征为某一个时间点上学科产品的绝对数量和质量,还要看它能不能持续地产出高质量产品。显然,生产的可持续性也是学科水平的重要维度之一。三是学科产品的有用性。在知识转型和实施创新驱动发展战略的背景下,只有满足社会需要的产品,才是有效的产品,生产无效产品的学科生产,只是学科资源的浪费。所以,学科的产品是否有用、学科是否服务了经济社会发展,也是评价学科的重要角度。
尽管学科建设最终是为了产出更多更好的产品,但是学科评价不能只是对学科产品的评价。评价学科至少需要将学科产品的数量、质量与学科生产所消耗的资源、学科产出的持续性、产品的有用性等因素统筹起来考虑。从这个角度来说,学科的水平在根本上就是学科的生产能力,即学科在消耗一定资源的基础上持续稳定地产出又多又好产品的能力。学科建设在本质上是学科生产能力的建设,建设一流学科就是要建设一流的学科生产能力,学科评价也应该是对学科生产能力的评价,而不仅仅是对学科产品的评价。
改进学科评价,就是要采用系统的思维,把学科评价的对象从仅仅是学科产品回归到学科本身、回归到学科的生产能力,重视学科生产的成本投入和可持续性、有效性等因素。
其二,把对学科产品的评价“简化还原”为对学科的学术产品的评价——从纯粹的学术标准走向立德树人的根本标准
因为人才培养的效果很难在短期内显现,所以学科的评价者均有意无意地将学科培养的人才这个产品“忽略”掉,从而最终在评价实践中将学科产品简化为论文、项目、奖励等学术产品。学科的评价者和建设者也理所当然地认为这些学术产品的指标上去了,学科水平就一定上去了。显然,这是单纯学术标准的学科评价。
当前国际上主流的大学或学科排名几乎都是学术导向的,特别重视学术产品指标。如USnews大学排行榜的评价指标体系基本上是科研指标,几乎没有涉及人才培养[1]。泰晤士大学排行的指标体系中与科研相关的指标所占权重几乎达到了70%,即使在教学及其他方面的指标中,也有相当一部分是与科研紧密相关的博士生教育和知识转化等[2]。
ARWU的世界一流学科排名指标基本上是科研属性的指标,其“最好学科排名”的评价指标仅仅包括“高端人才”“科研项目”“成果获奖”“学术论文”等方面[3],基本上将人才培养排除在外,也可以算是比较纯粹的“科研评价”。而经常被作为一种学科评价的ESI学科评价,则更只是纯粹的论文引用频次的统计排行。
习近平总书记指出,我国独特的历史、文化和国情,决定了我国必须走自己的道路,扎实办好中国特色社会主义高校。中国特色的社会主义“特”在中国共产党的领导,中国特色的社会主义高校。“特”在哪里?那就是坚持立德树人的根本任务,坚持把立德树人的成效作为检验学校一切工作的根本标准,坚持培养拥护中国共产党领导和我国社会主义制度、立志为中国特色社会主义事业奋斗终身的有用人才。立德树人的根本任务体现在学科建设上,就是要把人才培养作为学科建设的中心任务,把本科教育作为学科建设的重要内涵;体现在学科评价上,就是要把立德树人的根本标准作为学科评价的根本标准。
所以,改进学科评价,就是要从过去简单的学术标准回归到立德树人的根本标准,既要重视研究生教育,也要重视本科教育,将本科教育作为学科评价的重要内涵;既要重视人才培养中的专业知识、能力,更要重视人才培养中的政治方向,将思政工作和教育作为学科评价的重要维度;既要重视科学研究,更要重视科研对人才培养的支撑和反哺作用等。
其三,把对学术产品的评价“简化还原”为对学术产品的学术影响评价——从专注学术影响评价走向关注社会影响评价
主流的学科评价在对学科的学术产品进行评价时,又将评价对象“简化还原”为只对学术产品的学术影响进行评价,即仅仅评价学术产品在学术共同体内产生的以被引频次、H指数等指标为代表的学术影响。但实际上,自1970年代中期以来,人类社会的知识和经济开始日益深度融合,融合带来的结果就是知识和经济的双重转型。经济的转型就是“知识经济”作为一种新的经济形态蓬勃发展,创新驱动发展作为一种发展方式开始盛行;知识的转型就是知识生产方式发生转变,知识生产的价值取向日益从“求真”转向“求用”,知识形态日益从“真理”走向“用理”。在这种情况下,大学走出了象牙塔,学术评价的标准发生改变,学术成果不仅要追求在学术共同体内的学术影响,也要追求其在经济社会发展中以贡献和效益为代表的社会影响。这在新世纪以来发达国家地区的科研评价政策改革中得到普遍反映。如荷兰2003年开始在作为政府科研评价框架的“标准化评估指南”(SEP)中设置“社会相关性”一级指标[4],欧盟于2009年启动了“基于科学与社会生产性互动的科学研究及其资助的社会影响评价方法”(SIAMPI)的项目,专门评价科研成果的社会影响[5];澳大利亚于2010年开始启用的“卓越研究”评价框架(ERA),就将“科研应用指标”设为四大一级指标之一,强调科研的社会影响[6];英国2014年启用的“科研卓越框架”(REF),较之此前使用的“科研评估机制”(RAE),其最大的变化便是用评价科研的社会影响的指标——“研究影响”,代替原来关注科研的学术影响的指标——“声誉”[7]。总的来看,这些科研评价改革最根本的变化就是从过去的学术维度拓展到社会维度,强调科研成果的社会影响。
今天,在我国深入实施创新驱动发展战略的背景下,“双一流”建设明确提出了“以支撑创新驱动发展战略、服务经济社会发展为导向”,一流大学和一流学科要积极主动呼应国家战略、紧密对接经济社会发展需求。在这种情况下,改进学科评价,我们对学科的学术产品的评价要从过去专注学术影响评价走向关注社会影响评价,不但要在学术水平维度上评价其在学术共同体中的学术影响,还要在服务能力的维度上评价其在经济社会发展产生的社会影响。
参考文献:
[1]How U.S.News Calculated the Best Global Universities Rankings[EB/OL].(2019-10-21)[202 0-04-27].https://www.usnews.com/education/best-global-universities/articles/methodology.
[2]The World University Rankings2020:Methodology[EB/OL].(2019-09-02)[2020-04-27].https://www.timeshighereducation.com/world-university-rankings/world-university-rankings-2020-methodology.
[3]2019软科中国最好学科排名[EB/OL].(2019-10-30)[2020-04-27].http://www.zuihaodaxue.com/news/20191030-1063.html.
[4]VSNU,KNAW,NWO.Standard Evaluation Protocol 2015-2021:Protocol for Research Assess-mentsin the Netherlands[EB/OL].(2014-03-21)[2020-04-08].https://www.knaw.nl/en/news/publications/standard-evaluation-protocol-2015-2013-2021?set_language=en.
[5]SIAMPI Approach[EB/OL].(2012-07-24)[2020-03-03].http:/www.siampi.eu/12/642.bGFuZz1FTkc.html.
[6]Guthrie,S.,Wamae,W.,Diepeveen,S.,Wooding,S.&Grant,J.Measuring Research:A Guide to Research Evaluation Frameworks and Tools[M].Virginia:RAND Europe,2013.
[7]Research Excellence Framework(REF2014).Key Facts of REF2014[EB/OL].(2015-01-23)[20 20-04-25].https://www.ref.ac.uk/2014/media/ref/content/pub/REF%20Brief%20Guide%2020 14.
新时代教育评价体系构建的思考
司林波
《深化新时代教育评价改革总体方案》是教育评价领域的一份纲领性文件,凸显了教育评价在新时代教育事业发展中的重要地位。加快推进教育现代化、建设教育强国、办好人民满意的教育,科学的教育评价体系至关重要。教育评价犹如一把双刃剑,在教育治理中发挥着指挥棒作用。教育评价改革就是要扭转不科学评价的导向作用,发挥教育评价的积极正向功能;要实现教育治理的现代化,就必须实现教育评价的现代化,建构起与新时代教育现代化目标相一致的教育评价体系。这也是教育评价改革的重点内容。教育评价的指挥棒作用发挥得好,就能取得好的治理效果。教育评价的现代化决定着教育治理效果的好坏,也是衡量教育治理能力的重要标准。新时代教育评价改革的目标就是构建符合中国实际、具有世界水平的教育评价体系[1],而教育评价现代化取决于教育评价体系的设计和构建,是教育评价体系完成和实现教育评价目标任务的能力体现。要实现教育评价的现代化,必须首先实现教育评价体系的现代化。教育治理能力的强弱受制于教育评价体系构建的科学性、有序性和有效性程度。
从公共治理的角度来看,教育评价体系的构建,必须回答和解决如下几方面问题,才能有目的有方向地寻求有效的因应之策和治理之道。
第一,新时代教育评价体系构建必须首先解决教育评价体系构建的逻辑起点问题。逻辑起点问题是教育评价体系构建中最本质的内容,可以说是教育评价体系的灵魂,决定着教育评价指挥棒的功能及指向,实际上也直接决定了教育评价改革的方向,间接影响了教育评价改革的路径选择和实践效果。解决教育评价体系构建的逻辑起点问题,具体来说就是要明确教育评价改革的指导思想、主要原则和改革目标,也就是我们称之为教育评价的价值体系问题。教育评价是指挥棒,理念决定行动,价值体系决定着指挥棒的指向问题。教育评价效果的好坏,表面上看可能取决于这个国家教育评价制度和评价机制的设计,还可能受到评价方法和手段的影响,但根本上取决于这个国家或评价主体在教育评价中秉持的指导思想、原则和目标定位。不同的评价指导思想和原则会产生截然不同的评价目标选择,不同的评价目标选择则会产生不同的评价效果。教育评价价值体系的作用不仅体现在教育评价主体评价目标的选择上,长期来看还将深深影响教育评价文化的形成,影响我们对教育目的和教育价值的正确判断。
第二,新时代教育评价体系建设是一个复杂、庞大的系统工程,由谁来负责,评价主体之间的权责关系如何配置?这就是教育评价的结构体系建设问题。西方公共治理理论告诉我们应该多元共治,共同来建,在评价主体的多元化上毋庸置疑,但新公共服务理论的核心观点则将政府定位为“服务而不是掌舵”。这显然不符合我国的国情。中国的教育治理现代化和新时代教育评价体系建设,要坚持世界眼光、国际标准,但更重要的是要打造中国特色,体现中国的制度优势。在谁负责的问题上,必须坚持党的坚强领导,坚持党和政府掌舵角色,新时代教育评价体系的建设必须在党的领导下,由政府牵头来做。各级党委和政府作为最重要的评价主体,一方面必须尽快扭转不科学的评价价值思维,另一方面必须推进科学履行职责,率先垂范,为在整个社会形成科学的评价导向做好服务工作。因此,掌舵是中国特色、服务是国际标准。明确新时代教育评价的结构体系,就是要处理好评价主体间的权力和责任配置关系问题,权责关系的明确是实现评价主体间评价行动协调有序的前提和基础。当前我国的教育评价主要以政府的一元评价为主,虽然有些社会组织参与评价,但独立性不够,难以做到客观评价;另外,一些民间评价组织,商业意味浓厚,评价公信力受到质疑。因此,必须大力推进评价主体的多元化,形成党委和政府、学校、社会组织、受教育者、市场主体等多元评价主体协同参与的评价结构体系。这也是完善教育治理体系建设和提升教育治理能力的本质要求。
第三,新时代教育评价体系建设不仅承担着全面实现教育现代化目标的重要任务,也承担着推进教育治理体系和教育治理能力现代化建设的重要使命。因此,要完成教育评价体系承载的重要任务和使命,就必须明确教育评价体系的基本职能和目标任务,这就是教育评价的功能体系建设问题。新时代教育评价功能体系的内容直接受制于两方面因素,一方面是价值体系所确定的教育评价的指导思想、原则和改革目标,另一方面则受制于结构体系确定的治理主体间的权责分配关系。因为,功能是结构的功能,教育评价的功能必然受制于教育评价结构体系的权责分配关系,以及评价主体内部的层级关系。功能体系是教育评价体系的基本内容,决定着教育评价体系为何存在以及其使命担当的基本问题。我们的教育评价体系应该承担什么样的功能呢?首先就是立德树人的功能。对政府工作的评价、学校的评价、教师的评价、学生的评价和用人的评价,最终目的都是为立德树人服务的。以人才培养为中心,培养德智体美劳全面发展的社会主义的建设者和接班人是评价改革要实现的根本目的。其次,当前的教育评价改革还要承担“破”与“立”的功能。破除不科学的评价标准,树立科学的评价导向。值得强调的是,“破”必须坚持适度原则,过犹不及,“破五唯”是为了实现“五不唯”,而不是“五不要”。也就是说,在教育评价中完全否定分数、升学、文凭、论文、帽子等要素在教育发展、人才成长、选人用人中的作用也是不正确的。在“破”的时候,我们还要“立”,“破”是前提,“立”才是目的。
通过“破”“立”并举,推进教育评价关键领域改革取得实质性突破,引导全党全社会树立科学的教育发展观、人才成长观、选人用人观,这才是教育评价改革要实现的根本功能目标。
第四,新时代教育评价体系建设的重要内容就是完善立德树人体制机制,扭转不科学的教育评价导向,建立起科学的评价导向,这必须依赖于教育评价制度的改革。推进教育评价制度改革,建立起适应新时代教育发展、人才培养和用人导向的教育评价制度体系,是教育评价改革能否取得成功的基础性条件。教育评价制度体系是新时代教育评价体系建设的主要内容和集中体现,涉及教育评价的法律依据、制度设计和实施方案等方方面面的制度性规定。首先,必须健全教育评价的法律法规,通过法律规范明确落实各级评价主体的权责利、明确评价的基本内容和标准,以及评价的基本流程和采用的评价方法等;其次,教育评价制度设计必须坚持统筹兼顾,针对不同主体和不同学段、不同类型教育的特点,分类设计、稳步推进,体现不同类型评价对象的各自功能和个性化特征,确保评价的科学性和有效性;最后,教育评价制度改革必须坚持以人才培养为中心的导向,把促进各级各类评价对象落实立德树人的育人功能的发挥放在首要位置,不断改进评价方式和方法,改进结果评价,强化过程评价,探索增值评价,健全综合评价,逐步探索科学有效的评价制度体系。教育评价制度体系的完善可以为教育评价体系建设提供了制度化的规范与保障,是教育评价体系的核心和基础,决定着教育评价改革的成败,也是当前我国教育评价改革重中之重的内容。
第五,建立科学的教育评价制度是新时代教育评价体系建设的基础,是实现教育评价体系现代化的核心内容,而教育评价运行体系的建设则是检验教育评价体系建设成效的关键。教育评价体系的运行,涉及到多主体、多部门、多层级,甚至是不同层级评价主体之间的协同问题。因此,教育评价改革,必须建立起多元主体参与的上下贯通、纵横交错、内外结合的教育评价协同机制。可以说,如何建构起协调有序的多主体参与的协同运行体系是教育评价体系建设的重要内容,也是决定教育评价体系运行成效的关键。同时,如何选择和使用有效的评价方式和评价手段也是教育评价运行体系取得实效的重要保障。新时代教育评价改革不仅要实现评价主体的多元化,而且还要落实评价方式和评价手段的多元化,通过多元化的评价方式和评价手段的综合使用保障教育评价运行体系的有效运转,提高教育评价效率和评价效果。新时代教育评价必须发挥先进科学技术手段的功用(如教育大数据的使用能够提高教育评价效率和评价效果),但技术手段的绝对化也可能带来评价的片面化和不公平(如家庭出身和社会环境因素的差异往往被忽视)。因此,教育评价的方式和手段的选择必须在社会公平性和评价有效性之间把握好一个合理的度。
综上所述,新时代教育评价改革的重点在于教育评价体系的构建。教育评价体系的构建是一个系统工程,其内容体系至少涉及教育评价的价值体系、结构体系、功能体系、制度体系和运行体系等基本要素。为了提高新时代教育评价体系建设的针对性,必须重点把握教育评价体系的基本要素,有针对性、有步骤地推进教育评价改革总体方案的逐步落实,最终建构起富有时代特征、彰显中国特色、体现世界水平的教育评价体系。
参考文献:
[1]教育部负责人就《深化新时代教育评价改革总体方案》答记者问[EB/OL].(2020-10-14),[2020-10-22]http://www.gov.cn/zhengce/2020-10/14/content_5551355.htm.
责任编辑:王慧