高等教育增值评价：缘起、争论及反思胡娟徐鑫悦-西南大学西南民族教育与心理研究中心

高等教育增值评价：缘起、争论及反思

作者：胡娟，徐鑫悦

阅读数：63次

来源：《复旦教育论坛》2022年第6期

摘要：高等教育增值评价具有复杂多样性，其发展历程和相关争论较能展现增值评价面临的挑战。发展经历了理念萌芽、实践探索与反思改造三个阶段，争论主要围绕评价方式的科学性与公平性、评价过程的准确性与有效性、评价结果的诊断性与应用性展开。高等教育增值评价注重能力变化和就读体验，强调“努力”和“进步”，是对传统评价模式构建的“理性神话”的突破，但也存在一些局限。在我国发展高等教育增值评价不仅要科学探索如何测算“增值”，更要理性思考如何使用“评价”，注重评价的价值追求。

关键词：高等教育；增值评价；教育评价；优绩主义

一、问题的提出

教育评价作为教育改革发展的重要环节，深刻影响着教育发展方向和办学导向。2020年10月，中共中央、国务院印发《深化新时代教育评价改革总体方案》，明确指出要破除“五唯”、扭转不科学的教育评价导向，并提出要“改进结果评价，强化过程评价，探索增值评价，健全综合评价”，首次从国家指导层面提出了“增值评价”的概念，表明新时代教育评价工作迫切需要新的举措与尝试。“增值评价”也因此成为当前中国教育研究领域的热点主题之一。

早在20世纪90年代末，“增值评价”的概念便已引入我国。1996年香港教育统筹委员会发布的《优质学校教育》报告中提出了对学校教育质量的增值评价，引起了内地学界的广泛关注。国内已有研究主要集中在对增值评价的概念、方法及应用进行介绍；同时，借鉴国外增值评价工具展开的一些全国性、地区性调查也在推进，在高等教育领域的大型调查就有清华大学借鉴“全美大学生学习性投入调查”（National Survey of Student Engagement，NSSE）并结合中国实际于2009年发起的“中国大学生学习性投入调查”（NSSE-China）、北京大学在参考NSSE等调查的基础上结合我国高等教育发展和学生群体特征实施的“首都高校学生发展调查”等。从已有研究来看，我国高等教育界对增值评价的研究尚处在初步引进阶段，虽已有一些颇具规模的实践，但仍缺乏对增值评价所面临的争论和深层次问题的追本溯源的梳理分析。厘清这些争论和问题，对于理解并把握增值评价的实质、在实践中有效探索增值评价有着重要意义。

之所以选取高等教育领域的增值评价为研究对象，是因为高等教育评价更加复杂，标准更加多样，更能体现增值评价的本质与面临的挑战，因此更具有代表性。那么，到底什么是高等教育增值评价？在高等教育领域围绕其发展有哪些争论和问题？我国在实际运用增值评价时应当注意什么？

二、高等教育增值评价的缘起与发展

“增值”原本是经济学中的概念，通常指用于生产产品的原材料成本或供给成本与产品价值之间的差额。在高等教育语境中，“产品”即为学生，“价值”为学生所拥有的知识和技能，将学生进入大学前后所具备的知识和技能相比较，之间的差异便被认为是高等教育带来的增值，目前这一理念已被广泛应用于英美等国家及地区的高等教育评价领域。“增值”理念在教育评价中历经由萌芽到发展再到实践的演化过程，高等教育增值评价也从理念的初步迸发，到实践探索，再到反思改造，逐渐成为一种被广泛采用的评价方式。

（一）第一阶段：理念萌芽时期

关于增值评价理念的缘起，许多学者认为应追溯到1966年的《科尔曼报告》。该报告认为教育机会均等不能仅局限于依靠平等的投入来衡量，而应将关注的重心转到独立于家庭背景的学生学业成就，对教育投入与产出进行综合分析的思维客观上带出了增值的理念，促生了增值评价方式，为高等教育增值评价的萌生奠定了思想基础。

1970年，加州大学洛杉矶分校高等教育研究所创始主任阿斯汀（Astin）在一项关于大学影响的研究中提出了“输入-环境-输出”模型（input-environment-output model，IEO）。“输入”指“学生投入”，即新生入学时就已具备的才能、技能、志向以及其他成长和学习的潜力；“输出”指“学生产出”，即学生的成就、知识、技能、价值观、态度、志向、兴趣和日常活动；“环境”为“大学环境”，指大学对学生产生影响的各方面，包括行政政策和实践、课程、校舍和设施、教学实践、同行协会以及大学环境的其他特征。该模型旨在衡量学生的输入和输出情况，以此来推断大学是否以及如何给学生带来影响。阿斯汀综合考察了学生的输入输出和大学之间的关系，虽然尚未明确提出“增值”的概念，但证实了大学环境对学生发展的影响，为早期高等教育增值评价提供了理论支持。

在这一阶段，研究者们跳出以往结果性评价追求单一标准的思维框架，开始关注教育投入与产出，试图解释学校教育是如何对学生发展产生影响的。特别是阿斯汀的IEO模型，为高等教育增值评价提供了理论基础，增值理念开始萌芽，增值评价开始进入人们的视野。

（二）第二阶段：实践探索时期

1975年，美国东北密苏里州立大学校长迈克柯兰（McClain）构思并初步实施了针对该大学的增值评价计划，通过跟踪学生的大学经历来分析大学对学生成长的影响。该计划有3个主要目标，即了解学生潜能、证明大学对学生生活产生了积极影响以及证明该校毕业生在全国范围内具有竞争力。评价方式是分别在学生入学时、大学就读期间、毕业前和毕业后进行问卷调查。调查结果被用于改善课程教学，帮助大学明确并振兴使命。尽管东北密苏里州立大学的评价计划没有系统地介绍增值的概念，其评价模型被宽泛地称为增值模型，但这却是早期大学注重学生成长变化并采用增值评价的创新尝试，其经验为其他大学提供了有益借鉴。

20世纪70年代初期，美国高等教育进入普及化阶段，呈现出多元化的发展特征，然而教育质量却参差不齐。1983年，美国国家卓越教育委员会发布了《国家处于危机之中：教育改革势在必行》报告，特别关注学校的教学质量，提出要回归学校教育的根本目的，助力学生在大学取得显著进步，并指出卓越教育的目标应当是“最充分地发展所有人的才能”。该报告带动了美国各州的教育改革，学校问责制被提出，增值评价作为回应问责的重要手段得到施行。这一时期，“增值评价的先行者”——田纳西州的改革产生了重要影响。该州于1992年实行了田纳西增值评价系统（Tennessee Value-Added Assessment System，TVAAS），并于同年通过了《教育改进法》，明确要求将TVAAS作为对教育者进行的绩效评价方法，增值评价在教育实践中的地位由此得到了立法肯定。虽然TVAAS主要面向基础教育阶段，但该模式实践的成功以及合法性的获得对推动高等教育增值评价的发展具有重要意义；该系统对教育效能评估的一些技术方法也被大学生学习评价（CLA）、美国教育考试服务中心水平轮廓考试（EPP）等高等教育评价工具所借鉴。

这一时期高等教育增值评价由初发理念转向付诸实践，成为衡量并提升教育质量的重要手段。增值评价明确了学生的主体地位，关注学生在接受教育后的成长变化，评价结果也被作为学校问责的依据。该阶段的探索为高等教育增值评价的后续应用扩展提供了可能性。

（三）第三阶段：反思改造时期

20世纪90年代以来，高等教育增值评价从理论到实践持续发展，多种基于增值理念的评价模式和工具被开发出来。1999年，美国国家中学后教学改进中心设计并实施了“大学就读成果调查”（Collegiate Results Survey，CRS），通过访谈了解学生毕业后6-9年在工作中所需的技能和能力，并让受访者评价大学教育在多大程度上满足了这些需求，从而考察大学教育带来的增值。

“全美大学生学习性投入调查”（NSSE）创始人库（Kuh）认为，评价一所大学教育质量高低的核心要素是学生参与程度。可以从两个层面就学生参与度进行院校评价：一是学生在学习及其他教育活动中投入的时间和精力；二是学校如何配置资源、组织课程和其他学习机会以有效促进学生参与。库提出的学生参与理论丰富了增值评价，也成为设计NSSE的重要理论基础。2000年，NSSE在全美范围内启动，通过调查收集一年级和高年级大学生参与学校为其学习和个人发展提供的计划和活动的信息，来考察高等院校的教育质量。

同年，美国教育援助委员会发起了国家增值评价倡议，在此倡议下开发了“大学生学习评价”（Collegiate Learning Assessment，CLA）等评价项目，旨在通过衡量本科教育对学生的影响来评估教育质量。以往大多数质量评价仅基于毕业率、同行评议、声誉排名等指标，但这些指标并不是从高等教育本身出发对学生学习进行系统而直接的衡量，忽略了学生在大学中获得的知识和能力，忽视了高等教育的复杂性和多样性，而CLA关注大学教育对学生成长变化的影响，并侧重考察学生的批判性思维、问题解决等高阶思维能力。

这一时期学生参与理论的提出进一步扩充了增值评价的理论基础，增值评价在实践的检验中得以不断反思、改进。NSSE和CLA的推出及完善，说明高等教育增值评价已经脱离了以学生成绩为测量指标的简单状态，进入了一个注重学生能力变化和就读体验的新时期。除上述评价工具外，具有代表性的还有美国教育考试服务中心水平轮廓考试（ETS Proficiency Profile，EPP）、学术能力与进步测试（Measure of Academic Proficiency and Progress，MAPP）、大学生就读经验问卷调查（College Student Experience Questionnaire，CSEQ）等。

这些评价工具使用的方法可分为直接法和间接法，主要区别在于信息来源的不同。直接法为直接测量与评价，直接对比学生在多次标准化测试中的得分，剔除外界影响后结果的差值即为增值量；间接法为间接调查与评价，主要通过学生自主汇报在教育活动中的参与程度和自我评价就读体验来反映增值情况。表1（表1略）列出了两种方法的主要评价工具、指标及测量方法。经过半个多世纪的发展，增值评价作为一种发展性评价方式被实际运用于不少国家和地区的高等教育领域。增值评价是通过对比学生入学成绩、能力起点与接受学校教育的结果，来考查学生学业成就的“增值”，据此判断学校教育对学生的影响。高等教育增值评价则是指追踪大学生在不同时间点上的学业成绩、能力变化或就读体验，并利用一定的统计方法对变化情况进行分析的一种高等教育质量评价方式。

三、关于增值评价及高等教育增值评价的争论

增值评价是对传统教育评价的一种变革和补充，从提出到被理解和接受经历了一个循序渐进的过程，这也是一个不断回应质疑并在质疑中改善的过程。相较于基础教育，高等教育机构的层次类型更加多样，学校担负的教育功能与育人过程更加复杂，更容易受到知识生产模式和技术变革的影响。因此，高等教育增值评价需要考虑的因素和克服的困难也更多。围绕高等教育增值评价的争论既有增值评价的共性问题，也有特性问题。梳理发展过程中的关键争论，有助于更好地理解和把握高等教育增值评价。

（一）理念之争：关于评价方式的科学性与公平性

关于增值评价最基本的争论围绕增值的理念展开，主要探讨评价方式的科学合理性及公平性。支持者认为，增值评价不同于静态的总结性评价，是具有动态特征的发展性评价方式，是对以测量、描述和判断为主的前三代评价方式的改进，符合注重个体与环境互动的第四代评价的原则。传统的评价方式一般得到的是单次的、绝对的结果，对学校和学生的评判比较片面。例如，安德烈科（Andrejko）的研究表明，按照传统的方式评价，宾夕法尼亚州的学生成绩低于全国及邻州学生的平均水平，但在增值评价方式下，该州的学校在学生成绩增值方面表现良好，甚至是邻州水平的三倍。增值评价不以成果的绝对值为参考，而是注重成长的相对值，改变了以往使用平均值或其他标准进行比较的模式，不用单一标准评判不同基础的学生，也更有利于增强学生和学校发展的主动性。同时，增值评价可以将学校的教育作用从众多非教育性因素中分离出来，如家庭背景、学校经费等，进一步保证了评价的相对公平性。质疑者则认为，每个人都可能比他人更容易学习或掌握某方面的知识或技能，这种个人禀赋的特殊性会使相同的学校教育体现在不同学生个体上的效果差异较大，增值评价很难测量出个体差异性造成的教育效果差异。

聚焦到高等教育增值评价，理念之争不仅反映在个体禀赋上，也反映在机构效率上。在个体禀赋上，支持者认为高校的教学质量评价对学生发展的回应应当走近个体学生，正因为不同受教育者的“增值”大小不等，说明增值评价尊重了个性化差异。质疑者则认为，学生存在的个体差异使得增值评价难以进行，因为学校贡献很难测量；大学教育与基础教育不同，其目标不仅是传授知识，更是挖掘潜力和培养全人，而这是一件很难评估的事情。而且，因为高等教育层次类型较为多样，增值评价难以反映机构的实际效率，运用增值评价对机构进行比较的适切性仍有待商榷。麦克米兰（McMillan）认为高校有着各自的使命、目标、历史及课程，往往会吸引独特的学生群体，每个机构所提供的教育都是独一无二的。哈维（Harvey）与格林（Green）则举例论证，牛津、剑桥带给优秀学生的增值可能反而较小，而技术类院校带给稍弱学生的增值可能较大，但是否就可以说牛津、剑桥的教育质量不如技术类院校呢？显然不能仅凭增值结果进行院校间的比较。

（二）过程之争：关于评价过程的准确性与有效性

增值评价的第二个重要争论在于过程方面，围绕增值评价的准确性与有效性展开，具体包括问责效用和指标选取。2004年美国《教育与行为统计》杂志以专栏的形式发表了一组文章，学者们就增值评价展开了探讨。以特克维（Tekwe）等人为代表的支持一方对学校绩效增值评估的四种统计模型进行了分析，从统计学角度证明了增值评价结果的准确性，为把增值评价作为问责的依据提供了支持。而劳登布什（Raudenbush）认为，影响学生增值的实际上是学校实践，包括学校管理和教师教学，然而学校实践既无完全定义也不能被观察到，因此不能判定学生学业成就中哪些部分受到学校管理及教师教学的影响，无法得出因果结论。麦卡弗里（McCaffrey）等人赞同劳登布什的观点，反对将增值评价作为问责的依据，认为需要建立实证数据库来匹配增值评价的指标与教师效能的联系。还有研究者指出，不同学科标准会对增值分数产生影响；学校或教师还会采用策略去适应评估，导致增值分数变得不可靠。也有研究者认为，评价分数在学校层面是可靠的，但是从学生个体层面来看，仅通过学生回答有限数量的问题来判断能力，其可靠性值得商榷。

尽管一些工具和方法已经在尽可能剔除外部因素的条件下考察了大学生的学习发展，不少研究者依旧对评价内容和指标选取提出了疑义。卡罗尔（Carol）认为，增值评价方式尚未回应大学在帮助学生获得能力上取得哪些进展，在离开学校后学生遇到问题时能否运用这些能力，应当采取增值评价与总结性评价相结合的评价模式。贝内特（Bennett）认为，大学并非致力于培养学生的单一能力，因此在衡量增值时需要考虑不同的价值维度，这就涉及评价指标的多元化，目前的评价指标和价值维度显然是不够的。贝尔德（Baird）则指出，增值评价在用于评估大学的专业教育和通识教育上存在难点，因为专业教育和通识教育都可能涉及不同学生主体、学习顺序、课程组合等差异问题，因此很难做比较。

（三）结果之争：关于评价结果的诊断性与应用性

关于增值评价结果的争论主要围绕评价结果是否有诊断意义、该如何应用等问题。支持者认为，增值评价关注的是学生的学习发展，反馈结果能使学生更好地了解自身的成长，并能随着时间的推移进行自我提升。同时，增值评价提供的数据有助于改进课程和教学，并可得出教育机构对学生影响的相关结论。增值评价对增值与发展的关注决定了它的可追踪和可重复性，这种“不以一次成败论英雄”的多次测评方式更有助于了解学生的进步情况，分析学校层面和学生个体层面等各种因素对学业成绩发展变化的影响效应，从而进行诊断，为教育质量改进提供更具体的方向。在高等教育增值评价当中，对评价结果的诊断性持肯定态度的学者认为，增值评价在追踪评价的过程中能够提供诊断性预测与反馈。教育评估的根本目的是激励和帮助学校改进教育工作，特别是有关人才发展的评估，其用途主要是反馈，收集有益信息服务于相关各方，而不是仅仅用来判断谁是合格或不合格的。也有研究者对增值评价的结果使用提出了疑义，如皮克林（Pickering）和鲍尔斯（Bowers）认为，增值评价结果的实际意义比统计意义更值得分析，要按照不同的课程目标及实际情况对结果进行分类讨论。他们进一步提出，学生在某方面进步显著可能是由于教师在课程中对该领域强调得过多，而学生在某方面没有进步可能是由于这些领域需要更高阶段的培养，因此对学生成绩、能力、素养的增值分析要视实际情况而定。贝内特关注到教育成效的滞后性，认为大学教育对学生的增值或许在数年后才得以展现，因而需要评估的对象是毕业数年的校友，而不是即将毕业的高年级学生。芬奇（Fincher）认为当前的教育理论或政策并不能为增值评价在高等教育中的开展提供指导，增值评价也不能具体解释大学课程安排、专业领域、大学氛围、教学方式方法和教学质量是如何给学生学习结果带来影响的。舍米斯（Shermis）认为大学生学习评价的目的是大学的自我改进，而不是将大学教育作为一种商品，用评价结果将不同大学进行排序。大学和教师应该探索的是如何满足学生的教育需要而不是避免被问责。

（四）争论小结

归纳关于高等教育增值评价的争论，可以看到在理念、过程和结果上几乎都有正反两方的观点（见表2）（表2略）。就理念而言，支持者认为高等教育增值评价关注相对成长，分离了非教育性因素，具有相当的科学性和公平性；质疑者则认为增值评价无法考虑高等教育机构与学生的特殊性，不适用于不同类型院校间的比较。就过程而言，支持者认为评价过程具有统计意义，能够较为准确地反映个体或院校的增值以回应问责；质疑者则强调增值评价会受到诸多方面的影响，难以回应问责。就结果而言，支持者认为增值评价能为人才发展提供反馈信息，可用于教育改进；质疑者则认为缺乏理论指导及共识，需对结果进行分类讨论。

四、反思：高等教育增值评价的局限与挑战

增值评价缘起于对结果导向、单一标准的传统评价模式的批评。从某种意义上看，建立在既有成果和基础上的传统评价模式是一种静态的、截面的评价，不能反映起点的差异，这种评价结果往往会造成已有优势的结构性传递，使得一些原有基础好的学生和学校的固有优势通过评价的方式得到进一步固化和加强。这种评价模式把“赢者”的某些特征标准化，设置卓越模板，形成“理性神话”，极易带来模仿效应和规范效应，造成“赢者通吃”和“马太效应”。增值评价摒弃了这种评价上的“出身论”，通过强调“增值”和“后天努力”，突出了“进步”“个性”和“多元”的意义，突破了既得利益者在评价领域构建的“理性神话”，体现了民主的力量，这与20世纪下半叶高等教育普及化、民主化和多元化的浪潮是一致的，是时代精神在教育评价上的体现。然而，对“理性神话”的突破并不意味着高等教育增值评价就一定能走上科学理性的坦途，它在当前至少存在以下局限：

（一）工具主义惯性

从高等教育增值评价的现状和争论可以看到，无论是从评价理念还是评价手段来看，增值评价并不能真正跳出工具主义和标准化的套路。以相对成熟并具有代表性的CLA为例，尽管它不再像以往的评价那样仅基于毕业率、同行评议、声誉排名等指标，但依旧使用一种标准化的测试方式，通过对学生进行多次标准化测试，直接对比能力变化以获取差值。这种标准化的定量方法的可靠性和价值导向都值得怀疑。库就认为，CLA评价中大学最终的评价分数是由学生分数汇总产生的，学生得分误差量的复合会将额外的错误引入大学得分中，因此很难对大学分数进行有意义的解释。把增值评价作为问责依据这一工具导向则很容易扭曲增值评价，如果政府以此作为问责的依据，将会使教师的教学选择趋同——因为大学和教师将不再愿意做有风险的创新和尝试，而会通过趋同的策略来获得评价上的好成绩。相较于CLA，NSSE在理念上更加注重个性化和个体感受，但依旧是在人为设定的有限维度下，通过计算频次和时间投入量的模糊计数方式来进行增值测量。所以，现有的增值评价未能避免方法上的工具化和标准化等问题。

（二）优绩主义陷阱

增值评价对什么是好的高等教育质量依旧只是在有限维度内进行定义，规定了某种卓越的模板，并没有能够避免现代社会流行的优绩主义。

所谓优绩主义（meritocracy），是主张社会与经济的奖赏应当依据才能、努力和成就这些“优绩”来决定。相对于强调出身、财富和世袭的观念，优绩主义显然具有相当的进步性。因为它勾画了一种理想社会，这种社会相信人们的命运掌握在自己手中，成功不受制于外在的环境力量，个人是命运的主人，只要够努力、有天分、有梦想，想飞多高就能飞多高。这实际上许诺了一种愿景，即只要人们具备才能并愿意努力，就能够获得上升的机会，人人都有平等地获得成功的机会。

增值评价似乎体现了这种理想和许诺，力图剥离不可改变的先天因素，只评价学生或学校的“努力”与“进步”，但是这种理想在现实中就会变得骨感。就像优绩主义在现实中碰到的问题一样，不但没有实现更大的平等，反而加剧了差距；因为它存在一个根本性的假设问题，它预设社会分配是基于能力和功绩，与其他因素无关，但在现实生活中，人们获取功绩不仅仅依靠能力与努力，还依赖于很多其他因素，而这些因素往往被优绩主义所忽视。增值评价也是如此，虽然在方法上分离了家庭等初始因素，强调个体自身的进步，但不同家庭的文化资本已经产生了深刻的影响并内化于学生身上；中上阶层的子女由于家庭文化资本的影响更能适应精英高校的文化，从而取得更好的学业成就，一些增值可能正源于此。

教育的根本目标是实现每个人自由而全面的发展，真正的教育只可能是因人而异的全面质量概念，而不应该是对某些卓越模板的形式化计算和简单模仿。因此，增值评价在突破旧的“理性神话”的同时，有可能会建立起新的“理性牢笼”，将教育带入优绩主义的陷阱。

（三）天花板效应

如前所述，增值测量是否可信和有效、获得的证据是否科学还存在争论。对增值测量效果提出最明显挑战的是“天花板效应”，这也是在当前增值评价中一直未能得到解决的重大难题。所谓“天花板效应”，是指优秀学生或优质生源学校因原有起点高、增值空间有限而不可能获得较大进步幅度，因而得到较低增值评价结果的现象。“天花板效应”很容易造成增值评价结果与经验事实之间的悖论。如在争论中有学者举例的那样，现实中可能存在“牛津、剑桥”等教育实力强的“名牌大学”带给学生的增值反而小于技术类院校的情况。我国学者的实证研究也表明，由于进入不同层次高校的学生禀赋各异，那些基础较好的学生即使进入顶尖大学就读，其学习能力尤其是批判性思维能力也因触及阶段性的“天花板”而不再增长；如果要实现与其他同学同样的增长幅度，他们需要付出多得多的努力，所在学校也需要付出更多的资源。

五、总结与启示

关于高等教育增值评价的探索与争论其实都离不开对教育评价本质的回溯，相关争论依旧是围绕教育评价的元问题在进行，涉及评价的合法性、合理性与科学性等基本问题。回应好这些问题，才能应用好增值评价。毫无疑问，相较于传统的“以结果论英雄”的评价模式，增值评价具有相当的进步性，不像原有评价那样单一、静态，而是试图在评价中注入更多“民主”“平等”“以学生为本”的时代精神，试图调动人和教育机构的主观能动性。然而，增值评价毕竟滥觞于教育问责，并为教育问责提供依据。推行增值评价的专家和教育管理者从效率的角度认为增值评价能够反映教育的全过程，具有科学性和可操作性；而学校和教师从育人的角度大多认为这种评价无法覆盖所有的努力和影响因素。尤其是在高等教育领域，学生的成长与发展涉及的因素更多，标准更加多元和难以统一，信息技术革命也使得学校之间、学校与社会之间的界线变得更加模糊，计算增值和评价因果关系更加困难，高等教育增值评价会面临更多的挑战。所以，在使用增值评价时要特别注意到它的局限性和高等教育的特性，不仅要科学探索如何测算“增值”，更要理性思考如何使用“评价”，才有可能发挥增值评价的进步作用，避免陷入标准化评价的套路和优绩主义的陷阱。

当前我国实际运用高等教育增值评价时还应注意以下问题：第一，要将增值评价与我国高等教育实际情况相结合。增值评价的理论与应用发源于西方社会，在中国高等教育场域中运用增值评价要坚持以我为主、为我所用。我国高等教育发展要落实立德树人的根本任务，开创中国特色、世界一流大学新路，应将我国独特的教育目标和使命纳入增值评价的维度之中，并致力于生成、完善本土化的相关理论。第二，注重增值评价与结果评价、过程评价、综合评价等评价方式的协同融合。由于高等教育具有成效滞后性、学科复杂性、教学多样性等属性，任何一个评价体系都不能覆盖教育的全过程并反映所有人的努力，在使用增值评价时也要注重同其他评价方式互补。第三，使用增值评价结果时应当保持审慎态度。如在分析、使用增值评价结果时应当考虑到“天花板效应”等测量缺陷，正视高等院校的类型差异，在评价教育质量时做到具体问题具体分析。

（本文参考文献略）

Value-Added Assessment in Higher Education: Origins, Debates and Reflections

HuJuan XuXinyue

Abstract: Value-added assessment in higher education is complex and diverse, whose development trajectory and related debates are indicative of the challenges faced by value-added assessment. The development has gone through three stages: embryonic concept, practical exploration and reflective transformation. The debates mainly focus on the scientific soundness and fairness of assessment methods, the accuracy and validity of assessment processes, and the diagnostic value and applicability of assessment results. Value-added assessment in higher education, which highly values the change of capability and the experience of schooling, with emphasis on “effort” and “progress”, is a breakthrough from the “rationalized myth” constructed by the traditional assessment model, but there are still some limitations. When developing value-added higher education assessment in China, we should not only explore the measurement of “value-added” scientifically, but also consider the rational use of “assessment” and focus on the pursuit of value in assessment.

Key words: higher education; value-added assessment; educational evaluation; meritocracy

初审：王悦桦

复审：孙振东

终审：蒋立松