无标题文档

教育评价中的“测不准原理”与我国高考改革

  发布时间:2018-12-26 12:28:59

来源:微信公众号《中国教育三十人论坛》2018年12月9日  作者:项贤明

 

一、科学史上两只与黑白无关的猫

让我们从科学史上的两只猫说起(不要想多,这两只猫和黑白没啥关系,也从来没上过南昌八一大桥):一只猫的主人,名字叫做薛定谔(Erwin Schrödinger,1887—1961);另一只猫的主人,名字叫做桑代克(Edward Lee Thorndike,1874—1949)。这两人生活在差不多同一个时代,一前一后也就相差十多年时间。老薛同志的猫其实并不真实存在,是他在1935年想象出来的。他假定一只猫被密封在一个盒子里,盒子里有一个封装着剧毒氰化物的瓶子,瓶子上有一把没啥情怀的锤子,锤子由一个电子开关控制,而电子开关又是用放射性原子控制的。如果原子衰变,释放出α粒子,就会触动开关,导致没情怀的锤子落下打破瓶子,这只可怜的猫必死无疑。然而,我们不知道原子啥时候衰变,因此,在我们打开盒子之前,这只猫既可能是死的同时又可能是活的。薛定谔用这只有点妖气的猫,来比喻微观世界物质存在的不确定性。桑代克的猫是真实的,虽然也有些可怜,但志向远大。老桑同志的猫出道比较早,1898年就和它的主人一起来到了美国哥伦比亚大学师范学院。桑代克没有逼他的猫像哈姆莱特那样面对生死抉择,但却让它饿着肚子,并且把它关进一只迷笼,笼子外面有香气诱“猫”的猫粮,猫可以通过按踏板、抓绳子等方法触动机关打开笼子逃出来并且吃到食物。刚开始,这只狂躁的桑代克猫毫无绅士风度,在笼子里乱抓乱挠,偶然触动机关打开了笼门。桑代克不断重复这个实验,发现猫开笼子的时间越来越短,到后来进了笼子就会按动机关逃出来。于是,这位哥伦比亚大学师范学院的桑代克讲师向世界宣布:他的猫证明了学习的过程就是一个试误过程。和薛定谔那只解释物质世界“不确定性”的猫不同,桑代克的猫从此把我们关于孩子学习行为的研究引向了一条“确定性”的不归路。我去中小学给老师们讲课,常问他们在班上见过几个孩子是像桑代克老师的猫那样学习的,他们稍微想想,会立刻爆发出哄堂大笑。然而,在此之前,他们却对桑老师这只猫绝对的科学指导意义深信不疑。他们以前显然一直身陷对所谓科学的迷信之中。

在关于自然界之不确定性的研究道路上,薛定谔并不孤独。不同学科的众多科学家,譬如美国气象学家洛伦兹(Edward Norton Lorenz)的蝴蝶效应、俄国化学家贝洛索夫(Belousov)和扎鲍廷斯基(Zhabotinsky)的震荡反应,等等,都从不同角度证明了:这个复杂的宇宙充满了不确定性,上帝真的是在掷骰子(北京人将其唤作“掷色子”)。一个系统,一旦它的复杂性达到一定程度,就会出现自组织现象,这种自发的宏观有序现象大量存在于自然界之中,使我们面前的自然界变得捉摸不定。用洛伦兹的话来说,我们甚至无法确定,一只蝴蝶在巴西草原上煽动一下翅膀,将来能否在美国德克萨斯引起一场龙卷风?因此,薛定谔脑子里面的那只猫很了不起,它让科学家们在自然界的复杂性面前保持低调,承认科学在很多情况下只能以统计概率的方式来描述自然界捉摸不定的运动规律。海森堡(Werner Karl Heisenberg,1901—1976)用哲学的语言表述了对自然界这种不确定性的理解:“在因果律的陈述中,即‘若确切地知道现在,就能预见未来’,所得出的并不是结论,而是前提。我们不能知道现在的所有细节,是一种原则性的事情。”在这里,牛顿时代必然的因果律失去了普遍有效性,一个绝对必然的宇宙崩塌了,代之而起的是充满不确定性的概率宇宙。海森堡把科学对客观世界这种不确定性的认识,称作“测不准原理”,或译作“不确定性原理”(Uncertainty principle)。

让我们从自然界不确定性的视角来反观人类自身,在这个世界上所有复杂系统中,最为复杂的莫过于人自身。人的复杂程度使其不仅表现出自然界大量存在的自组织现象,譬如胚胎发育过程等,而且这种自组织特性进一步升级,变成了人的自主性,或者用哲学的概念称之为“主体性”。人类的自由意志决定了我们无法从第三者的视角来确定性地把握另一个或一群人的发展变化。主体性,使得“人”成了上帝掷出的最为捉摸不定的骰子。我们甚至连某个人在未来五分钟内是否还坐在那把椅子上都无法做出确定性的预测,因为决定我们的预测是否准确的决定性因素,不是我们对那个人看似科学的客观观察,而是取决于那个人自己,取决于他的自由意志。

然而,桑代克迷笼里那只狂躁的猫可没薛定谔想象的猫那么安分。桑老师那只著名的猫,以一种科学的僭妄,不断地挑战人类的自由与尊严,把心理学和教育学的研究日益引向确定性的道路。

二、教育评价中的科学迷信

桑代克老师的猫毕竟出道更早,而且身处哥大名校,所以比当时随着薛定谔离开德国流浪国外的那只猫要牛气很多。桑老师从他这只了不起的猫身上,发现了一系列有关我们学习行为的科学定律,诸如练习律、效果律等等。几乎每一个师范毕业生都对这些关于学习的科学定律耳熟能详。人类的学习,在伟大的“行为科学”面前,从此变得确定无疑。沿着这条确定主义的道路,桑代克老师的后继者们勇敢前进,不断提出了一系列关于人类学习的伟大发现。譬如:美国心理学家华生(Watson,John Broadus,1878-1958)曾夸下海口,说:“如果给我一打强健而没有缺陷的婴儿,让我放在我自己的特殊世界中教养,我将保证从中随机抽取任何一个孩子,都可以培养成我所选择的任何一类专家……”。你听这口气,和中国某些教育“砖家”们说的“没有教不会的学生,只有不会教的老师”,简直如出一辙!华老师他之所以敢夸下这样的海口,主要当然不是因为他到了中国海南省的首府(华老师好像没钱买机票去海口旅游),也不是抄袭了中国教育“砖家”的成果(谁抄袭的谁,我想不用待查了),而是他坚信:行为科学的研究,确定无疑地发现了人类学习的规律,而照规律办事就一定能成功。到了新行为主义领袖人物斯金纳那里,这类科学狂言被推上了哲学高度,他1971年在《超越自由与尊严》一书中明确提出:“对人类行为的实验分析必将使自主人丧失我们以前所赋予他的所有功能,并把他们一个一个地转移到控制性环境上。”斯金纳在这里直截了当地否认了人的自由意志和自主性,他称之为对自由和尊严的超越。科学的威望,被置于人类的自由和尊严之上了(beyond)。丧失了自由和尊严的人,连自然界一般事物中都到处存在的不确定性都不配享有,一切都在所谓行为科学的掌握之中。

这类关于人的学习和发展的确定性思路,在心理和教育领域带来了一系列的科学迷信,其中也包括教育评价领域里的科学迷信。让我们用一个生活中最常见的例子,来通俗地解释和揭穿这类科学迷信:科学小学的一名学生叫小丫,她在本次数学期末考试中考了100分。这一事实马上会让我们想到:小丫是个优秀的学生,有数学天赋,将来很有可能成为一名数学家……等等,等等。等等!真的是这样吗?我们谈起一个人的教育和发展,常常讲“知、情、意、行”四个主要方面,那么,这张100分的试卷,在“情”的方面真的能说明小丫喜欢学数学吗?不一定!那么在“意”的方面能说明小丫长大了想当数学家吗?更不一定!在“行”的方面能说明小丫努力学习了数学吧?也不一定。那么,这张100分的数学试卷,至少能在“知”的方面说明小丫的确很好地学会了数学知识吧?还是不一定。瞎猫碰死老鼠,正好考题都是小丫会的,小丫不会的正好都没考,也不是没有可能的。你看,稍微理性地思考一下,我们很容易就能发现,一张试卷所能测量的一个人的发展,实际上是十分有限的,但我们在平时生活中常常对考试的所谓测量效度深信不疑。即便是在高考这样一类对个人命运有重大影响的考试中,我们也会在精确到1%甚至5‰的水平上采信考试分数。

在教育领域,科学迷信可谓比比皆是,其中最为神话的就是智力测验了。做完一套被十分科学地称作“量表”的试卷(难得一见的“量表”,听上去似乎要比常见的“卷子”科学很多,其实差别没那么大),科学家就可以准确地测量出你到底有多聪明,或者到底有多愚蠢。不知道有多少痴迷于小蚂蚁、醉心于星空,长大想当动物学家和天文学家的孩子,在科学的智力测验面前变得绝望。然而,科学家中敢于讲实话的总是大有人在。哈佛大学有一位犹太裔科学家,叫斯蒂芬·杰伊·古尔德(Stephen Jay Gould,19412002),他曾写过一本书,书名叫《人类的误测(The Mismeasure of Man)》,并在书中对这类看似科学的测量进行了令一些科学同行生厌的批判。还有一位叫做斯蒂芬·默克多(Stephen Murdoch)的,是《华盛顿邮报》等著名媒体的自由撰稿人,曾写过一本书,书名叫《智商:一个失败理念的光鲜历史(IQ: A Smart History of a Failed Idea)》,也把这一领域看似科学的辉煌历史兜了个底朝天。这两本书都已有中译本,尽管其中有些翻译有待商榷。读一读这些书,比我在这里用有限的文字来说明要好得多。

在诸多影响这类看似科学的人类测量可信度的因素中,最强大、最捉摸不定的因素,就是人的自主性,或者说就是人的自由意志。面对某个人交上来的心理量表,我们不可能直接看见这个人的内心,因而也就永远无法确切无疑地知道:这个人是不是故意做错某些题目,甚至是不是故意胡乱回答了所有题目。行为主义坚信通过行为观察可以推知人的内在意识,却忘记了这些行为完全有可能是人伪装出来的。人不是猫,即便是桑代克老师的那只猫,也绝对无法和人一样,特别是无法拥有人的主体性,无法像同样作为所谓“被试”的人那样来对待测试者。这些关于人的测量,根本没有桑老师、华老师、斯老师等等坚信的那样确定无疑。这种确信,其实只不过是一种科学迷信。

我说这些东西是教育领域的“科学迷信”,并不是说这些都是假的、不科学的,而是说它们其实没有想象的那么科学,至少不是绝对可靠的科学。认识到这些东西是一种科学迷信,主要目的不是要否定它们,而是要提醒大家小心提防这些看似科学的东西对我们的伤害。

教育测量的科学迷信对我们的伤害是实实在在的,这些伤害发生在我们众多的日常教育教学活动中,常常使我们将教育错误地降格为简单的训练,进而将洗脑的成功,错误地当成了教育的成功。其中伤害面最大、对社会影响最深的,可以数得上我们伟大的高考了。

三、高考改革:如何走出“朝二暮三”的迷笼?

行为主义之科学迷信所危害的不仅仅是咱中国人,也包括它的故乡以及受到它影响的其他地方的人。然而,到了中国,桑代克那只披着科学之皮的猫,遇到了另一种牛皮无敌的空气,这种空气就是我们老祖宗传下来的、曾经先进过的“科举文化”(说它“曾经”先进,意味着我们必须清醒地认识到它如今早已落后。咱不能因为“祖上阔过”而在21世纪仍然安贫乐“道”,天天逢人便乐“道”那祖上曾经的辉煌)。科举文化让桑老师的猫附身于我们举世无敌的高考,一下子如虎添翼,所向披靡,因为它通过这种文化空气获得了最为深入广泛的人民群众基础,而正如一位伟人在一篇题为《论联合政府》的演讲词中曾经说过的那样:“人民,只有人民,才是创造世界历史的动力。”在这种传统加科学的双重影响下,我们完全忘记了:科学的测不准原理,最适用的莫过于人。也就是说,考试,在很多时候,可能比美国总统还要靠不住。

看见这块“钦点状元”的金字匾额相信绝大多数人都会有一种仰慕之情从内心深处油然而生。这就是一种文化的影响力,它在我们的大脑里、肌肉里、血液里、骨骼里,不知不觉中影响着我们的思想意识和行为举止。一群有着崇拜考神传统的人,面对身披科学霞光的各类从发达国家引进的考试,无论你是传统派还是现代派,是自由主义者还是新左派,是世界主义者还是民族主义者,对这些有科学撑腰的新考试,都会深信不疑。于是,一种迷信,科学的迷信,在神州游荡……这片神州大地,有着1300年的科举考试历史,直到100多年前的光绪廿三(1905)年,才放弃了这种考试制度,因而科举文化在这片土地上至今依然有着很强的生命力。以高考为例在社会心理层面,我们能看到受到大众热捧的“高考状元”,看到广泛存在的考前去文庙祭拜孔子的现象,等等;在学校教育的实践层面,我们看到死记硬背的学习方法和各类应试教育大行其道,看到高考范文秘笈之类的八股泛滥;在制度层面,我们看到的是和科举制度如出一辙的“一考定终身”的人才选拔模式。这里说的“一考定终身”,说的是只靠考试这“一种”东西来定终身,并不是像某些人相信的样,认为“多考”几次就能解决问题(当年的范进们参加高考的次数一点不比今天的孩子们少,甚至穷其一生只为考试者也大有人在);更重要的是,改革者们所谓的“顶层设计”常常也深受这种科举文化的浸染,甚至有时还会直接运用科举的历史经验来指导今天的高考改革。于是,我们的高考改革就变得像桑代克老师那只猫一样,在改革的迷笼里焦躁不安地乱抓乱挠,不停地改革来改革去,今年“三加二”,明年“二加三”,结果还是换汤不换药。

高考的科举文化特征,已经使其成为我们国家基础教育改革最大的拦路虎,成为我们提升国家创新能力最根本的绊脚石。对考试的科学迷信,使我们坚信“一考定终身”这种最不科学、也最不公平的人才选拔模式的科学性和公平性,以至于民众只相信这“一考”,觉得其他考核方式都会引发腐败和不公。实际上,公平与否,关键在有没有公开透明和公正监督。如果没有公开透明和公正监督,那就连最简单的抓阄都有作弊的空间。高考的科举文化特征,以及由此带来的“应试教育”模式,已经成了我们教育领域亟待革除的顽疾,而这一文化特征,在高考的制度层面上,又集中表现为“一考定终身”,因此,高考改革,最重要的功夫恰在考试之外,即必须打破“一考定终身”的选才模式,高考改革才有希望逃出迷笼。

关于高考改革的具体思路及其论证,我会在即将发表的《改革开放40年我国高考改革的回顾与反思》一文中详细论述(学术期刊论文),这里只简要概述几条建议。在我看来,高考改革要逃出迷笼,首先要破除对考试的科学迷信,突破以此迷信为基础的“一考定终身”模式的桎梏,尽快将我国高考改革的工作重点从考试改革转向高校录取制度改革,建立长时段、多方面的综合评价体系,在较长时间里根据多种因素来综合地考查和选拔人才。最可能有效地实现这种综合选才模式的方式就是网络,因此,教育部应当在“9701”工程的基础上,进一步扩大升级中国教育考试网,使之成为一个全国统一的普通高等学校自主招生录取平台。所有普通高校都应当在这个网络平台上公布本校不同专业的具体录取要求和录取方案,譬如:本校物理系要求数学、物理必须考很高的分,但文言文、历史等只要通过高中毕业水平考试就行;艺术系要求本行当的艺术水平考试、语文和历史等考试的分数都比较高,但数理化则通过高中毕业水平考试就行……考生可以根据自己的兴趣和志向等,在平台上将自己的学业档案投给相关院校,相关院校必须在一定期限内反馈录取结果。所有报考录取过程,包括中小学的学生学习档案形成过程,都记录在案,接受监督。

有人会问,这样一来,那些平时学习不好的同学不就没有向社会上层流动的机会了?我们必须承认,不是每个人都能成为数学家、科学家,所以,关键不在于我们如何才能让这个国家人人都成为数学家、科学家,而是要通过社会改革来调整阶层利益,让那些没有成为数学家和科学家的人,也可以体面地在这个社会上生活。还有更多的人会怀疑这种不唯考试分数是举的录取制度的公正性。实际上,正如前文所述,公平与否并不取决于是否以考试分数为唯一录取标准,而在于有否公开透明和公正监督。没有监督,什么样的高考录取制度都会滋生腐败,只不过您“眼不见,心不烦”而已。在这个公开透明的高校招生录取网络平台上,一切都记录在案,有亿万网友比高压电还厉害的目光盯在网上,一旦有人胆敢以身试“网”,监督的锤子必定落下,腐败之猫必死无疑。就中国社会的现状来看,我个人觉得,网络监督有可能成为最为有效的监督,只要我们敢于将监督的权力公开透明地交给亿万网友。对此我是确信的,至于这个认识是否是迷信,我想网友们可以给出答案。

总而言之,人是世界上最复杂的存在物,因此,测不准原理在教育测量中是普遍存在的。仅靠单一的考试来选拔人才,不仅是靠不住的,也是不公平的。我们亟待建立一个公开透明、有公正监督的人才综合考核和选拔体系。改革!改革!改革!我们仍须不忘初心,砥砺前行!

 

责任编辑:刘媛媛