方法创新是构建教育学自主知识体系的内在要求袁振国谢晨潘苏东迟少辉禹娜陈思语-西南大学西南民族教育与心理研究中心

方法创新是构建教育学自主知识体系的内在要求

作者：袁振国，谢晨，潘苏东，迟少辉，禹娜，陈思语

阅读数：129次

来源：《华东师范大学学报（教育科学版）》2024年第11期

摘要：自主知识的增长和积累是构建自主知识体系的基础。科学发展的历史表明，不同运动形式运动规律的揭示，不论是物理、化学、生物还是社会的运动，都与研究方法的创新密不可分；而实证研究在其中起着关键作用，在某种意义上说，方法创新就是实证研究方法的创新。比起自然科学和其他社会科学，教育学的知识增长相对缓慢，知识积累不足，一个核心的原因就是实证研究不足，方法创新不足。当前，我们已经进入了数字时代和教育高质量发展的新阶段，面临着一系列重大教育理论问题和实践问题，通过方法创新，破解自主知识不足的难题，是构建教育学自主知识体系的内在要求。

关键词：方法创新；实证研究；自主知识体系

自2015年10月华东师范大学教育学部发起举办全国教育实证研究论坛以来，今年是第十届了。十年来，论坛的参加人数从首届600人发展到线下逾千人，线上三十万人，论坛的主题从一个发展到30多个，论坛的形式从单一的大会报告发展到多种形式的组合，演讲人数从十几位发展到七八百位。通过论坛的持续推进，实证研究在教育学界已经蔚然成风，并成为政策制定的基本要求。时至今日，通过实证研究提高教育研究水平，提高教育决策水平，已经形成广泛共识。在第十届全国教育实证研究论坛召开之际，我们有必要思考，在持续推进实证研究的同时，如何把实证研究推向一个新的高度，从了解、熟悉、运用实证研究方法，走向创新研究方法，为构建教育学自主知识体系取得突破提供动力和保证。

一、方法创新对学术创新具有决定性意义

知识的增长和积累是构建学科自主知识体系的基础，历史表明，知识的增长、积累、跃升总是与研究方法的创新密切相关。恩格斯（Friedrich Engels）在《自然辩证法》（Dialectics of Nature）一书中把事物的运动分为五种形式，机械运动、物理运动、化学运动、生物运动和社会运动，事物的运动是从低级的、简单的形式向高级的、复杂的形式发展，同时它们之间又是一个整体，相互联系、相互作用。但不管是哪种运动形式，其研究领域的突破、规律的揭示，无不与研究方法的创新相伴随。

（一）物理学的发展经历了多次大的跃进，每次跃进都是研究方法创新的结果

伽利略·伽利雷（Galileo Galilei）在传统理性科学的基础上，革命性地使用控制变量的实验方法，开启了从理性科学向经典物理学的转变。伽利略开创了科学实验方法，通过一系列控制变量的实验，如斜面实验和自由落地运动实验，找出自变量与因变量，揭示了力与运动之间的基本关系。他的实验研究不仅揭示了物体运动的基本规律，也启示人们如何通过实验来验证或者修正理论。这种实证研究的方法大幅度提高了科学研究的精确性和可靠性，也使经典物理学（近代科学）与古希腊理性科学有了本质性的区别。随后，实验方法成为物理学的基本方法，推动了近代科学的发展。

艾萨克·牛顿（Isaac Newton）的公理化方法和归纳-演绎方法标志着经典物理学公理化体系的建立。牛顿在《自然哲学的数学原理》（Philosophiae Naturalis Principia Mathematica）一书中提出了4条“哲学中的推理法则”，阐释了自然界所遵循的简单性原则和统一性原则，正是在这一万物的普适性基础上，运用公理化方法，提出运动三定律和万有引力定律等，形成了经典力学的系统化理论体系。他把观察和实验作为科学研究工作的出发点，把归纳法作为求得自然规律的基本推理方法，同时重视数学演绎方法，与从前的演绎方法不同，他提出演绎的结果必须重新诉诸实验确证。牛顿把实验观察和数学演绎非常紧密地结合起来，从而为经典物理学的发展提供了坚实的方法论基础。

阿尔伯特·爱因斯坦（Albert Einstein）的直觉-演绎方法为狭义相对论的诞生奠基，是现代物理学产生理论的代表性方法。1905年爱因斯坦在《论动体的电动力学》（Zur Elektrodynamik bewegter Körper）一书中提出相对论，他使用这种探索性演绎方法，突破了以往科学理论基于经验事实的边界，凸出了直觉在科学前沿的关键效用，是物理学史上的一次重大革命。20世纪初，英国著名物理学家威廉—汤姆森在英国皇家学会的一次年会上发表了题为“在热和光动力理论上空的十九世纪的乌云”的演讲。说经典物理学的上空遇到两朵乌云，一朵是指迈克尔说-莫雷实验结果和以太漂移说相矛盾，一朵是指热学中的能量均分定则在气体比热以及热辐射能谱的理论解释中得出与实验不等的结果。这两朵乌云使经典物理学失去了解释力。物理学需要新的理论，面临着“可感的直接经验已然失效”研究基础的变革。面临此种情形，爱因斯坦将“直觉思维和理性思维紧密结合”，他敏锐觉察到直觉思维的关键性，因为富有想象力和创造性同样是科学研究的重要路径，“应当允许他有权去自由发挥他的幻想,因为除此之外就没有别的道路可以达到目的”。直觉-演绎方法的使用在爱因斯坦的相对论上表现得鲜明有力，他在分析以太假说的矛盾后，大胆地突破当时的窠臼，创造性地提出两条基本假设：狭义相对性原理和光速不变原理，接着根据两个基本假设，运用数学演绎推理，得出一系列具体的推论，如时间膨胀、长度收缩、质量增加等，设计诸多著名的理想实验，从而建立狭义相对论，使物理学突破经典物理学，进入近代物理学时代。

（二）化学发展历程三次重大的跃进都与研究方法创新相伴随

罗伯特·波义耳（Robert Boyle）将实验方法引入化学，使其成为一门独立的科学。17世纪以前化学一直被神秘的炼金术的阴影所笼罩。炼金术士们试图将普通金属变成黄金，但一无所成。罗伯特·波义耳将实验方法引入化学，他通过一系列精密的实验和反复验证，最终提出了波义耳定律，即在恒温条件下，一定质量的气体的体积与压强成反比，揭示了气体行为的基本规律。波义耳的贡献不仅在于他的实验结论，而且在于他的系统化实验方法。他在实验设计中严格控制和测量变量，采用定量分析方法，精确记录数据。他坚持将每一步实验过程和结果详细记录，这种详尽的记录和透明的方法为其他科学家提供了宝贵的参考资料，提高了实验的可靠性和对结论进行验证的可能性。波义耳的实验日志和论文，由于其详尽的记录和透明的方法，为后来的科学实验树立了标杆。波义耳通过这些创新性的实验方法和系统化的实验过程，展示了实验科学必须基于可观测的事实和重复验证的原则，这为后来的科学家们探索未知世界提供了重要的工具，对后来科学的许多领域产生了深远的影响。

德米特里·门捷列夫对元素的系统分类揭示了物质世界的统一性。在19世纪中叶，尽管科学家们已经发现了许多元素，但它们之间的关系仍然不明确。俄国化学家门捷列夫通过系统分类法，找到了揭示元素之间关系的关键。该方法非常系统和精密，首先收集了当时已知元素的所有数据，包括原子量和化学性质等。然后，将元素按原子量从小到大排列，并观察到元素的化学性质随着原子量的增加呈现周期性的变化。他通过归纳和分类的方法编制的元素周期表，不仅有序地排列了已知元素，还预言了尚未发现的元素的位置和性质。

欧内斯特·卢瑟福（Ernest Rutherford）的模型方法，揭示了原子结构的奥秘。20世纪初期，科学家们对原子的内部结构仍知之甚少。英国科学家卢瑟福于1911年进行了一个革命性的实验：他用α粒子轰击金箔，观察到大部分α粒子直线穿过金箔，但有少数发生偏移，极少数甚至反弹回来。这一现象引发了卢瑟福对原子内部结构的深入思考。卢瑟福推测，原子的内部结构并不是均匀的，而是存在一个带正电的中心“核”，周围带负电的电子在其周围高速运动，就像行星围绕太阳运转一样。为了验证这一理论，卢瑟福通过α粒子散射实验发现了原子核的存在，提出了“有核模型”或“行星模型”。卢瑟福的模型方法提炼出物质原型的关键要素，是对原型的简化。从实验中获得的大量数据出发，卢瑟福抽象出一个模型，并选择合理的方法进行计算，最终发现了科学规律。这个模型不仅解释了实验现象，还为理解原子结构奠定了基础。模型方法在沟通科学现象与其本质的认识过程方面，起到了重要的桥梁作用。

（三）生命科学发展的每次跃进也都是研究方法创新的结果

比较方法的运用奠定了生物研究从博物学步入生物学的基础。1735年，瑞典生物学家卡尔·林奈（Carl Linnaeus）出版了《自然系统》（Systema Naturae）一书，首次为动植物界建立了一个完整、有序的分类系统，为生物研究从博物学阶段步入生物学阶段奠定了基础。在《自然系统》中，林奈对收集到的诸多动植物材料进行了形态结构比较，依据各自主要特征间的共性和差异，对动植物分别进行归纳和分类，并建立了从高到低的界、纲、目、属、种五级分类单位，其中，属级分类特征是对其包含所有种的共性特征的概括，目级分类特征是对其包含所有属的共性特征的概括，以此类推，还确立了反映分类单位间从属关系和包含关系等级序列的生物分类方法。随着越来越多的新物种被发现和记录，后人对林奈分类系统中的分类单位进行了补充，形成了应用至今的界、门、纲、目、科、属、种的完整分类系统，成为近现代生物学深化研究的分类基础，也无意中为达尔文的共同祖先学说奠定了基础。

研究方法的融合运用导致DNA双螺旋结构的发现，生物研究从生物学步入生命科学。美国生物学家沃森（James Dewey Watson）与英国生物学家克里克（Francis Harry Compton Crick）于1953年4月25日发表于《自然》（Nature）的关于DNA双螺旋结构的文章，标志着生物学由生命现象研究进入分子机制探讨阶段，开启了生命科学的新纪元。1952年，由于生物学基因突变处理、化学的同位素标记等方法的应用，促使生物学家接受了生物遗传物质的本质是DNA这一实事，自此DNA结构成为研究的焦点。沃森与克里克在研究之初，吸收了化学家鲍林（Linus Pauling）的研究思路和方法，运用统计学手段对大量文献中已报道的实验数据进行理论分析，建立各种可能的潜在结构模型；然后，又基于奥地利生物化学家卡伽夫（Erwin Chargaff）运用纸层析和离子交换层析等化学方法揭示的碱基比值规律，并应用英国物理学家威尔金斯（Maurice Wilkins）和富兰克林（Rosalind Franklin）实验获得的X射线晶体衍射照片及相关测量数据对模型进行检验，最终揭示了DNA双螺旋结构的本质。沃森与克里克取得成功的关键在于，他们密切关注了自然科学各领域的研究进展，取各学科之长，融会贯通地运用化学、物理、生物学和统计学等学科知识和方法于基因研究之中。其中，对生物遗传物质的本质研究进展的关注，是确保研究方向正确的基础，基于统计学手段对文献已报道的大量实验结果进行分析并建立模型，是确保研究过程高效的关键，物理学的射线晶体衍射技术和化学的杳伽夫法则等的综合应用，是确保结构模型精准和研究结果正确的重要实验依据。DNA双螺旋结构的揭示是在学科融合观点指导下的一项完全定量研究，促使生物学步入精密科学之列，并使整个生物学的科学观念、研究思路、方法和技术都发生了革命性变革。

（四）社会学从诞生到跃升同样得益于研究方法的创新

物理、化学、生命运动规律的揭示得益于研究方法的创新和突破，人类社会运动规律的揭示同样如此。

统计学的运用使社会学从哲学中独立出来。19世纪末至20世纪初，社会学逐渐从哲学中独立出来，成为一门独立的学科。这一转变在很大程度上得益于埃米尔·迪尔凯姆(Émile Durkheim）的开创性工作，尤其是他在1897年出版的《自杀论》（Lesuicid）中所展示的实证研究方法对社会学进展的贡献。迪尔凯姆通过收集和分析大量数据，不仅验证了他的社会事实理论，更推动了社会学的科学化。迪尔凯姆收集了19世纪欧洲不同国家的大量自杀统计数据，并且确保这些数据涵盖了不同年份与社会背景，这使他能够进行跨时间和跨文化进行。他将自杀分为四种类型：利己型、利他型、失范型和宿命型，并运用数据分析深入探讨每种类型与特定的社会条件之间的关联。迪尔凯姆在分析数据时采用了描述性统计来概述数据特征，并运用相关性分析来探究不同变量之间的关系。这些统计手段帮助他识别出社会环境因素与自杀率之间的潜在联系。通过比较不同社会群体、地区和时间段的自杀率，找出社会整合度和规范性与自杀率之间的关联。这种对变量细致的分类和定义，使得他能够更准确地解释数据背后的社会现象，并在此基础上形成和验证社会理论。他的研究证明，自杀不仅是个体心理问题，更是社会现象，受到社会集体和规范的影响，为理解其他社会行为提供了理论框架。

实证研究使芝加哥学派声誉鹊起，成为都市社会学研究的范例。在社会学发展的历史上，除了以迪尔凯姆为代表的“社会学年鉴学派”，芝加哥学派是另一个享有世界声誉的社会学派。20世纪初至30年代，以美国芝加哥大学社会学系为中心，对新兴芝加哥城市的社会问题开展了一系列实证研究，从而使这个学派总体上具有基于经验研究和以解决城市问题为主的应用研究的特征。芝加哥学派对人文区位、邻里关系、人口、种族、犯罪、贫民窟等问题的研究，塑造了都市社会学研究的范例。

芝加哥学派的社会学研究因其富有创造性地运用多种实证方法而著称，实地调研、深度访谈、统计分析、人口普查、问卷调查以及制图技术等。1915年至1940年间，芝加哥学派的学者们综合运用这些方法对芝加哥城市社会结构进行了大量研究，揭示了城市社会生活的复杂性并解决了众多社会学问题。在实地调研方面，厄内斯特·伯吉斯（Ernest W.Burgess）的研究团队对芝加哥各个区域进行了长期的实地考察，记录了居民日常生活中的细微差异、工作模式和社会交往方式，这种方法使得他们提出了著名的“同心圆模型”，该模型系统性地描绘了城市空间按社会经济层级和功能区划呈同心圆状扩展的特征，有效揭示了移民聚居区、贫民窟及其他社会群体在城市空间中的分布格局及其相互作用机制，阐明了城市环境对居民社会行为模式与群体关系的决定性影响；在深度访谈的应用方面，路易斯·沃思（Louis Wirth）通过对犹太移民的深入交谈，揭示了语言障碍和文化冲突如何影响移民群体的社会行为和群体间关系，这一过程突显了个体经验在宏观社会结构分析中的重要性，并创作了《贫民区》（The Ghetto）一书；统计分析作为量化研究必不可少的方法，克利福德·肖（Clifford R.Shaw）等学者用来探究青少年犯罪与社区环境之间的关联，在《街头抢劫者》（The Jack-roller: A Delinquent Boy's Own Story）一书中，通过大量数据分析，证实了高犯罪率与社区物理退化及高移民比例之间的关联性，证明了环境因素在犯罪行为形成中的作用；还有人口普查与问卷调查技术，弗雷德里克·思拉舍（Frederick Thrasher）利用问卷调查收集了有关青少年帮派的详尽信息，揭示了帮派形成的多维度社会背景，包括经济压力、社会排斥等，这些数据为制定预防和干预策略提供了实证支持；再有绘图技术的应用，通过制作社会经济地图，直观地呈现了芝加哥各区域的社会群体分层与空间隔离现象，加深了人们对城市空间动态变化的理解。

大数据分析打开了网络社会学的大门。随着全球化与信息技术的不断发展，从20世纪后期至今社会学进入了跨学科融合与全球性研究新阶段。在这一阶段中，以曼纽尔·卡斯特（Manuel Castells）的网络社会学为代表，通过网络社会与权力表现的关系考察互联网和移动通信技术对社会变革的影响，形成了网络社会学的新方法。卡斯特定义网络社会为一种新的社会结构，其中信息技术（如互联网和移动通信）是组织社会活动的核心方式。在这种社会中，信息流和网络连接成了影响社会结构和发展动力的关键因素。卡斯特于1996年出版了《网络社会的崛起》（The Rise of the Network Society）一书。他在这本书中使用了大量政府统计数据、学术研究和技术报告，结合图表和统计数据来支持他的观察和结论。他详细分析了信息社会和全球化对社会结构与人类行为的影响，揭示了网络技术如何改变了社会的互动方式、经济模式和文化形态，以及网络这一全球信息化的载体对社会组织和个人生活的重大影响。随着信息技术的发展，卡斯特更加重视网络技术对社会动态的影响，他利用大数据分析和收集来自社交媒体平台、网络论坛和电子商务网站的大量数据，揭示了社会行为和互动模式的新趋势。这些技术手段使他能够有效地研究社会舆情和行为动态，分析突发事件对社会结构的影响。在2012年出版的《愤慨与希望的网络：互联网时代的社会运动》（Networks of Outrage and Hope:Social Movements in the Internet Age）中，卡斯特对“阿拉伯之春”这一中东和北非国家的抗议革命运动，以及反对经济不平等、企业贪腐的“占领华尔街”抗议活动等具体社会案例进行了详细研究。分析了这些运动如何利用互联网和移动通信技术创建自主的通信网络，绕过传统媒体的控制动员群众并推动社会变革。由此卡斯特进一步强调了信息技术在推动社会变革中的关键作用。

二、实证研究在方法创新中起着关键作用

人类对从低级到高级、从自然到社会运动方式研究的历史充分表明，任何运动形式研究的每次跃进都是方法创新的结果，都是针对不同对象的性质、特征寻找到有针对的研究方法的过程，而实证研究在其中都起着关键作用。在某种意义上也可以说，所谓方法创新就是实证研究方法的创新，反之，如果学科发展缓慢，自主知识体系薄弱，则一定是实证研究不足，方法创新匮乏。

（一）实证研究使经济学与教育学拉开差距

经济活动是人类最基本、最重要的活动，教育活动也是人类最基本、最重要的活动，经济学是一门实践性很强的学科，教育学也是一门实践性很强的学科，经济学和教育学发展成为独立学科的时间也大致相同，但经济学的知识增长速度、知识积累厚度和学科成熟程度都是教育学难以望其项背的，造成这一现象的重要原因甚至主要原因就是经济学比较好地融入了实证研究、量化研究，而教育学没有。

（二）量化研究为经济学注入了先天基因

威廉·配第（William Petty）是数量经济学的先驱之一，他在1676年完成的《政治算术》（Political Arithmetick）中就首次尝试用统计数据分析经济问题，开创了数量经济学的先河。配第通过“数字、重量和尺度”的方法，运用数字资料计算广义教育成果的货币价值，并从中获得制定经济政策的依据。他的研究标志着经济学从哲学思辨走向实证研究，为后来的计量经济学发展奠定了基础。他通过对人口、土地和产出数据的统计分析，提出了政府应通过控制人口增长，以及促进农业发展的政策建议。配第的研究不仅展示了数字分析在经济学中的应用，还强调了定量方法在经济决策中的重要性。这种基于数据的分析方法，使得经济学能够以更科学的方式理解和解释经济现象，为后续的实证研究提供了范例。

20世纪初，朗纳·弗里希（Ragnar Frisch）、简·丁伯根（Jan Tinbergen）通过发展计量经济学，使经济学实证研究成为主流。弗里希在1926年提出了“计量经济学”概念，1930年国际计量经济学学会成立，1933年《计量经济学》（Econometrica）杂志创刊。经过定量分析经济学家们的努力，使得经济学能够通过统计模型和数据分析来验证理论，使用回归分析、时间序列分析等方法进行实证研究。

计量经济学的发展增强了经济学的科学性和预测能力，广泛应用于政策分析和经济预测。通过数学和统计模型，将理论与实际数据相结合，从而检验经济理论的有效性。这些模型不仅在学术研究中具有重要价值，还为政府经济政策的制定提供了科学依据。

（三）与数学的结合使经济学发展如虎添翼

1890年，阿尔弗雷德·马歇尔（Alfred Marshall）的《经济学原理》（Principles of Economics）开启了新古典经济学，以新的方式将数学应用于经济学分析。马歇尔经济学的核心是均衡价格论，通过引入供给和需求曲线，建立了局部均衡分析框架，来分析市场均衡与价格变化等经济现象，并利用代数方程和不等式来处理需求和供给函数。他通过数学公式提出了需求弹性和供给弹性的概念，定量分析这些弹性如何影响市场价格和产量。他利用微积分的概念，特别是边际效用和边际成本来分析经济行为，通过研究边际效用递减的规律，解释消费者行为和需求变化。

1936年，约翰·梅纳德·凯恩斯（John Maynard Keynes）以《就业、利息和货币通论》（The General Theory of Employment,Interest,and Money）开创了系统的宏观经济学。他革命性地将数学应用于宏观经济学分析，开创了现代宏观经济学的先河，为后来的经济学家提供了分析经济现象的有力工具。他通过函数和方程描述关键经济变量之间的关系，如消费支出与收入、投资支出与利率等，使用总需求和总供给模型来分析经济体的总体运行，通过均衡条件和乘数效应解释政府支出和投资如何影响总产出和就业等。凯恩斯认为，消费支出与收入正相关，投资支出与利率负相关。他还利用数学模型分析了利率和货币市场之间的关系，包括货币需求与利率和收入的关系，以及商品市场和货币市场之间的均衡。通过这些分析，凯恩斯揭示了如何通过政府干预和政策调整来实现经济稳定和增长。他强调政府支出和投资在经济衰退中的重要性，主张通过增加公共支出和调控利率来刺激经济活动和就业，从而减缓经济周期的波动。

1944年，约翰·冯·诺依曼（Johnvon Neumann）和奥斯卡·摩根斯坦（Oskar Morgenstern）以《博弈论与经济行为》（Theory Of Gameand Economic Behavior）系统地将数学与经济学相结合，开创了一种分析经济行为的新方法。基于博弈论的基础理论，他们用数学模型描述决策者在不同情境下的策略选择，通过零和博弈、非零和博弈、纯策略与混合策略等数学定义和定理，分析了对策双方在竞争与合作中的行为。在市场竞争中，企业的定价策略、产量决策等都可以视为一个博弈过程。博弈论模型提供了一种结构化的方法来分析这些互动，预测可能的结果和均衡状态。通过博弈论，他们拓展了经济学分析的范围，使其不再局限于市场交易，能够包括更广泛的社会互动，如谈判、契约、联盟等。数学模型帮助经济学家更好地理解和预测复杂互动中的行为模式和结果。冯·诺依曼和摩根斯坦采用严格的数学证明方法，确保他们的理论具有逻辑一致性和可验证性。他们通过定义、定理和证明的形式，系统地构建了博弈论的理论框架，为经济学分析提供了坚实的数学基础。

到20世纪50年代，保罗·萨缪尔森（Paul Samuelson）以《经济学》（Economics）创立了新古典综合学派。他通过多种方式将数学引入经济学，推动了经济学的科学化和精确化，使其成为一门更加严谨和系统的学科。微观经济学方面，他使用效用函数描述消费者偏好，并通过无差异曲线和预算约束分析消费者选择，还利用生产函数和成本函数研究企业的生产决策和成本结构。宏观经济学方面，他引入国民收入核算、总需求和总供给模型来分析经济的整体运行情况，使用乘数效应等数学工具研究经济波动、货币政策和财政政策的效果。萨缪尔森广泛运用微积分和线性代数进行经济分析，如通过微积分研究边际效应和变化率，通过线性代数分析线性关系和最优化问题。正是在数量化水平上的不断提高，才使得经济学的实际贡献和认可程度不断提高。

（四）哲学思辨的主导倾向阻碍了教育学知识增长机制的形成

而教育学无论是夸美纽斯（Jan Amos Komenský)与他的《大教学论》（Magna Didactica）还是赫尔巴特（Johann Friedrich Herbart）和他的《普通教育学》（Allgemeine Padagogik），抑或对中国教育学产生深刻影响的凯洛夫的《教育学》,都没有彻底从哲学中独立出来，其间虽然有实验教育学的昙花一现，有心理测量学的侧面冲击，但始终未能改变教育学思辨为主的倾向，始终未能形成教育学知识增长的机制。这是教育学至今未能完善的症结所在。虽然教育学有其特殊性，对教育的研究离不开对人的研究，而人是最丰富、最多样、最复杂的存在，这给教育研究带来了极大困难，也唯其如此，才更加需要寻求方法的创新与突破。

三、问题驱动研究，新问题呼唤新方法

英国哲学家怀特海有一句名言：“19世纪最大的发明是找到了发明的方法，即一种新方法进入人类社会生活中。”怀特海认为，19世纪人类在一百年内取得的技术进步相当于新石器时代以来一万年的积累，而取得这一成就的关键，是科学方法的发明，把科学概念与最后成果之间的鸿沟填平了，这种链接不仅加速了科学转化为成果的速度，而且推动了工业革命的产，对于人类社会的发展具有深远的影响。问题是时代的声音，问题驱动研究。科学发展史表明，研究方法是一个不断丰富、不断创新的过程。当已有的方法无法研究和回答新的问题时，方法创新的要求就产生了。新的方法解决了之前无法研究和回答的问题，便促进了学术的发展和知识的更新。方法创新和学术发展、学科建设就是这样一个相互促进循环往复的过程（图1）（图1略）。方法不是孤立的，方法与思想与理论相互关联。我在《实证研究是教育研究科学化的必要途径》一文中曾强调指出，“实证研究是体现实证精神、遵守实证原则并根据研究对象的性质和目的选择适当方法的研究过程，是精神、规则和方法的有机结合。”没有思想引领、理论指导，没有系统性的思考和构架，仅仅是具体方法的运用，是不可能取得研究的重大突破的。方法是在思想引导之下运用的。研究什么不研究什么，不是由方法决定的，而是由主观愿望、价值取向决定的。往哪个方向研究，如何进行设计，也需要洞见和想象。另一方面，新的思想、新的问题往往呼唤新的方法，方法的创新为新思想、新理论开道。没有恰当的方法的创新运用，再好的思想或假设都只是主观愿望，不能成为确凿的普遍认可的知识。只有通过科学方法的证实，思想和理论才能转化为知识。思想为方法提供引导，方法为思想提供支撑，相辅相成，相得益彰、持续发展。

（一）关于教育经济价值的研究是一个典型案例

教育对经济增长有没有贡献，如果有，有多大贡献，怎么衡量？这是一个关系到教育的性质和功能的基本问题。大家知道，教育长期被认为是消费性事业，所以对教育的投入常常是“多有多投，少有少投，没有不投”。舒尔茨（Theodore W.Schultz）等人的人力资本理论及其“经济增长余数分析法”为教育的经济价值奠定了理论基础和方法论，教育不再被看成是消费行为而是被看成投资行为，从根本上扭转了人们对教育性质的传统认识，确立了教育在现代社会的性质和地位。近年来，多位经济学家通过对研究方法的转化运用，进一步深入阐明和论证了教育经济价值的确凿性。

阿比吉特·班纳吉（Abhijit Banerjee）和埃丝特·迪弗洛（Esther Duflo）是2019年诺贝尔经济学奖得主，其贡献在于通过随机实验研究来挖掘贫困的根源，并在实践中表明哪些政策真正能起作用。他们将“如何解决贫困”这样一个世界性难题，分解为较小且更易于掌控的问题。这些小巧的问题通常可以通过精心设计的干预性实验得到精准的答案。他们曾在印度评估“儿童之友”项目对提高学习结果的有效性进行研究，并认为较好的方法是进行随机对照实验。该项目的主要干预措施是为市区公立学校增加一名从社区招募的老师。实验设计的一种合理操作是选出有资格参与该项目的样本学校，再将新招募的老师随机分配。然而学校管理者对这种设计持保留态度，原因在于对照组的学校没有接受新教师的帮助，还要让学生接受额外的测评。他们于是运用了一种不同的设计：给每个自愿参与实验的学校都提供一名新教师，再把她随机分配给三年级或四年级。这样在实验第一年，一半的小学有一名新教师服务三年级学生，另一半小学有一名新教师服务四年级学生。在实验第二年，新教师的年级分配进行交换。实验以超乎寻常的低成本干预给印度城市中学习困难的小学生带来了成绩上的重大变化。在经过20年的努力，基于随机实验的新方法从根本上改变了发展经济学的既有研究方式，现在这已成为一个蓬勃发展的研究领域。

随机对照实验是实现因果分析的经典方法，它是通过随机分组形成对照组和控制组之间的数据关联，以此来实现对干预的因果效应的有效识别。随机对照实验最初来自农业科学，后来普遍应用于医学和药物研究。将随机对照实验大规模地应用于社会政策与改革的成效评估是班纳吉、迪弗洛的独特学术贡献。在他们的影响下，美英等国的教育研究也越来越多的使用这类方法，基于该方法的研究在今日美国通常会获得最高级别的资助金额。奥巴马2015年重新授权的《小学和中学教育法案》明确提出，如果一项教育干预的实际效果要获评最高等级，其证据应该来自严格的实验研究。实验研究与准实验研究的基本差异就在于是否随机分配被试进入实验组与控制组。实验研究能提供变量间最可靠的因果关系信息，决策者通过这些信息可以制定出有效的政策进行有效的干预，改变人群的行为走向及其结果，使其未来的发展与政策预期目标能够保持一致。

这些事实说明，不是教育问题的研究不能取得重大成果，也不是对教育的研究不能取得飞跃，关键在于能否在实证研究方法上取得突破。

2021年，诺贝尔经济学奖授予戴维•卡德（David Card）、乔舒亚•安格里斯特（Joshua Angrist），以表彰卡德在劳动经济学的重点问题——教育投入与教育回报之间的关系方面做出的重要贡献，表彰安格里斯特对因果推断方法的发展与应用。关于教育投入与教育回报涉及对教育性质的认识和教育投入的决策。此前该类研究有三个方法难点：（1）如何衡量教育资源的投入。（2）个人收入数据的自相关性导致回归分析难以做到客观公正。（3）教育投入与教育回报之间漫长的时间间隔，导致包括宏观经济形势、劳动力市场变化以及技术进步等因素都会对两者的相关性分析造成极大的干扰。卡德提出的解决方法是：（1）用学生与老师数量比、学期平均长度以及老师平均工资等指标衡量教育资源的投入。（2）分析处于同一劳动力市场、种族一致、收入水平一致但接受教育的时代及地点不同的工人，通过构建收入变化与教育质量变化之间的差分模型来消除自相关以及时间间隔带来的影响。经济学界高度认可他们基于“自然实验”研究方法的案例分析，认为他们证明了教育投入水平显著地影响学生的受教育程度以及学生的未来收入，这一结论在当时的美国具有极大的政策影响力，联邦政府在20世纪90年代之后一直保持对教育的高投入水平。

安格里斯特最重要的工作与一种因果推断方法——工具变量有关。他曾在研究中利用了美国的强制入学年龄和法定退学年龄的制度，巧妙地构造了一个自然实验，从而回答了“多读一年书会带来多少收入”这个教育和劳动经济学中的难题。因为孩子们的出生季节不同，虽然他们在相同年龄开始上学，但在达到法定退学年龄时，他们的教育年限可能会有所不同。基于数据，可以比较不同出生季节的人的教育年限和收入差异。出生季节被用作一个工具变量。出生季节与一个人实际受教育年限有关，但与他们的其他特征（如智力）是独立的。通过“两阶段最小二乘法”来估计教育年限对收入的影响。第一阶段，他们预测个人的受教育年限；第二阶段，他们利用预测的受教育年限来估计其对收入的影响。通过这种方法，能够控制许多潜在的混杂变量，提供一个更为准确的教育年限对收入影响的估计。该类研究提供了关于劳动力市场的新见解，并展示了可以从自然实验中得出关于因果关系的结论。

（二）教育公平从主观感受走向客观度量是第二个典型案例

教育公平吗，人们对教育公平的判断是主观的还是客观的，如果是主观的，如何使主观的公平感客观化？教育公平从哲学层面走向政策层面，并且对政府决策产生了明显的影响，与美国社会学家科尔曼（James Samuel Coleman）等人对这一问题研究的方法突破有关。在当时美国有色人种的学习成绩普遍比白人低，主流媒体的观点是有色人种智商较低，不善于学习。这种默认造成了有色人种地位的低下以及白人与有色人种学习的隔离。受美国国会委托，科尔曼1964年带领他的研究小组对分布于美国的4000所学校60万学生进行了大规模调研，并对大量的调研材料进行了为期两年的分析。经过研究后发现，有色人种学业成绩低的最主要原因并不是学习能力不强，而是因为同侪之间的影响。这一研究扭转了有色人种学习能力低的传统观点，为改善不利人群的教育提供了科学依据。这为之后美国出台“校车计划”，政府用校车将有色人种的孩子送到白人聚集的学校学习奠定了基础，促进了有色人种和白人的融合。这一研究不仅促进了教育公平，而且对消除种族隔阂产生了历史性影响。

20世纪80年代以后，经济学的一股新兴力量实验经济学兴起，公平原则被实验所证实。古典经济学认为追求利益最大化是人的本性，即所谓的“经济人”假设。这一假设总是受到人们的质疑，但是没有证据能够证明这一假设的不足。1982年德国科隆大学的三位经济学者设计了“最后通牒博弈实验”（Ultimatumgame），挑战了“经济人”假设。该实验征集了42人，将他们分成21组，每组2人，每个组送给他们4马克，请他们随意分配。两人小组中，一人提出分钱方案，另一人决定是否接受。如果同意分配方案，则分配成功；如果不同意，则分配失败。分钱只能进行一次，如果受分配的人不同意则实验者将钱收回，所以称为最后通牒。按照传统经济学的利益最大化原则，分钱者会留给自己尽可能多的钱，对于接受分配的人来说，分给自己的钱数不管多少，他只能接受，因为再少也比没有好。但实验的结果却并非如此：当分配者分给对方少于1马克时全都被拒绝。后来很多经济学、社会学家进行过类似实验发现，当分配者分给对方少于30%时几乎都被拒绝。这一实验表明，公平观念和利益最大化原则共同决定着人的行为。“经济人”假设并不能解释人的经济行为的多种动因，也许可以有个新的假设：随着经济与社会的不断发展，非利益动因在人的行为中将发挥越来越大的作用。

随着交叉学科的不断发展以及实验经济学和实验心理学的深入，教育公平的实验研究方法也得到越来越多的应用。从国际上看，实验经济学家恩斯特·费尔（Ernst Fehr）也是运用最后通牒的实验方法通过分糖游戏研究瑞士3—8岁儿童的亲社会行为、妒忌行为和分享行为。实验研究的结果表明，儿童的利他性和公平性随着年龄的增长而变化，也受到性别、家庭背景、社会经济背景等因素的制约。虽然儿童的公平感知随着年龄的增长而增强，但公平感知的发展受到社会规范以及父母教育水平的显著影响。挪威经济学家阿尔马斯（Ingvild Almas）等人和亚历山大带领的团队基于独裁者游戏的实验（dictatorgame），通过对5—13年级的学生的自私性、公平性和对不公平结果的接受程度进行的研究，发现随着年龄增长，儿童对公平的感知度会提高，同时对于不公平结果的接受程度也会提高。比如五年级的小学生会按照平均主义的公平观看待分配问题，但年龄更大的儿童则偏向根据绩效或个人成绩的公平观看待分配。

从国内看，黄忠敬运用实验研究的方法，通过利益相关者和旁观者游戏，对小学、初中和高中不同年龄阶段的667名学生的公平偏好进行实验研究，探索学生眼中的公平观，分析学生公平偏好的影响因素。研究发现，中小学不同年龄学生的公平偏好是发展性的，学生最初倾向于均等主义的公平观，随着年龄的增长以及受到同伴关系、认知发展、社会经验等因素的影响，学生越来越倾向于接受由运气、绩效和效率导致的不平等，体现了差异化的公平观。家庭背景与学校教育在塑造儿童公平偏好过程中均起到重要的作用。家长的学历和教育水平会影响儿童的公平偏好，父母学历越高，学生越容易接受由运气导致的不平等分配。中国比较独特的班干部制度的育人价值不仅体现在班级管理与领导力提升等方面，也体现在塑造儿童不同的公平偏好上。

（三）新的问题呼唤新方法

如今我们已经进入了数字时代和教育高质量发展新阶段，面临一系列重大教育理论问题和实践问题，明显存在理论落后于实践、研究跟不上政策的现象。其重要的甚至是根本的原因就是在面对新的教育思想和新的教育实践要求时，已有的研究方法不同作出及时的响应，构建自主教育学知识体现缺少方法论的支撑。

比如教育现代化，这是我们教育的明确目标和历史任务，受到高度重视和广泛实践。但由于对教育现代化的实证研究受制于方法创新的不足，教育现代化的研究处于低水平重复的状态，研究严重落后于实践的需要。什么是教育现代化，教育现代化的标准是什么，我们的教育现代化实现到什么程度了？由于缺乏明确的操作性定义，缺乏有效的实证研究方法，所以这个问题总体上是思想框架内的讨论，缺少确切的知识获得和知识积累。20世纪80年代我曾经参加过一个关于教育现代化的研讨会，大家的讨论集中在原则和内涵两方面，比如本土性与世界性、技术性与人文性、历史性与未来性的关系，比如人的现代化，内容的现代化，技术手段的现代化，制度方法的现代化等等。在当时来讲，这些思辨都是非常有意义的，但40年过去了，我又参加了一次主题相同的讨论会，令我感叹的是，讨论的内容和深度与40年前基本大同小异，没有明显进展，这在其他学科是难以想象的。为什么出现这种现象？关键是缺少切实有效的研究方法，缺少在确定理论和标准指导下的定量研究，不能提供比主观感受和经验判断更确切的知识。

比如拔尖创新人才培养，这是一个很重要的话题和政策，但什么叫拔尖创新人才，用什么标准和方法发现，如何培养是有效的？由于缺乏合目的的方法论证，所以相关的观点和政策基本是主观性判断，对于结果均无法作出客观检验。从历史上看，拔尖创新人才的培养很多国家都很重视，曾经有过很多尝试，主要有三种模式，一种是建立特别通道，专门选拔，专门培养，专门任用；一种是混合通道，在正常培养体系里特殊培养；一种是正常通道，自然环境，自由竞争。由于三种模式的成败得失至今缺乏可信的实证研究，缺乏不同培养模式的比较研究，所以关于拔尖创新人才培养的政策明显缺乏基于证据研究的支撑。

再比如核心素养理论，其概念的提出是对既有知识与能力关系的理论，对知识数量与质量关系对理论的巨大挑战，对当下的教育改革具有重要意义。但由于对核心素养这个概念的内涵、要素及其相互关系缺乏严格的定义和实证研究，当我们拿这个概念指导课程设计和教学改革时，还缺乏共识。大家知道，美国心理学家加德纳（Howard Gardner）曾提出过多元智能理论，提出了7种相对独立的智能要素。尽管他综合心理学、社会学的方法，力图进行实证研究，找出7种智能要素的证据，但由于方法创新不足，所以尽管多元智能理论得到广泛认同，但至今也还是一种猜想。比起多元智能理论来，核心素养几乎就是一个主观构想，缺乏可靠的证据证明核心素养的确切性和内在关系的理解，急需要通过研究方法的创新找到核心素养的根据和量化测量的工具。

又比如教育强国，这是我国教育发展的新旗帜新目标，是使我国成为重要世界教育中心、人才中心的时代要求，对教育的发展和国家的强盛具有重要意义。但学术上对教育强国的研究也缺乏既体现思想性又具有可操作性的定义，缺乏在明确思想和标准指导下建立起来的可以测量和量化的方法，所以关于教育强国的讨论要么就是用陈旧的以规模扩大为基础的数量观定义和测量教育强国程度，要么就是主观性的观点、看法的议论。事实上，关于教育强国的研究迫切需要建立起有科学依据的重点、路径、条件等框架和政策建议，需要在研究方法上有所突破。

工欲善其事，必先利其器。知识体系是由概念、论点、论据和篇章构成的，但它们的基础是特定生存状态下的问题和对问题解答的思维过程和结果。而思维过程的科学性，思维结果的正确性，思维水平的跃升，依赖于有效的方法和方法的创新。

（本文参考文献略）

Innovative Methods as an Intrinsic Requirement for Constructing an Autonomous Knowledge System in Education

YuanZhenguo XieChen PanSudong ChiShaohui YuNa ChenSiyu

Abstract: The growth and accumulation of autonomous knowledge are the foundation for constructing an autonomous knowledge system. The history of scientific development demonstrates that the revelation of the laws of motion in various forms, whether physical, chemical, biological, or social, is inseparable from innovations in research methods. Empirical research plays a key role in this process, and to a certain extent, method innovation equates to the innovation of empirical research methods. Compared to natural sciences and other social sciences, the growth of knowledge in education sciences is relatively slow and the accumulation of knowledge is inadequate. A core reason for this is the insufficiency of empirical research and methodological innovation. Currently, we have entered the digital age and a new stage of high-quality educational development, facing a series of significant theoretical and practical educational issues. Addressing the challenge of inadequate autonomous knowledge through methodological innovation is an intrinsic requirement for constructing an autonomous knowledge system in education.

Key words: methodological innovation; empirical research; autonomous knowledge system

初审：王悦桦

复审：孙振东

终审：蒋立松

1laiylaiylilai