随着义务教育的普及和国际竞争的日趋激烈,世界各国越来越重视教育质量的提升,重视对基础教育阶段学生学业成就的调查,以便为国家教育质量的宏观监控和教育教学的改进提供坚实依据。由于种种原因,我国学生学业成就调查的开展与研究迟迟没有效果。纵观国际学生学业成就调查趋势——
学生学业成就是反映教育质量的核心指标。现代学生学业成就调查越来越重视学生的学业能力,特别是解决实际问题的能力;以学生为本的思想日益彰显。
学生学业成就评价的难题是,对学生情感态度的评价较薄弱;能较好地培养和体现学生主体性和社会性发展的评价信度和效度问题难以解决;学生潜能、教育教学效果和社会环境因素的影响很难区分,等等。
我国一直缺少宏观层面的学生学业成就调查数据,缺乏判断全国教育质量实况的有力证据,这成为推进教育公平、实现教育均衡发展的政策制定和决策瓶颈。
我国需要在国家层面建立包含学生学业成就的教育质量监测制度和体系;测试指标应抽取对学生发展最重要的、教师易教会的内容来施测;要将课程改革的新理念和新的培养目标融入评价标准和测评工具。
学生学业成就是反映教育质量的核心指标。随着“两基”的全面推进和人们对教育质量、教育公平的全面关注,尽快调查和掌握我国学生的学业成就现状,已成为当务之急。由于种种原因,我国在学生学业成就调查的开展与研究上至今仍处于薄弱状态。
国外学生学业成就调查自诞生以来,在理论与实践方面都有比较大的进展,系统梳理这方面的成果和经验,对我国开展相关研究具有重要的启发意义和借鉴价值。
学生学业成就调查的发展趋势
现代学生学业成就调查研究的理论进展与教学评价的发展基本一致,已经历了测量、目标为本、目标参照和人本化四个阶段。测量阶段始于19世纪末,到20世纪30年代基本成熟。该阶段形成了测量理论和测验技术,并大量运用于学生学业成就测验和心理测量。目标为本的阶段即“八年研究”(美国俄亥俄州立大学教授泰勒受卡内基基金会的资助,进行了历时八年的课程与评价研究,这就是教育评价发展史上著名的“八年研究”)前后,对学生学业成就测量的影响是将其引向教学目标的有效性。目标参照阶段是20世纪50年代至70年代,美国教育学家布卢姆等人的教育目标分类在其中起了很重要的作用,对学生学业成就的价值判断也在此阶段得到重视;心理学中的认知派动摇了行为主义的地位,学业成就测验突出了学生的信息加工过程及其结果。20世纪80年代以来,人本化的学生学业成就评价兴起,最明显的标志是项目反应理论把学业成就评价引向了计算机化和因人施测的方向;模糊评价法发展了学业成就评价的数据处理技术;真实性评价、表现性评价等质性和量化评价的理念与技术得到广泛探索和应用,评价者和评价对象之间的不断交互、共同建构、全面参与得到强化。纵观这一发展,可以发现其中有两条明显的主线,一是越来越重视学生的学业能力,特别是解决实际问题的能力;二是以学生为本的思想日益彰显,更加重视学生在评价中的主体地位和全面发展。
是什么在影响学生学业成就调查
在国外,由国家在宏观层面调查学生学业成就现状并进行影响因素分析的方式有两种,第一种是本国自己定期组织不同年龄段(9、13岁或15、17岁)各学科(阅读、写作、数学、科学、公民、社会学、文学、艺术、音乐、职业发展等)的学生学业成就调查,建立国家常模,开展纵向和横向比较研究。美国的全国教育进展评议中心(NAEP)调查,英国的学生成绩评估组织(APU)调查,日本国立教育政策研究所组织的调查,澳大利亚、新西兰、瑞士等国的周期性国家常模修订调查等皆属此类。第二种是参与国际教育成就评价协会(IEA)和经济合作与发展组织(OECD)等组织的国际学生学业成就调查研究。目前,全世界参加上述组织的国家和地区均有几十个之多。总的来看,第一种往往受第二种的显著影响。
调查的维度与标准
无论是各国自己所组织的国家宏观教育质量监测还是国际评价组织的评价,学业成就调查一般都包括成就测验和背景因素调查。
学业成就测验分学科领域的关键内容和表现标准两个维度。关键内容指课程内容标准中的核心内容;表现标准是要求学生达到的掌握水平。表现标准划分的基本框架是布卢姆认知领域的教育目标分类(知识、理解、应用、分析、综合、评价)。此外,美国心理学家加涅的学习结果分类和美国心理学家安德森等人提出的认知目标二维分类体系也在不断影响着学生学业成就的调查研究。
从目前掌握的资料来看,动作技能领域的学生学业成就评价在大规模的调查中很少使用;情感态度的调查多限于学科和学校等背景因素,学科自身造就学生情感态度的调查不多见。
影响学生学业成就的因素,一般分为学习者、课程教学、学校及教育制度四个维度。学习者层面又包括性别、社会背景、自我认知(学业自我效能感、自我概念)、动机(学习兴趣、参与程度、自信心)以及教育期望等;课程教学层面包括教学策略、学生知觉到的课堂气氛、班级大小、教师支持、教材使用、学校组织和结构等;学校层面包括学校类型、学校结构、学校资源(人文、教育和物质资源的质量;教师和电脑的可用性)、校风(学生及教师的行为和道德)、学校管理以及课堂实践(活动、学生评价、教学时间、教师监控)等。这些影响因素在测验及问卷调查设计中都纳入指标体系,为最后结果的分析奠定基础。
调查研究的方法与实施
迄今为止,宏观监测中小学生学业成就的主要方法依旧是纸笔测验和问卷调查。纸笔测验用于考查学生的学业成就,问卷调查主要用于分析影响学生学业成就的各种因素。目前,在测验方法上出现的最大变化是以自适应理论为依据的计算机因人施测技术和成长记录袋评价在宏观教育质量监测领域的运用,美国匹兹堡市已做过这类实验,认为“有困难但并非不可能”。另外,真实性评价运用的势头也在开始增长,最明显的就是经济发展与合作组织的“国际学生评价项目”(PISA)。问卷调查的对象有学生、教师、校长和家长,有时还要对相关人员进行访谈、实地观察及相关文本分析,以了解学生学业成就存在差异的成因,寻求多方面的协作来改进学生的学业成就。
在调查对象的选择上,一般采用分层抽样技术。如“国际学生评价项目”调查,设计为两阶段分层取样,第一阶段的取样单元为含有15岁学生的学校个体,取样之前,要将在取样范围内的学校(学校的最低参与率为85%)或内隐或外显地分配到层,然后以随机抽样的方式在每层抽取学校,各层之抽取率与各层学校多少及学校内的学生数量成正比。第二阶段的取样单元为样本学校中的学生个体,从每一所样本学校中等概率抽取35名学生(底线为20名),所抽取考生的作答率要求达到80%(底线为50%)。为了保证样本的总体覆盖率,学校和学生层面的总排除率必须低于5%。
调查结果的分析与解释
对调查结果的分析是结合学生团体的成绩和来自问卷调查等方面的数据进行的综合判断,主要是求各种相关,如家庭、学校和环境对学生学业成就的影响等。
对测验成绩的解释有两种,即常模参照和标准参照评价。常模参照评价是指联系先前其他学生在该测验上的表现来解释现在学生的成绩,先前的那些学生被叫做常模组,其对分数的解释是相对的;标准参照评价依赖测验内容对某一评价领域的代表程度作出分数解释,评价不涉及他人,因此又称为绝对评价。前者是当今选拔性考试等高利害测验中必需的,后者更多地用于改进教学。
对大规模学生学业成就调查分析与解释在技术上的分歧基本集中在认为它所能测量的成就内容不够全面,但谁也不能否认其代表性和功能,主要的批评在于对它的滥用上——过多地给学生排名划等,摧毁了无数学生的自信心,以及仅以学生学业成就来评价教育质量等,由此产生了运用多元智能和成功智力等理论对质性评价的探索。
总的来看,目前国外学生学业成就评价存在的困难和问题是,对学生情感态度的评价比较薄弱;在国家或地区层面的宏观监控中,真实性评价、表现性评价、成长记录袋评价、小组合作评价等能较好地培养和体现学生主体性和社会性发展的评价信度和效度问题难以解决;大规模调查中学生潜能、教育教学效果和社会环境因素的影响很难区分,等等。
我们的相关研究该注意什么
学生学业成就调查研究需要理论先行
无论是国际组织还是各国自己开展的学生学业成就调查,都是在一定理论指导下进行的。涉及学生学业成就调查的理论,既有测量理论,更有教育理论,特别是测试组织者的教育质量观。“国际学生评价项目”调查着眼于15岁学生在成年后适应成人生活的能力,而“国际教育成就评价”的调查偏重学生学科知识、技能的掌握,日本国立教育政策研究所组织的调查试图两者兼顾,其中既有共性也有个性,同时还隐藏着不同的文化价值观和许多悬而未决的问题。因此,开展学生学业成就调查首先要解决:什么是学生的学业成就?目前人们应持怎样的学业成就观?调查的目的和目标是什么?国外的学业成就调查理论如何本土化?我国的学业成就调查经验如何理论化?如何确立我国学生学业成就调查的基本理论?
学生学业成就的监测需要制度保障
长期以来,我国几乎没有进行过国家宏观层面的学生学业成就调查研究,国家在这方面的数据一直处于空白状态,缺乏判断全国教育质量实况的有力证据,成为推进教育公平、实现教育均衡发展的政策制定和决策瓶颈;国家义务教育“两免一补”政策实施的成效,教育投资与产出的效益,都缺少学生学业成就的数据给予佐证;本世纪初全国推行的课程改革,其课程目标达成度如何,怎样调整课程政策、完善课程标准、指导课程实施,也没有学生学业成就的数据供决策者参考。在我国积极开展基础教育阶段学生学业成就调查,并在国家层面建立包含学生学业成就的教育质量监测制度和体系已迫在眉睫。
旨在改善学生学习的评价需要调查方法的优化
改善学生的学习,是大多数国家和国际组织学生学业成就调查研究的本体价值。欲达到这一目标,就需要相应的调查方法给予配套支持。目前,各国组织的学业成就监测以及国际教育成就评价协会、经济合作与发展组织等组织的大型国际调查,均采用测试与调查等方法的优化组合,目的在于了解学生学业成就状况以及造成学生学业成就差异的影响因素。这些数据来自学习者、教师、校长、家长等方面,通过先进的统计分析工具对调查结果进行处理,基本上能够解释学生学业发展水平存在的差异及其成因,从而为改进教学、指导家庭教育、完善学校管理制度等提供有力证据。
学生学业成就的调查应抓住重点
国际教育成就评价协会、经济合作与发展组织的国际评价项目主要集中在数学、科学和阅读三个核心课程领域,对学生发展而言,它们是最基础的课程,也是各国共同的核心课程。对这三个领域的学业发展水平的调查研究,可以对学生当前学业状况及未来发展的准备状况作出基本的判断。同时,美国的相关研究启示我们,由于受测验容量和时间的限制,测试指标应抽取对学生发展而言最重要的、对教师而言在有限的时间内通过一般的教学方法可以教会的内容来施测,否则所编制的测试工具对推断学生的学业发展水平就是无效的,对改进教师的教学也是无意义的。
调查的维度应逐步完整和全面,具有发展性
从“国际学生评价项目”的发展趋势来看,对学生学业发展水平的测试工具在逐步改进,渗透了真实性评价的思想,以考查学生面对实际问题情景的理解力、判断力以及应用所学知识解决真实问题的能力;同时,学生在知识技能学习中的学科情感、态度、价值观等方面的发展水平也逐步纳入测试指标体系,以全面考查学生学业发展状况。这种变化反映了随着教育观念的转变和课程的不断革新,教育质量的标准也在发展。这启示我们在调查学生的学业成就时,要将课程改革的新理念和新的培养目标融入评价标准和测评工具,既考查学生全面发展的状况,也通过调查结果的反馈推动这些新目标的达成。