摘 要:本文提出:(1)教育是基于个体的心智发展及社会文化的发展逻辑而展开的,教育的逻辑是指教育的理想目的及达到目的的合理运行机制,包括演化规则和有效秩序。赫斯特、本纳和比斯塔等教育理论家从主体性发展分析了教育的目的,而教育过程是一个关系性过程,其核心是教与学的关系。(2)教与学的活动是一种复杂的、具有涌现效应的适应性活动,其基础是文化。(3)教育过程一直运用多种技术手段,包括教育的人工智能方法,但这些教育技术及教育人工智能只是教与学活动的工具,虽然带来了更为多样和活泼的课堂,但对学生学业发展的作用有限。(4)生成式人工智能ChatGPT的出现带来了教育新的样态,标志着人工智能与教育关系的突破。(5)未来的教育人工智能将与教与学的活动呈现一种共鸣关系。
关键词:教育的逻辑;关系性存在;教育人工智能;共鸣
今日社会,人工智能(artificial intelligence,简称AI)为人类所有的工作领域带来了渐次丰富的想象,随之而来的将是不可预计的世界,相互依存、风险、不稳定、困惑和恐惧也接踵而至。目前人工智能的发展又是一场竞赛:它发生在全球紧密联系和人类发展之好坏后果之间;在包容和排斥的各种力量之间;在繁荣的精神和盛世背后的风险之间,历史也正在被书写。那么,它给教育带来什么影响呢?
一、教育的逻辑
讨论人工智能对教育活动产生影响的可行性,必须从分析教育过程的基本逻辑(underlying logic)开始。这种基本逻辑就是所谓的底层逻辑,也是教育的本原。亚里士多德说,人是逻各斯(logos)的动物。logos本意是语言、理性、思维等,我们因此可以将人视为运用语言进行逻辑或理性思维的动物。《荀子·非相》曰:“然则人之所以为人者,非特以二足而无毛也,以其有辨也。”“有辨”就是“有分”,“有分”就是“有礼”。有了礼的等级划分,人类社会才能有良好的组织和秩序。也就是说,明晰了伦理关系的动物才是人。但人并非天生如此,是文化塑造了人类的心智。如荀子所意识到的,具有群体生活特征的人类在群体生活的交易中,通过语言交流和重复博弈后果的思考,会有意识约束自己行为的扩张性,通过制造规则和规范而形成自我要求。而教育一方面就是传递这种社会活动的规范,另一方面引导出人的优秀品质或德性(virtus)。但教育的对象一开始是针对上层社会的。正如韦尔纳·耶格尔(Werner Jaeger)所说,在西方历史的很长一段时间里,教育的兴趣在于“贵族化”(aristocratic)而非“民主化”(democratic)①,它是为那些已经拥有某种资源的人——大多数情况下是富裕阶层——提供文化资源来提升自己。只有在大众化教育后,才有面向全体国民的教育。
那么,什么是教育的逻辑?狭义的逻辑指的是思维规律和推理规则;广义的逻辑泛指规律,包括内在思维规律和外部客观规律。基本逻辑是在表象变化背后不变的东西。这里,教育的逻辑是指教育的理想目的及达到目的的合理运行机制,包括演化规则和有效秩序(框架)。
教育是基于什么而展开呢?教育是基于个体的心智发展及社会文化的发展逻辑而展开的。著有《教育的逻辑》(The Logic of Education)的英国教育哲学家赫斯特(P. Hirst)提出,理性主义视野中的人类心智是由认知(cognitive)、情感(affective)、意志(conative)所构成。认知涉及知觉、概念、真理、推理、记忆等,情感涉及情绪、喜好、欲求等,意志涉及人们的行动、倾向(disposition)、意愿(will)等。情感和意志能力的本质是由认知能力所获得的概念、信念和知识构成的,并且在其可理解的操作中受到限制。认知能力的核心功能是形成概念框架,在这种框架中可以做出真理的判断,从而可以获得合理或理性的信念、理性的行动甚至理性的情感。因此,个人选择的自由当然是美好生活的核心。但是这种选择必须根据理性的要求进行,人性和环境的共同点是,理性为所有人的社会生活规定了一个广泛的共同框架。如果理性在公共生活和个人生活中都占上风,至少某些普遍的基本社会原则、特别是自由民主的原则,可以被有力地辩护为普遍有效的。从教育的角度来看,它对理性自主生活中特殊观点的关注为教育目标的形成提供了一个清晰连贯的框架。教育实践的规划被认为是合理地确定要追求的目标,随后确定可能的最佳手段,最后执行所得出的方案。其目的首先是发展知识和理解,并进一步追求那些对个人和社会生活中所有其他方面的发展都具有内在价值和重要意义的目标。为此,已经实现的知识和理解的形式被逻辑地映射,并且所涉及认知目标的多样性被用于探索它们的相互逻辑关系。1992年,赫斯特反思自己将理论知识视为发展健全的实践知识和理性的个人发展的逻辑基础的失误,认为实践知识比理论知识更重要,前者是清楚地理解后者意义的基础。我们必须首先认识到教育不能再被理性地规划了,作为一种社会实践本身,它只能在实践中并在与它紧密相连的其他社会实践的关系中得到合理发展。[1]赫斯特这种反思将原初仅从理性主义视野对教育逻辑的考察扩展到了社会文化的视角。
真正论证教育自身逻辑的,是德国柏林洪堡大学(Humboldt-Universitätzu Berlin)教授底特利希·本纳(Dietrich Benner)。他把现代教育思想和教育行动的原则划分为四个基本原则:可塑性原则、主动性要求原则(亦即促进主动性原则)、把社会影响转化为合理的教育影响原则(简称教育转化原则)和人类总体实践的分化形式间的非等级的原则(简称非等级性原则)。前两者为构造原则,涉及教育实践的个体方面,限定教育实践的根本特性,是一种历史的先验原则(apriorisch,或先天原则);后两者为调节原则,涉及教育实践的社会方面,限定了教育实践和其他实践形式的关系,是一种历史的经验原则(aposteriorisch,或后天原则)。可塑性原则和促进主动性原则具有一定的超历史意义,决定了一切时代、一切社会形式的教育,是教育的根本特性。可塑性是指人天生就具有学习能力,这种学习能力不是通过教育产生的;促进主动性,意味着给学习以支持。人的学习能力存在于所有教育之前,却依赖于教育支持。换言之,学习过程的教育支持只能是通过促进成长中一代的自我经验、自我思考、自我判断和自我行动来进行。[2]
本纳进一步指出,学习某种东西,首先必须把所学转化为知识问题、能力问题或行动问题。这种必要的转化是要按照学习能力(可塑性原则)和教育所要求的主动性(促进主动性原则)对所要学习的东西加以设计,也就是说,必须把所要学习的东西转化为一个教学论问题,或一个参与性的问题(亦称为社会教育的转化)。教育转化的根本不是解决问题,而是开启对问题进行共同交流和探讨的可能性。此转化是把成人的问题转化为儿童的问题,转化为代际的问题。但这些问题的解决并不是在教育领域,而是在经济领域、伦理领域、政治领域和艺术领域,等等。非等级性原则指出,社会存在教育问题、经济问题、道德问题和政治问题,但是教育问题不能通过经济、道德或政治来解决,反之亦然。所有这些问题都是重要的,它们之间不存在等级关系,而是相互联系,并通过其在公共讨论中的问题反思而相互区分。例如,国家通过政治制度占有了法律制定,教育制度通过学校教育过程而占有了教学。什么是好的学习不能从好的政治中推导出来,同样,好的政治也不能从好的教学中推导出来。这就意味着教育具有独立于其他社会子系统的自身逻辑。[3]
本纳认为教育没有给予人任何可以继承的形式,每个人、每一代都要重新开始教育。柏拉图在“洞喻”中指出教育是一种目光转向的艺术。但是我们只能在学习中自己做到这点,而不能在学习之外做到这点。因此,教育不是使人完善的艺术,而是使人目光转向的艺术,通过这种转向,使学习者继续学习新的东西。教育的任务不是把学生引入一个新的时代,而是通过人为的学习过程提高其判断力和参与能力,这是、并将永远是教育自身逻辑的体现。本纳对教育之“目光转向”的理解告诉我们,不能只是思考本身,除非我们有一个思考的对象,否则只是在那里思考会一无所获。
荷兰教育哲学家格特·比斯塔(Gert Biesta)高度认同本纳的教育理解,他建议教育应该面向三个目标领域,即资格化、社会化和主体化。他强调,主体化与儿童或学生作为其生活的主体的存在有关,而不是作为教育干预的对象。因此,主体化与自由的问题有关。比斯塔解释说,这不是做自己想做事情的自由,而是以一种“成熟”的方式在世界中行动和与世界一起行动的自由。[4]本纳提出,教育是“呼唤自我行动”(Aufforderung zur Selbsttätigkeit)[5]。Selbsttätigkeit的字面意思是自我行动,不是要求他主动行动的命令,而是自我行动的指令。用更日常的语言来说,这不是关于成为你自己,尤其不是关于简单意义上的“成为你自己”,只是做你想做的事情;而是关于做一个自我,成为你自己生活的主体。比斯塔认为主体化是三个目标领域中最重要的,不是因为知识、技能和传统不重要,而是因为只有当主体化进入场景时,我们才处于教育领域;而在缺乏主体化的时候,我们处于训练领域,我们只是把它们当作事物或物体来对待,而不是把它们当作主体来对待。将他人视为主体,意味着承认他们的能动性、尊严和独特性,包括参与对话、理解他们的经历、重视他们的个性。所以,正如杜威注意到的,在很多情况下,一个未成熟的人只是为了获得各种有用的习惯而进行活动。他像动物一样被训练,而非作为人来受教育。假设他成为这个共同活动的参与者,就会与别人一样,对活动的成果有同样的兴趣,也会分享他们的理念和情感②。训练是我们对某人做的事情,而教育总是与某人一起发生。一旦我们认识到教育也是关于主体化的,那么学生的主体性就不是为了使教育机器更可预测和更有效而需克服的问题,而是我们努力关注的重点。
从赫斯特到本纳、再到比斯塔,笔者试图从理论上分析教育的逻辑,即讨论教育的目的及其实现可能性。教育活动的核心在于教与学的关系,这是教育目的达成的主要机制,这种教—学关系在日常教育中展开为各种教学模式、教学策略和技术的运行。本纳意识到这一点,他指出,没有技术,解放是不可能的。教育科学必须发展一种非肯定的教育技术。这种技术是要求学习者去感知、判断、思考和行动的技术,而不是告诉学习者如何去感知、思考、判断和行动,也不是告诉学习者应该感知什么、思考什么和做什么。肯定性的技术使学习者臣服于技术的专制,非肯定性的技术使学生从其对教师的依赖中解放出来,使他们有可能自由地自我思考、自我反思、自我判断和自我行动。这个意义上的教育过程体现了对世界的感知和能力发展的相互作用,其中世界和自我并不是线性地被规范,而是借助经验和反思得以发展。[6]
二、技术与教育的关联
教与学的活动是关系性活动,存在两个前提:一是没有“教”就没有教育活动,只有学习,而学习可以不在教育场所,可以没有教师的参与;二是如果不是人与人的教与学活动,就可能出现人—机的教与学,但人—机的教与学是不是所谓的教育?这是另一个问题。以课堂为主要教—学场所的教育活动,至少涉及五个方面:教师、内容、学生、技术和空间环境,它们共同构成一个复杂场景。
美国社会学家穆斯塔法·埃米尔拜尔(Mustafa Emirbayer)提出,任何对行动和互动的分析本质上都是交易性的,无论基于策略还是基于规范。参与者的活动嵌入事务境脉(context)。物质充其量是抽象的,它们在社会之外毫无意义,因为社会被理解为众多相互联系的个人。[7]同样,学校教育在所有分析层面——从制度到互动和个人——都是由相互依赖的社会关系构成的。这种策略假定个人从根本上不可避免地由社会关系构成,同时认为“社会结构”只存在于相互作用的个人之间的关系中。这给了我们从关系的角度关注教育实践的主要依据。首先,教育实践像所有的实践一样,卷入了社会生活的复杂性。其次,在实践中,“教育效果”被制定、参与、维持和转化,而实践是由关系构成的。作为关系性实在(relational reality)的教育过程呈现出一幅图景,其中个人行为嵌入并纠缠于塑造了我们对互动的理解和参与的关系,以及我们回应的互动中立即出现的关系,这意味着几乎所有可理解的行为都是在持续的关系过程中产生、持续或消失的。“关系也可以被理解为一系列重复的互动,每一次互动都会发生变化”[8]。教学过程是一个典型的互动过程,不仅涉及教师和学生之间的课堂谈话,也发生在某些可定义的活动中,包括学科内容、课堂交流和学习反馈,而教学策略对学生的学习有积极的影响。教学作为一种有意识的活动,意味着教在逻辑上可能并不意味着学,但可以预见它会导致学习。所以,教学既是一种艺术也是一种科学。作为艺术的教学需要发挥教师的个人才能和创造力,一个好老师是能给基本的教学内容增加创造力和灵感的人;作为科学的教学则包括一整套技术、程序和技能,可以系统地研究、描述和改进。
为了更好且更有效地实现教育目的,教与学的过程中采用了每一时代能够运用的各种技术手段,从口述——记诵到粉笔书写,从黑板到智能技术。在过去五十年里,科技被当作一种新奇事物,各种教育科技工具运用于课堂教学。以教育技术运用最为广泛的美国学校为例,可以提供一张教育技术在美国学校的课堂使用年表:
1809年:教室里的第一块黑板;
1865年:批量生产的优质铅笔;
1870年:大量生产廉价纸张供学生在课堂上使用;
1870年:大量生产钢笔,取代低效的羽毛笔;
1870年:学校里用来投射玻璃板图像的“幻灯片”;
1936年:第一台电子计算机;
1960年:教室里的第一台“现代”阴极射线管投影仪;
1967年:第一个手持计算器原型Cal Tech(由德州仪器公司创建);
1969年:第一个互联网形式,阿帕网(ARPR Net)。
科技最初进入美国教育体系,是为日益数字化的未来做准备的必需品,也是冷战时期美苏之间竞争的一部分。在见证苏联第一颗人造卫星发射后,美国将其在教育上的大部分注意力转移到数学和科学上,同时特别关注技术。美国国会1963年通过《职业教育法》,资助在学校使用技术。学生学会了像BASIC这样的编程语言,个人电脑也逐渐进入一些教室。在美国课堂教学中使用计算机时,教育工作者采取了两种途径。第一种途径是1980年代初,数学家西摩尔·派珀特(Seymour Papert)教授通过讲授基础编程,首次将微型计算机引入课堂。他的LOGO程序教会了学生基本的编程技巧。这一语言非常简单,任何一个小孩一天就能学会。在LOGO的世界里有一只小海龟,可以通过输入指令,让海龟在画面上走动,可以向上下左右或者按照你指定的角度移动;还可以让小海龟以加速或减速移动,也可以让小海龟重复某一个动作。这些指令看似简单,但如果能进行合理的组合和排序,就可以创造出各种东西,包括人、房子、汽车、动物、抽象图案等,发掘LOGO带给人们的无限可能。这个想法是创造以学生为中心的学习活动,需要动手探索,孩子们学会了创造图形的语言命令。派珀特将他的教学计划建立在他称之为“拼贴”(bricolage)的建构主义理论之上,这是一种让学生自己组装学习基石的策略。第二种途径是1980年代中期,苹果电脑进入课堂并站稳脚跟,一种常见的技术整合方法开始流行。教师使用教育科技软件解决方案——用电子程序训练学生,老师通常会给学生分配电脑任务,让学生根据自己的知识和记忆回答一系列问题。可惜电脑的普及并没有让孩子受惠,反而让他们为电脑所束缚。仅仅十年之后互联网就把全世界的计算机连接起来了,互联网的迅猛发展引入了电子邮件、视频和各种数字媒体,更重要的是实现了任何人、任何地点、任何时间之间的双向通信。这种联系彻底改变了商业和人际关系,但并没有改变教育的逻辑。
加拿大学者维奥拉托(C. Violato)在1989年发表的“给未来的一些处方”(Some Prescriptions for the Future)中说:“教育与心理学中的万灵药贩子抓住某个新概念或发现,就好似发现了最终真理。开放学校、教学机器、幻灯片、投影机、儿童中心教室、发现学习、规范性教学以及新近出现的微机,都是我们熟悉的万灵药的例子。在这些叫卖万灵药的人中,大多还是有些货色的,他们把一般的教育系统与具体的教师协会当作是随时可开发的巨大而又丰富的源泉。”[9]
进入21世纪初,随着技术应用的扩大,获取技术的机会也大幅度增加。这两方面的进步带来了一系列与这个数字时代学习者相关的研究问题,新一代学习者从童年起就被数字技术包围,可以称为“数字原住民”(digital natives),他们一出生就面临一个无所不在的网络世界,习惯于使用电子设备。由于学习者需要数字技能,今天的教育技术在许多教室中扮演着更活跃的角色,技术的适应性和非侵入性或许可以让使用技术的学习更有吸引力。数字学习(E-learning)和移动学习(M-learning)的技术工具为学生和教师提供了大量访问信息内容的途径,移动设备、智能黑板、MOOCs、平板电脑、笔记本电脑、模拟、动态虚拟化和虚拟实验室等新技术辅助学习工具的引入改变了学校和机构的教育。在2000年代,数字学习是最关注的话题;到2010年代,游戏化被用来增加学习者的参与度,越来越多的数字技术和移动技术工具发展导致了翻转课堂、MOOCs以及如何利用社交媒体增加参与度的实验;到了2020年,许多应用信息技术的研究集中于教学法,元宇宙概念使得增强现实和虚拟现实(augmented and virtual reality,简称AR/VR)技术的教育应用被关注,AR/VR等穿戴式工具开发及其课堂运用重新受到重视。由于新冠疫情发生,区域性数字学习系统受到严峻挑战,包括:技术因素、数字学习系统质量因素、信任因素、自我效能因素和文化因素等。实际上,通过疫情过程中在线教学的自然实验,大家感受到教育技术仍不尽人意。在线教学是一种非常规的体验,与课堂教学相比,既没有彼此亲近也没有冲突。但某些小冲突可能是积极的,有助于社会能力的提高或积极互动的建立。因此,在线教学的社会隔离另一个后果可能是学生长期人际适应所需的社会能力发展不足。
回味一下美国心理学家布鲁纳(Jerome Bruner)在其名著《教育过程》(The Process of Education)中的观点仍是有趣的:“教学的主导是教师,而不是教学器具。”[10]学校、家庭和政策制定者在技术上花费了大量资金,希望改善教育成果,但经济合作与发展组织(OECD)的报告《学生、电脑和学习》(Students,Computers and Learning:Making the Connection)发现了不理想的状况。OECD调查了31个国家和地区15岁学生的电脑使用情况,根据国际学生评估项目(Program for International Student Assessment,简称PISA)的测量结果,在学校使用电脑较多的学生阅读和数学成绩较低。尽管PISA的结果表明,在学校有限地使用电脑可能比完全不使用电脑要好;比目前OECD平均水平更频繁地使用电脑,往往会导致学生成绩显著下降。只有在某些情况下,信息技术才与更好的学生表现相关,例如当计算机软件和互联网连接有助于增加学习时间和练习时。我们都希望整合越来越多的技术以改善学习环境,使学习更具互动性与体验性,并为学生提供更先进的知识。但它似乎并没有像这样起作用。技术可以放大伟大的教学,但伟大的技术不能取代糟糕的教学。[11]美国加州大学经济学家布尔曼(G. Bulman)和费尔利(R. W. Fairlie)探讨了关于技术对教育成果影响的理论和经验文献,他们集中在技术可用于教育目的的两个主要环境,即学校的课堂使用与学生的家庭使用。从理论上讲,学校对信息技术的投资和计算机辅助教学的使用以及在家使用计算机,对教育成绩的影响是模糊的——用于技术的支出必然抵消可能或多或少有效的投入,分配给使用技术的时间可能会取代传统的课堂教学和家庭教育活动。然而,有关学校教育的文献中许多证据基于干预措施,这些干预措施为技术或额外的课堂时间提供了补充资金,从而有利于发现积极的影响。尽管如此,对学校信息技术和计算机辅助教学的研究产生了结果为零的混合证据。这种模式的例外只是出现在对发展中国家的研究和针对数学而非语言的CAI干预中。在家庭使用的背景下,基于多变量和工具变量方法的早期研究往往会发现巨大的积极影响(只有少数情况是消极的),而最近基于随机对照实验的研究往往会发现影响较小或无效。[12]
信息技术对教育的影响并没有像很多业内人士所期望的那样③。虽然信息技术为教育领域带来了一些便利性发展,比如带来了提供教学便利的白板和PPT、在线课程的补充性学习资源、学校管理信息的集聚等等,特别是带来了学校外部景观的变换,从校园里的电子欢迎屏到课堂门口的短视频,但它们都没有对学生学业及学习过程产生有意义的实质性影响,与学校对教育技术的巨大投入相比,其收益微乎其微。教育技术研究更像是一种技术信仰的布道,它在开发高质量学习体验的学习理论方面是贫乏的。进一步说,虽然技术将在塑造教育未来的过程中发挥重要作用,但要确保新的教学工具得到有效使用,就需要新一代的教育工作者理解课堂人际关系的重要性。
当然,很多教育技术倡导者仍然认为,技术在教育中的重要作用是能够为学生提供平等的机会。技术可以成为转变学习方式的强大工具,可以帮助确认和促进教育者和学生之间的关系,重塑学习和协作方式,缩小长期存在的公平和可及性差距,并调整学习体验以满足所有学习者的需求。于是,与教育技术相关的人工智能的运用成为教育的一个重要议题。
人工智能对于提供教育的方式有着至关重要的影响,教育人工智能可以在自适应学习技术、教育数据挖掘(educational datamining,简称EDM)和学习分析学(learning analytics,简称LA)中找到应用场景。其核心问题是:谁教学生?学生在哪里学习?他们如何获得知识和技能?由于人工智能是一种应用于教育领域的技术,教育的任何部分都可能面临这种技术的新的可能性。笔者以新近的一项综述《人工智能教育技术:最新研究和未来方向》(AI Technologies for Education:Recent Research & Future Directions)为基础,参照《教育过程的智能技术手册:最近进展》(Handbook on Intelligent Techniques in the Educational Process)、《教育人工智能的承诺》(Promises of AI in Education:Discussing the Impact of AI Systems in Educational Practices)等多项研究,分析教育人工智能的发展状况。《人工智能教育技术:最新研究和未来方向》以独特的教育角度,对1993——2020年之间发表的有关教育人工智能(artificial intelligence in education,简称AIEd)的经验研究进行综合评论。[13]他们基于科学网(Web of Sciences)数据库和选定的AIEd专业期刊,使用多种方法进行了全面审查,包括相关的文献计量学分析、内容分析和分类元趋势分析,藉此勾勒教育人工智能的发展轨迹。
AI技术确实给教育带来了广泛应用及其可能性,目前教育人工智能的特色发展主要集中于7种类型。(1)聊天机器人:人机界面在用户和计算机/软件应用程序之间的交流中起着重要的作用,聊天机器人作为一个快速发展的领域,是虚拟或远程实验室中教师和/或学生同伴的有趣和有用的促进者;(2)专家系统:专家系统可以模拟学习管理系统(learning management system,简称LMS),动态的、全面的专家系统可以帮助教学规划,并充分释放LMS在教与学方面的潜力,从而促进和改善教学。(3)智能导师或代理人(intelligent tutors or agents):智能导师是允许非常重要的一对一个人辅导的特定系统。基于这些系统的几个不同组成部分,它们可以根据学生情况选择合适的主题和教学内容或者决定学习路径,还可以提供认知支架。当然,这种个人辅导的缺点是缺乏合作和学生与同龄人的互动。(4)机器学习,可用于评估一些学生学习风格的变化,评估某些学习态度。(5)个性化学习系统或环境(personalized learning systems or environments,简称PLS/E):适应性和个性化教育系统的发展受到学习者的学习特点、偏好和风格的高度影响,开发目的是实现最佳的学习曲线,提高不同学习者的学习效能。个性化学习系统或环境便于促进互动,通过人工智能和增强现实(augmented reality,简称AR)进行的个性化移动学习,改善了相关的学习体验和学习成果。(6)可视化和虚拟学习环境(visualizations and virtual learning environments,简称VLE)。随着虚拟现实(VR)技术的激增,学生们喜欢在VLE的学习经历,能更好地参与学习并促进学习中的合作。(7)学习分析学(learning analytics,简称LA):为了理解和优化学习及其发生的环境,对关于学习者及其环境的数据进行测量、收集、分析和报告,以发现学习行为的特征模式,提高学习绩效和质量。[14]
总结目前应用最广泛的AIEd技术对于教育已证实或潜在的益处,包括两个方面:对于学习者来说,AIEd可以促进各种互动,增加学习者的参与度,生成适应性学习材料,提供元认知提示,展开丰富的学习环境,挖掘学习者学习过程的数据,形成学习者的特征模型,优化其学习效能;对于教育工作者和管理人员来说,AIEd可以提供预测模型,识别有天赋或有风险的学生,监控学习进度,创建个性化的学习材料、教学方式、评估和反馈,并即时分析缩放的数据以用于评估或管理目的。人工智能增强的学习环境可以通过专家系统改善教师和学生的LMS,生成视觉反馈,并通过可视化和沉浸式技术丰富学习体验。
分析这些教育人工智能产品的特性,除了学习分析学,大多是教学工具(如粉笔、黑板等)的延伸,还无法融入教与学的关系中。或许最能体现教育技术本质的当代理念是技术增强学习(technology enhanced learning,简称TEL),但是这方面只有概念,至今仍缺乏有效的进展。教学的意义在于,它暗示一种关系行为,学生被鼓励以特定的方式行事。而激发学生意味着他们被邀请去独立思考——这是一件被召唤去理解的事情。反过来,通过激发学生,老师也参与学习,学生也激发其师,刺激老师的学习。这就是所谓的“教学相长”。学习是一个内在的文化过程,智能技术和工具不能取代学习的文化浸润;学习不仅是传递知识或通过考试的过程,培养目标感对于自我导向的学习至关重要,而目标感的形成需要另一种温情的关系,那是由人与人的密切互动所激发的。
三、教育过程的涌现现象
互动和关系之间有一个至关重要的区别,关系是通过反复互动发展起来的,一段关系创造了在几个场合遇见相同的人的机会。根据克罗斯利(N. Crossley)的说法,社会关系是行动者之间反复互动的生活轨迹,包括一系列相互作用的、沉淀的过去和预测的未来。这里使用现象学意义上的“生活”一词,是表达过去的经历塑造并框定了现在的经历,因此现在的互动受到行动者之间过去发生的事情的影响。[15]它是通过先前互动的经验发展起来的,影响并塑造了持续的互动。一段关系可以通过互动来加强或削弱,每种关系都有一个特殊的“时间代码”(temporal code)[16]。关系可以被理解为一系列重复的互动,每一次互动都会发生变化。但是为了继续下去,还需要一定的内容和形式。实际上,教学关系包含师生及生生之间密切的互动。这种关系直接影响学习的成效。库克萨瑟(Alison Cook-Sather)等将学生与教师的伙伴关系定义为“一个协作、互惠的过程,通过这个过程,所有参与者都有机会平等地(尽管不一定以相同的方式)为课程或教学的概念化、决策、实施、调查或分析做出贡献”[17]。
基于这种关系,教学与学生的学习绩效产生了协变性。教学是由学生教育过程中“可教时刻”(teachable moments)组成的,但哪种教学经验对哪种类型的学生最有效?美国教育理事会(American Council on Education,简称ACE)的一项研究通过对与教学和学生学习成就的五个交叉领域的循证实践研究进行考察,包括明确期望的透明度、教学方法、学生学习的评估、学生的自我调节以及学习经验的一致性等,发现教师做什么和教学如何发生很重要,而且非常重要。在这五个领域,首先是透明度,学生必须清楚地了解他们要去哪里以及评估他们是否已经到达的标准。让教与学变得可见,对所有学生来说都很重要,尤其是在作业的设计和陈述方面。学生需要明确的目标,以便了解他们的进步并保持动力。有透明度的教学包括让学生明白内隐和外显的含义,让他们理解为什么他们要从事某些任务,以及这门课程在他们的学习过程中扮演什么角色。其次是教学方法,除了简单地让学生清楚了解教育经验的连贯性,还有各种各样的教学方法与提高学生的学习、参与和投入有关。高效实践提供了这样一种机制,个性化教学、主动学习等等也是如此。第三是评估,学生需要多种机会在各种情况下实践学习,以促进知识的转移。仅仅创造支持性的学习环境、在学习结束时对学生进行简单的评估而在学习过程中不提供反馈是不够的。学生可以通过完成评估任务来学习,评估任务建立在高期望和真实的作业之上,以支持整合和有意义学习方式的构建。第四是自我调节,学生在教育中发挥积极作用。当他们积极参与教育过程时,更有可能坚持下去并毕业。学生积极参与自己的学习是教学和学生成绩之间关系的必要组成部分。反思和自我调节有可能将学生从被动学习者转变为主动学习者,而深度学习是通过反思而不是单独的经验来实现的。第五是协调,学习环境的成功取决于各种要素的协调程度,如内容、教学设计、教学方法、作业和评估标准,这些要素的一致性提供了一种手段,以抵消不连贯的和破碎的学校经验。学生需要适当的策略来扭转课程的碎片化,并将他们的学习联系起来,以提高学生的成功率。[18]或许,前述多种教育人工智能产品可以参与到某一种要素中,比如通过学习分析学进行的个性化评估等,扩大个性化教学的成效,但它们还不是一个构成完整系统的独立变量。
做一个关系性处理,可以将教育过程的问题结构表达如下:
(1)P作为一种目的是希望达到的;
(2)通过N种要素组合才能逼近P,其中Q的组合是达到P较有效的方式;
(3)因此,分析并从事有关Q的组合的事情。
获得Q的条件是什么呢?或者说,如何保证Q是一种正确且有效的路径?其中“正确”是在价值或伦理意义上的,“有效”是在绩效或成就表现上的,两者之间常常并不统一,甚或出现张力。这典型地表现在教育公平与教育质量的问题上。
知识是一种被创造的结构,环境是创造知识过程的核心,在这些环境中的师生关系需要一种分享和讨论的相互关系。教师和学生需要共同理解学习的意义,成功是什么样子的,以及每个人如何负责推动对方走向成功。那些从事教学的人需要理解所要教授的材料,并以学生能够掌握的方式组织和呈现这些材料。[19]换言之,需要一个以学生发展为中心的学习环境。
教学不仅要鼓励有证据支持的信念,还要培养学生收集证据的能力,以评估它是否适合他们自己。一项教育计划可能包括获得人类已经发展出来的发现自身和世界真相最可靠的方法。在教授技能时,教育者让学生意识到他们正在做的事情的原因,并鼓励他们在运用技能时学会灵巧和反思。尽管环境可能塑造学生的行为,但教师希望学生是因为对自己应该做什么的认知而有所行动。重要的是通过发展学生的能力、智能和选择的自由来为学生的生活做准备。由此,我们应该意识到教学本身是一个复杂系统,包含“涌现”(emergence)现象。“涌现”一词来自拉丁语动词emergo,意思是出现、上升或突现。如果某个特性是一个系统或实体的新特性,是当该系统或实体达到一定的复杂性时产生的,那么它就是涌现的,即使它只存在于该系统或实体存在的范围内,它是整体具有而其单独的组成部分不具有的特性。④
换言之,当一个实体被观察到具有其所有组成部分本身没有的属性时,涌现就出现了。这些属性或行为只有当各部分在一个更广泛的整体中相互作用时才会涌现。教学过程恰是一个复杂的涌现过程,即通过许多单个实体的交互的集体行动而出现的模式,通常意味着在系统中存在一种自上而下的反馈形式。艾斯纳(E. Eisner)将教学描述为“异常复杂的事情”[20],其他学者从管理不确定性和解决不可预测性的角度来界定教师的角色。舒尔曼(L. S. Shulman)毫不含糊地将教学描述为“也许是我们人类有史以来发明的最复杂、最具挑战性、最苛刻、最微妙和最可怕的活动”[21]。教师自己对学习中促进和启发的描述也承认了学习的不可预测性、动态性以及经常混乱的、不均衡的性质,亚历山大(P. Alexander)等总结了这一论点,断言“如果不接受其相互作用的复杂性,就无法开始理解人类学习的真正性质”[22]。舍恩(D. Schön)也简述了学习和教学远非简单的情况,他将教师的工作描述为在日常生活的“沼泽低地”中工作。对他来说,“现实世界实践中的问题不会以结构良好的形式呈现给实践者。事实上,它们往往根本不会把自己表现为问题,而是表现为混乱而不确定的情况”。[23]考虑到这一点,似乎有理由认为,学生在学校课堂上学到的东西不是机械地来自教师的输入,也不完全在教师或学生的有意识控制之内。这并不是说学习不是教学的功能,而是说学生的学习必须不仅仅受到教师和教学的影响。
教学的复杂性还表现在理论设想与现实的悖论。最简单地说,传统取向认为,教师应该仔细地从他们的学科领域挑选出最好的知识,并直接传授给全班;进步取向认为,教师应该促进学生探索他们的个人兴趣,从而培养好奇心和思考能力。德国研究者使用固定效应回归模型对德国国家教育小组研究中1223名学生(11-14岁)的数据进行了测试,发现学生的成绩和老师的取向之间几乎没有联系。唯一的例外是学生在接受传统取向老师的教学时,会对学习产生更大的兴趣。[24]这与进步取向的主张相反。进步取向观点认为,传统主义者可能会破坏学生的学习兴趣,这似乎是错误的。事实上,传统的教学方法,即教师精心安排最好的内容,似乎能更好地支持学生的学习兴趣。然而除此之外,传统取向和进步取向的观点在研究数据中似乎都没有得到什么支持,这表明这场辩论在一定程度上误导了这个领域。教师可能会更好地关注如何处理教学工作的更细致、非笼统的方面。
未来的课堂将是一个复杂的适应性系统,它包含多个自主的、相互作用的学生的系统,他们之间的相互关系创造了网络化、自组织与非线性的行为,从这些行为中变化(学习)出现在不同的层次,从个人、小组到整个班级。学习(包括个人学习)是全系统因素的结果,而不仅仅是线性教学机制的结果。教学可能是对学生学习的主要影响,但远不是唯一的影响,其影响是通过课堂系统内外的多种影响过滤出来的。意识到学习的网络化和递归性,使教师能够注意、关注甚至计划可能在课堂内外发挥作用的多种影响。例如,意识到学生的心智模式、他们的理解和他们建立的联系在很大程度上受到校外经验的影响,可能会使教师在计划讲解一种现象之前,先了解学生对这种现象更广泛的经验。同样,认识到新知识可能通过分散式和分布式的互动结构出现,可能会使教师促进自主或半自主的小组活动,期望学生创造或发展他们自己没有计划的想法。非线性思维可以鼓励教师不仅提出有关教学和学习的有条件的“如果——那么”问题,而且考虑“如果……”问题,这些问题可以产生对可教时刻的敏感性。非线性思维改变了人们对如何、何时以及从何处开始学习的预期,并可能让教师在学习的初期就注意到潜在的和未来的学习。对“即将到来的”学习的敏感和反应是有效教学法的核心。理解学生与他们的想法、话语、情绪、相似点、不同点和个人经历以非线性的方式相互作用,可以帮助教师在期望遵循单一线性逻辑时通常不会探索的地方寻找潜在的学习机会。这包括在不太可能的地方寻找学习或学习的条件,包括课堂中断、社会冲突或偶然的、意想不到的时刻。
学生、环境和课堂气氛之间的相互影响网络以及由此产生的随机性,为教学和学习的新时刻打开了大门。任何教室在多大程度上可以被有效地描述为复杂的,取决于它是如何组织的。许多教室共有的三个广泛的典型组织原则是:集中式(centralized)、分散式(decentralized)和分布式(distributed)。当集中组织时,交流从老师到学生呈线性流动,但学生之间很少或没有互动;以分布式方式组织时,学生与学生间相互作用,包括与老师的相互作用;在一个更加分散的组织中,互动发生在任何没有教师中心组织的个人之间。所有三个组织原则都可以在任何给定的教室(甚至在一节课内)的不同时间制定。在严格控制、集中式课堂结构中,思想倾向于线性地从老师流向学生,再从个别学生流向老师。在这种组织原则下,思想不会碰撞,它们只是沿着直线传播,通常是从老师一个方向发出的。这些想法为每个人所知,但没有被询问、试验、体验、重复或挑战。在高度集中的教室里,这种情况的主要问题是学生视角和涌现学习的交叉融合。新出现的理解、部分清晰的思维和对学生主张的挑战,在分布式的点对点互动中比在集中式的教学场景中更容易出现,过多的集中交流可能会扼杀这种“即将到来的”学习。在另一个极端,在以分布式结构为主要特征的教室里,思想倾向于碰撞,但很少精炼、持续或连贯地联系起来。这里的主要问题是思想的传播倾向于保持局部性,没有传播就会逐渐消失,缺乏连贯性,因为思维仍然是原子化的。在这两个极端之间的某个地方存在结合点,学生在那里体验到足够的自由和自主,鼓励自我组织和自下而上的创新,伴随着教师足够的协调,以分享、消化、形成和维持新的想法。教师可以操纵的因素包括物理空间、时间段、活动类型和分组。自主或半自主的学生群体在适当的时间内开展足够开放的活动,并考虑课堂组织和教师干预,有可能为新异、创造和创新的出现创造空间。分布式、分散式和集中式结构之间的及时转换可以使学习出现,并从突现状态向精心设计的、更安全的状态发展,从这些状态可以更容易地重新分配学习。
为了创造条件,使部分形成的思想可以发展成清晰的解释或富有成效的应用,一系列的教学先决条件是必要的,首先是理解集中式、分散式和分布式的课堂组织模式对学习的追求。注意到课堂结构需要放松或收紧的迹象之信心和能力,以及知道如何做和判断何时这样做,都是合乎逻辑的。创造开放的学习活动和机会,这是思想碰撞的沃土,鼓励自主互动,以激发新奇性和原创性,同时避免过度的教师控制,需要勇气和实践。当然,出发点是对潜在的可教时刻的敏感性,对课堂上网络互动影响的适应,以及对于从意想不到的地方出现的学习可能性的开放态度。
教育人工智能的发展同样具有涌现效应。多年前的苹果聊天机器人Siri还是一个新奇而缺乏智能的产品,今天横空出世的ChatGPT-4显示了人工智能技术的涌现现象,并对教育形成了具有挑战性的冲击。
四、ChatGPT对教育的突破
人工智能是一个广泛的领域,包括各种技术和方法,用于创建感知环境并采取行动的智能机器。机器学习(machine learning)是人工智能的子领域,它允许计算机在不使用可以识别模式并根据数据进行预测的算法进行明确编程的情况下,学习并提高其在完成任务中的性能。生成式人工智能(generative AI)是指生成新数据或输出的人工智能系统,如图像、音乐或文本,而不是对现有数据进行分类或处理。生成式人工智能通常使用机器学习。大型语言模型(large language models,简称LLM)就是一种可以处理和生成自然语言文本的机器学习模型,它们可以根据模式产生新颖的文本输出,并从大量输入数据中学习。会话代理(conversational agents)也称为聊天机器人或虚拟助理,是一种人工智能系统,旨在与人类进行自然语言对话。会话代理可以使用LLM作为一个组件,生成模仿人类语言和风格的文本响应。
ChatGPT就是一个使用LLM GPT-3.5或GPT-4的聊天机器人。ChatGPT的全称为“生成式预训练自注意力模型”(Chat Generative Pre-trained Transformer),它是美国人工智能研究实验室OpenAI于2022年11月30日发布研发的聊天机器人,使用了Transformer神经网络架构(GPT-3.5架构)。Transformer是采用自注意力机制的序列到序列模型,Transformer架构让深度学习模型可以“自由吸收”数据中的知识,大语言模型开始突破参数和算力限制,从此语言模型也进入参数越多、数据越大、模型效果越好的时代。
GPT-3.5和GPT-4等大型语言模型的一个主要优势是它们能够处理文本信息并置之于上下文,从而生成适当的响应。GPT-3.5完全基于文本——接受文本输入并产生文本输出,该文本可以是自然语言或计算机代码。除此之外,GPT-4还接受图像作为输入提示的一部分,这可能是带有文本和照片、图表或截屏的文档。⑤因此,GPT-4包含了计算机视觉的元素,不仅仅是一个纯粹的大型语言模型。模型参数数量和训练数据大小的差异会显著影响模型的性能和准确性。更大的训练数据集导致更广泛和多样化的语言模型,从而提高熟练程度。根据OpenAI的说法,GPT-3.5基于具有1750亿个参数的深度神经网络模型,这些参数通过机器学习进行调整。[25]初代GPT-3展示了三个重要能力:一是语言生成,遵循提示词(prompt),然后生成补全提示词的句子(completion),这也是今天人类与语言模型最普遍的交互方式;二是境脉学习(in-context learning),遵循给定任务的几个示例,然后为新的测试用例生成解决方案;三是语言类知识和世界知识(world knowledge),包括事实性知识(factual knowledge)和常识(common sense),例如“拿破仑曾经是法兰西皇帝”等事实型知识以及“人有两只眼睛”“太阳从东方升起”等常识型知识。
与传统人工智能技术相比,ChatGPT代表了未来人工智能的发展趋势,它可以基于大数据集自己生成内容,在语言能力、语言风格、论证效力及思想深度上赋予了新一代人工智能技术的鲜明特征。ChatGPT的推出被视为人工智能技术历史上的重要里程碑,它以强大的算力支撑,从量变走向质变,达到了当前AI技术的巅峰水平,带来了通用人工智能突破性发展的星光。
可以通过两个练习判断其推理水平⑥。这是给GPT-4出的一个谜题:“一个猎人向南走了一英里,向东走了一英里,向北走了一英里,此时恰好回到起点。他看到一只熊,于是开枪打了它。这只熊是什么颜色的?”GPT-4给出了正确回答并展开推理分析:因为猎人先向南,再向东最后向北,分别走了一英里,恰好回到了原点,这种情况只可能发生在北极,而那里生活着北极熊,所以是白色的。再看一道题:“我驾驶一架飞机离开我的营地,直接向东飞行24901英里,然后回到营地。当我回到营地时,看到一个老虎在我的帐篷里吃我的食物,这只老虎是什么物种?”GPT-4也给出了正确答案——任何生活在赤道上的老虎物种,例如孟加拉虎和苏门答腊虎。在这个谜题里,AI需要知道地球赤道长24901英里,只有在赤道上才能向东或向西行驶并返回同一点,也要知道哪些老虎物种生活在赤道上。这些测试证明GPT-4具备知识沉淀和推理能力,这也是AI首次真正意义上跨过常识这道门槛。拥有常识要求AI不仅能够看懂眼前画面里的各种东西,还得知道社会规范与物理、化学、地理等知识,并且把新看到的和已知的一切融会贯通。
ChatGPT作为一种自然语言处理工具,目前在人工智能方面至少有以下五方面推进。(1)自然语言理解能力的提升:ChatGPT可以进一步加强对自然语言的理解能力,更好地理解上下文、情感和语义,从而更加准确地回答问题和生成文本。(2)个性化和情感化的对话:ChatGPT可以通过学习个人偏好、情感和行为模式等信息,实现个性化和情感化的对话,从而更好地满足用户需求。(3)跨语言和跨文化的应用:ChatGPT可以通过学习多语言和多文化知识,实现跨语言和跨文化的应用,使用户可以用自己的母语与ChatGPT进行交流。(4)知识图谱的整合:ChatGPT可以与知识图谱结合,实现更深入、更全面的知识学习和推理,从而更深刻地理解问题和解决问题。(5)同步语音和文本的处理:ChatGPT可以通过将语音和文本结合,实现更加流畅的对话体验,从而使用户可以更方便地与ChatGPT进行交互⑦。
以往机器学习的巨大成功导致了人工智能(AI)应用的爆炸式增长,并增加了对具有人类智能水平的自主系统的期望。其中人类认知中因果关系的理解是机器实现人类智能水平的必要条件,研究人员期望通过数据科学产生飞跃。数据科学是一个双体问题,连接数据和现实,包括数据背后的力量。数据科学是根据数据解释现实的艺术,而不是数据从不同角度看待自身的镜子。因果关系的阶梯是因果思维的双螺旋结构,定义了关于行为和本来可能存在的世界,即“事情为什么会发生”和“我们如何影响世界”。图灵奖获得者朱迪亚·珀尔(Judea Pearl)提出了机器学习因果推理的三个层次。(1)关联推理(seeing,观察):关联是因为它调用由裸数据定义的纯统计关系,这种关联可以使用标准条件概率和条件期望直接从观察到的数据中推断出来。(2)干预推理(doing,干预):比相关联更高,因为它涉及的不仅仅是看到什么,而是改变我们所看到的。一个典型问题是如果我们将价格翻倍会发生什么?(3)反事实推理(imagining,想象):反事实类别是指如果采取不同的行动会怎样,因此需要回顾性推理。反事实是科学思维以及法律和道德推理的基石,也是推理虚拟或替代场景的能力,使AI系统能够分析不同行动或决策的潜在后果。[26]机器学习对人类的知识生产也提出了挑战。
但是,GPT-4能够对因果推理提出更复杂的推演,并在朱迪亚·珀尔的机器学习因果推理的三个层次上提出六项更高层次的设计。(1)元因果推理(reflecting,反思):理解底层因果结构的能力,使AI系统能够根据新信息或变化的问题要求进行调整和优化其因果模型。(2)社会性因果推理(collaborating,协作):理解、预测和影响来自多智能体交互的因果关系的能力,使AI系统能够参与团体决策并在复杂的多智能体环境中导航。(3)跨领域因果推理(generalizing,泛化):将因果知识转移并应用于不同领域的能力,使AI系统能够快速适应新情境并在各种背景下泛化其对因果关系的理解。(4)演化因果推理(adapting,适应):理解和预测系统随时间演化和适应的因果机制的能力,使AI系统能够预测长期变化、新兴趋势并在复杂系统中进行战略干预。(5)跨模态因果推理(synthesizing,综合):整合和推理来自多个来源和模式的因果信息的能力,使AI系统能够综合不同数据类型的信息并创建更全面和稳健的因果模型。(6)有意识的因果推理(self-awareness,自我意识):AI系统意识到自己的存在、行为和在世界中存在的因果影响的能力。⑧这种自我意识使AI系统能够评估和修改其目标、价值和决策过程,以应对不断变化的情况。这是一个令人惊诧的思维飞跃。
GPT-4的确产生了通用人工智能的火花。这表现在其核心心智能力(如推理、创造和演绎)、它获得专业知识的主题范围(如文学、医学和编码)以及能够执行的各种任务(如玩游戏、使用工具、自我解释等)上。微软研究团队在14人合作的长篇论文“通用人工智能的火花:GPT-4的早期实验”(Sparks of Articial General Intelligence:Early Experiments with GPT-4)中指出,我们对GPT-4的研究完全是现象学的——专注于GPT-4能够做的令人惊讶的事情,但我们没有解决它为什么以及如何能实现如此非凡智能的根本问题。它是如何推理、计划和创造的?为什么当它本质上只是由简单的算法组件——梯度下降和Transformer架构——以及庞大的数据组合而成时,会表现出如此通用和灵活的智能?它挑战我们对学习和认知的理解,激发我们的好奇心,并激励更深入的研究。阐明像GPT-4这样的AI系统的本质和机制,是一个艰巨的挑战,它突然变得重要和紧迫。GPT-4应该改进以实现更通用的智能的一些领域包括几个方面。(1)信心校准:模型很难知道什么时候应该有信心,什么时候只是猜测。(2)长期记忆:模型的背景是非常有限的,它以一种“无状态”的方式运行,并且没有明显的方法教给模型新的事实。(3)持续学习:模型缺乏自我更新或适应变化环境的能力。该模型一旦被训练就固定了,并且没有机制用以整合来自用户或世界的新信息或反馈。(4)个性化:一些应用程序要求模型适合特定的组织或最终用户。系统可能需要获取关于组织的工作方式或个人偏好的知识。在许多情况下,系统需要在一段时间内以个性化的方式适应与人和组织的动态相关的特定变化。(5)规划和概念顿悟(leaps):该模型在执行需要提前规划的任务或需要在完成任务的过程中构成不连续的概念顿悟的“尤利卡效应”⑨的任务时,表现困难。换言之,该模型在需要那种代表人类天才形式的概念跳跃的任务上表现不佳。(6)透明性、可解释性和一致性:模型不仅会产生幻觉、编造事实并产生不一致的内容,而且似乎没有办法验证它产生的内容是否与训练数据一致,或者是否自洽。(7)认知谬误和非理性:该模型似乎展示了人类知识和推理的一些局限性,如认知偏差和非理性(如确认、锚定和基础率忽略的偏差)和统计谬误。(8)对输入敏感的挑战:模型的响应可能对提示的框架或措辞及其在会话中的顺序非常敏感。[27]
回到教育人工智能领域(AIEd),在其历史进程中已经三种不同的发展模式[28](图表略)。
模式一的特点是人工智能指导,学习者作为接受者,即人工智能表征领域知识并指导学习过程。学习者作为人工智能服务的接受者对预先指定的知识序列做出反应,遵循学习程序和路径,并执行人工智能设定的学习活动,以实现预定的目标。它基于行为主义理论,强调构建精心安排的内容序列,以引导学习者的正确表现。典型实现是智能教学系统(ITSs)的早期工作。例如,ACT Programming Tutor为编程知识设置了一个产生式规则数据库,使用基本统计学来估计学生学习规则的概率,并根据估计的概率向学生呈现个性化的练习序列⑩。模式二的特点是人工智能支持,学习者作为合作者,即人工智能系统放弃其控制能力,作为一个支持工具;而学习者作为系统的合作者,专注于个体学习者的学习过程。它基于认知和社会建构主义的学习观,认为学习者在社会情境中与人、信息和技术互动时,学习就发生了。如基于对话的辅导系统(dialogue-based tutoring systems,简称DTSs)或探索性学习环境(exploratory learning environments,简称ELEs)就是典型形式,以实现系统和学习者之间的交互。模式三的特征是人工智能赋权,学习者作为领导者,它将学习者代理作为教育人工智能的核心,并将人工智能视为增强人类智能的工具,人工智能通过提供高度的透明性、准确性和有效性,帮助学习者和教师实现增强的智能。人机合作系统集成了先进的人工智能技术和人类决策,有可能实现模式三中人工智能赋权、学习者作为领导者的目标。其主要挑战是如何解决复杂性,即如何将学习过程的复杂性与人工智能系统的复杂性及教育情境的复杂性相匹配,其技术基础在于多模态数据收集技术、实时AI算法模型和AIEd的多维属性。为了发展AIEd领域,未来的AIEd应该设计和操作成为提供持续的沟通手段,以收集来自所有利益相关者的价值和解释,在整个运营过程中使人工智能模型与人类价值保持一致,并使目标与以学习者为中心的学习相兼容。
作为可以持续对话的一种人工智能模型,ChatGPT-4有可能以各种方式对教育产生重大影响,最常见的有七种方式。(1)改进自然语言处理(NLP):ChatGPT-4增强的NLP功能将使学生更容易通过自然语言参与教育材料。这可以提高在线学习的质量,让学生得到更多个性化的反馈和指导。(2)丰富多种学习材料:在ChatGPT-4的帮助下,教育工作者可以创建更高级和互动的学习材料。例如,他们可以使用模型来生成模拟、虚拟实验室和其他可以帮助学生更好地理解复杂概念的交互工具。(3)提供自动评分:ChatGPT-4可以帮助自动评分,这可以节省教育工作者大量的时间;它还可以为学生提供更准确和个性化的反馈,使他们能够改进学习表现。(4)支撑个性化学习:通过ChatGPT-4,教育工作者可以为每个学生创造更个性化的学习体验。该模型可以分析学生的学习模式,了解他们的优势和劣势以及所使用的教学方法之有效性,并根据他们的需求和学习风格调整材料。(5)改善教学策略:分析学生的学习模式也有助于调整教学策略,以更好地满足他们的需求。例如,如果学生在某一特定类型的作业上遇到困难,教育工作者可以修改作业,使其更容易理解,或者提供额外的支持来帮助他们完成作业。(6)进行多语言教育:ChatGPT-4的多语言功能有助于弥合教育中的语言差距。它可以将教育材料翻译成各种语言,使学生更容易获得母语学习材料。(7)优化教育研究:ChatGPT-4的高级语言功能可以帮助包括教育在内的各个领域的研究人员,他们可以使用该模型分析大量的教育数据,并深入了解学习模式和有效的教学方法⑪。
那么,ChatGPT-4能否改变教育的逻辑,将教育带向一个新的历史阶段?
五、结语:走向共鸣的教育与人工智能的关系
利奥塔(Jean-Frangois Lyotard)早就注意到“知识的计算机化”,他在《后现代状况》中写道,在这种普遍转变的背景下,知识的本质不可能保持不变。[29]只有将学习转化为大量的信息,它才能适应新的渠道,并变得可行。可以预测,知识体系中任何不能以这种方式翻译的东西都将被抛弃,新研究的方向将取决于其最终结果被翻译成计算机语言的可能性。知识的“生产者”与使用者现在和将来都必须拥有将他们想发明或学习的任何东西翻译成这些语言的手段。随着计算机的统治地位而来的是某种逻辑,因此也有一套确定哪些陈述被接受为“知识”陈述的规定。可以期待一个关于“知识者”的彻底的知识外化,无论其在知识过程中占据什么位置。旧的原则认为知识的获取与头脑甚至个人的教化(Bildung)是不可分割的,这一原则正在过时,而且将越来越过时。知识的提供者和使用者与他们提供和使用的知识之间的关系现在正趋向于、并将越来越趋向于采取商品生产者和消费者与他们生产和消费的商品之间的关系已经采取的形式,即价值的形式。知识在现在和将来都是为了出售而生产的,都是为了在新的生产中被估价而被消费的——在这两种情况下,目标都是交换。知识本身不再是目的,它失去了“使用价值”。[30]但是,今天随着基于符号推理的技术路径被基于概率统计的数值运算所掩蔽,仔细筛选并编码的、结构化的“知识”表征,也为非结构化的全文本收录所代替。可以说,搜索引擎不提供“知识”,而是呈现“内容”。它不对内容本身的真实性和有效性负责。知识学习的意义将发生根本变化,知识不仅可能失去使用价值,而且可能失去思考价值。
ChatGPT尽管有很高的语言处理能力和表现,却并不具备真正的人类智能。ChatGPT只是通过算法和数据模拟了人类的语言理解与生成过程,其工作方式并不像人类那样自主决策、创造和思考。因此,虽然ChatGPT是一种非常强大的语言处理工具,但它并不等同于人类的智能。它是人工智能技术的一种应用,而不是奇点。奇点是指一种超越人类智慧和控制的人工智能,这种人工智能能够通过自我学习和迭代,产生自我进化和无限扩展。但是,随着ChatGPT之类生成式智能体的不断更新迭代,作为自然语言处理系统的大语言模型最终能否通过“图灵测试”(Turing Test)乃至“完全图灵测试”(Total Turing Test)?⑫即具备以下能力:(1)自然语言处理(Natural Language Processing),使之能成功地用人类语言交流;(2)知识表征(Knowledge Representation),以存储它知道的或听到的信息;(3)自然推理(Automated Reasoning),以运用存储的信息来回答问题并推出新结论;(4)机器学习(Machine Learning),以适应新情况并检测和预测模式;(5)计算机视觉(Computer Vision),以感知物体;(6)机器人技术(Robotics),以操纵和移动对象。假设大语言模型进化到能自由熟练地使用人类语言,它会不会由此具有了思考能力、具有了意识,这是我们面临一个伦理和哲学问题。澳大利亚认知科学家大卫·查尔默斯(David J. Chalmers)提出了“大型语言模型可以有意识吗”的问题,认为如果你认为有意识的AI是可取的,那么伦理问题可以作为一种实现目标的指南;如果你认为有意识的AI是应该避免的,那么该问题可以突出显示最好避免的方向。[31]
机器人技术的突破不仅取决于更灵巧的机械手和腿、更敏锐的合成眼睛和耳朵,还取决于越来越像类人人工智能(human-like artificial intelligence,HLAI)。强大的人工智能系统正在跨越关键的门槛——在越来越多的基础任务中匹配人类,如图像识别和语音识别以及从自动驾驶汽车和医疗诊断到库存管理和产品推荐的应用。人工智能的分配效应取决于它是主要用于增加人类劳动还是使其自动化。如果人工智能增强了人类的能力,使人们能够做他们以前从未做过的事情,那么人类和机器就是互补的。互补性意味着人们对于价值创造仍然是不可或缺的,并在劳动力市场和政治决策中保持讨价还价的能力。相比之下,当人工智能复制和自动化现有的人类能力时,机器成为人类劳动力更好的替代品,工人失去了经济和政治讨价还价的能力。企业家和高管可以使用机器,这些机器能够在给定的任务中复制人类的能力,他们可以而且经常会在这些任务中取代人类。一方面,这是一条通往前所未有的财富、更多的闲暇、强健的智能甚至更好地了解我们自己的道路;另一方面,如果类人人工智能(HLAI)让机器实现自动化而不是增加人类劳动,就会造成财富和权力集中的风险,那些最先拥有财富和权力的人会更广泛地通过使用机器人挤掉人类获取生活资本的工作和机会。
当然,未来不是注定的。我们也可以控制人工智能以扩大人类的机会,或通过自动化取代人类的非创造性劳动。我们可以应对对机器来说容易、对人类来说困难的挑战,而不是对机器来说困难、对人类来说容易的挑战。第一个选项通过工具和平台增加劳动力,提供了增长和分享经济蛋糕的机会;第二种选择的风险是,通过创造取代越来越多类型工人的自动化,将经济蛋糕分给越来越少的人。后一种人工智能的发展是我们应该警惕的。
人们所做的大部分事情都是与他人相关的行为,这种行为是由多个相互关联的过程组成的。在人的一生中,人们在各种环境中以各种方式与他人发生关系,例如在不同的环境中吃饭和工作,聚集在一起庆祝各种事件,在不同的情境中学习,发短信和推特,创造艺术、观看艺术,互相合作、互相支持、互相照顾或者互相剥削、互相争斗。人类行为是由同时发生和相互关联的个人、社会、文化、身体和环境过程构成的,这种行动被认为是由多个相互关联的心理过程组成,包括感知、思考、感受、互动和构建身份,而人的行动本身在时间序列中发展。人类又是复杂的生物,在复杂世界的各个角落、在复杂的环境中过着复杂的生活。可以从不同的部分来理解人类的功能,作为一个形容词,复杂(complex)意味着一个现象“很难分离、分析或解决”。Complex的同义词包括复合的、错综复杂的、多结的和共享意义的元素——具有相互关联的部分。未来的教育必然是在一种复杂的关系形态中展开的,与知识的关系、与学习的关系等,特别是与技术的关系。同样,我们面对的将是人与生成式人工智能体的关联性,这种关联将成为未来教育的生态。笔者从协作和依附及相互作用与内在作用的关联,梳理出四种关系,列表如下(图表略)。
当人类使用非智能及低智能的技术产品时,这些技术产品是人类便利生活和改造世界的工具,人是制造并借用工具的,人是这些工具的掌控者。从最早的粉笔、黑板到今天的普通计算机,人们通过使用这些技术产品以形成多样化的课堂情境,通过与技术产品的相互作用创造不同学科的活动和学习方式,人们在使用它们时居于理性的掌控地位。这是一种“借用”关系。
人与生成式人工智能体的第二种关系是人的主体性和物的展现性来自双方的相互协作及内在作用。这种物——人关系就是罗萨(Hartmut Rosa)所称的“共鸣”(Resonance)。共鸣概念的一个基本前提是:人是一种在世存有的类属,人唯有镶嵌进世界才能形成与持存下去。共鸣意指人与世界之间处于一种相互开放且因此能相互构成的关系。它既是让人能构成主体性的基本机制,也是能判断世界关系是否遭到扭曲或破坏的规范标准。[32]在生成式人工智能产品与人的协作中,彼此相互塑造并相互增加了双方的存有厚度,亦即在一种共存且不断进化的过程中。人类的“教化”,从更深的意义上理解,不是一个优化的过程,不是获得技能的过程,而是打开自我与世界之间共振频率的过程,而是一种增强的活力和联系感。现代人的生活,无论从日常意义上还是从长远来看,都越来越倾向于获取和增加个人的资源,尤其是扩大个人的可能性视野,但这种扩展应建立在与世界共存共生的基础之上。因此,教化是“产生”共鸣的自我世界关系的过程。在现代社会,未来生活的问题已经完全私有化了。这意味着每个人必须自己判断该如何对待自己的生活,以及如何领导(或不领导)生活。老师当然不是要教学生如何生活或如何领导生活。然而,未来社会的全球化高速世界需要大量复杂的文化能力和个人性格,以成功应对日常生活的挑战。在这方面,教室和校园似乎具有压倒一切的重要性,因为正是在这里,孩子们发展了寻求认可和区分的策略,发展了精确的评价和对存在问题的基本定义,最后发展了平衡长期和短期问题以及选择选项的策略。通过与人工智能体的对话,我们同样可以产生拓展性视野和丰富的不同视角的观照,通过这种与人工智能体的共振,引出人的品性中优秀的东西。
我们也看到另一种情形,就是随着人类不断创造性的数字产品,制作基于人的欲望和需求满足的APP,形成了愈加丰富的数字生态,人的理性逐渐丧失,从而被物所“异化”。例如很多人通过刷抖音而炫耀生活和贩卖垃圾,人们逐渐对技术产品上瘾,在与技术产品的内在作用中形成依附关系。这是我们必须面对的矛盾现实,也是第三种必须关注的“异化”关系。虽然人们创造了人工智能产品,但是在使用产品过程却丧失了能动性,遭到异己的物质力量或精神力量的迷惑,为物所役。
随着ChatGPT-4的出现及其惊人的理解力,不管是图片生成、代码生成还是开放域文本生成,在生成内容的质量、逻辑性和安全性方面都有明显的提升。基于AI生成技术的应用场景在今后几年会更多涌现,一旦它形成自我意识和反思意识,那么ChatGPT的自我训练和自我进化形态可能涌现。但是,安全可控、有伦理、负责任的生成技术仍然需要重点研发,我们最不希望看到的是第四种关系——“支配”关系,即生成式人工智能体由于其卓越的智力水平,而成为控制人类的异己力量。那些科幻电影中描述的故事是否有可能成为一个梦魇的现实,这也是我们要特别关注的。
由此可以发现,合理的人与生成式人工智能体的关联是一种“借用”和“共鸣”的关系,其中“共鸣”是我们发展生成式人工智能体以丰盈教育品质时追求的目标。一方面,共鸣本身表明了智力参与的力量,传达了一种非工具性的教育愿景;另一方面,作为一个内在的关系概念,与生成式人工智能体的对话将使我们更好地看清自己及洞悉世界,从而实现本纳所说的“自我行动”。
未来可期吗?未来建立在我们的自我行动上。
注释:
①参见Jaeger, Werner. (1965). Paideia: The ideals of Greek culture, vol.1, trans. Gilbert Highet. New York: Oxford University Press; 又见Säfström, Carl-Anders. (2019). Paideia and the search for freedom in the public of today. Journal of Philosophy of Education, 54, no.3: 607-618。
②参见Dewey, J. (1985). Democracy and education. In J. A. Boydston (Ed.), John Dewey. The middle works, 1899-1924. Volume9: 1916. Carbondale & Edwardsville: Southern Illinois University Press, p.17。
③参见比尔·盖茨(Bill Gates)个人博客,https://www.gatesnotes.com/The-Age-of-AI-Has-
Begun。
④见Vintiadis, Elly. (2012). Emergence. https://iep.utm.edu/emergence/。
⑤见OpenAI. (2023a). GPT-4. Retrieved from https://openai.com/research/gpt-4。
⑥参见Sparks of artificial general intelligence: Early experiments with GPT-4, Microsoft. https://m.weibo.cn/status/4888154277938006。
⑦来自笔者与ChatGPT的问答总结,部分内容也可参见Zhai,X.(2023).ChatGPT user experience: Implications for education. Available at SSRN 4312418。
⑧参见https://m.weibo.cn/status/4888154277938006。
⑨“尤利卡效应”是指突然在某一时刻理解了以前难以理解的问题或者概念的现象,这种洞察力或顿悟,基本上无法预测其具体发生的时刻。此概念源于古希腊学者阿基米德的故事,有一次他坐进浴盆洗澡,看到水往外溢,同时感到身体被轻轻托起,突然悟到可以用测定固体在水中排水量的办法,解决自己长久以来未解决的计算浮力的问题,惊喜地叫了一声“尤利卡”,由此发现了阿基米德定律。“尤利卡”(eureka)一词为古希腊语,意思是“我知道了”。
⑩参见Anderson, J. R., Boyle, C.F., Corbett, A.T., & Lewis, M. W. (1990). Cognitive modeling and intelligent tutoring. Artificial Intelligence, 42(1), 7-49。
⑪来自笔者与ChatGPT的交流总结,也可参见Zhai,X.(2023).ChatGPT user experience: Implications for education. Available at SSRN 4312418。
⑫“图灵测试”是指测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。进行多次测试后,如果机器让平均每个参与者做出超过30%的误判,那么这台机器就通过了测试,并被认为具有人类智能。1989年,哈纳德(Harnad)提出“完全图灵测试”,即在原始图灵测试的基础上增加了视觉、听觉、触觉、味觉等等不同维度的测试,所有的感知和认知能力达到了人的标准才算是通过完全图灵测试。
参考文献:
[1]Hirst, P. H. (1993). Education, knowledge, andpractices. In R. Barrow & P. White (Eds.), Beyond liberal education: Essays in honour of Paul H. Hirst. London: Routledge.
[2][3]彭正梅.教育的自身逻辑:德国教育学家本纳教授访谈[J].全球教育展望,2009(11).
[4]Biesta, G.. (2020). Risking ourselves in education: qualification, socialization, and subjectification revisited. Educational Theory, 70(1), 89-104.
[5][6]Benner, Dietrich. (2015). Allgemeine Pädagogik, 8th ed. Weinheim & München: Juventa.
[7]Emirbayer, M. (1997). Manifesto for a relational sociology. The American Journal of Sociology, 103(2), 281-317.
[8]Ahrne, G. (2021). The construction of social bonds: A relational theory of globalization, organizations and society. Edward Elgar Publishing, 10.
[9]〔加〕维奥拉托.给未来的一些处方[A].瞿葆奎.国际教育展望[M].北京:人民教育出版社,1993:324.
[10]〔美〕杰罗姆·布鲁纳.布鲁纳教育文化观[M].黄小鹏译.北京:首都师范大学出版社,2012:30.
[11]OECD. (2015). Students, computers and learning: Making the connection. PISA, OECD Publishing, 17-19.
[12]Bulman, G. , &R. W. Fairlie. (2016). Technology and education: Computers, software, and the internet-science direct. Handbook of the Economics of Education, 5, 239-280.
[13]Zhang, K. , &Aslan, A. B. (2021). AI technologies for education: Recent research & future directions. Computers and Education: Artificial Intelligence, 2.
[14]Samarakou, M. , Fylladitakis, E. D. , Früh, W. G. , Hatziapostolou, A. , & Gelegenis, J. J. (2015). An advanced e-learning environment developed for engineering learners. IJET, 10(3), 22-33.
[15]Crossley, N. (2011). Towards relational sociology. Abingdon: Routledge, 35.
[16]Donati, P. (2011). Relational sociology: A new paradigm for the social sciences. New York: Routledge, 89.
[17]Cook-Sather, A. , Bovill, C. , & Felten, P. (2014). Engaging students as partners in learning and teaching: A guide for faculty. San Francisco: Jossey-Bass, 6-7.
[18]Jankowski, N. A. (2017). Unpacking relationships: Instruction and student outcomes. The American Council on Education (ACE). p. iii.
[19]Pascarella, Ernest T. , Tricia A. Seifert, &Elizabeth J. Whitt. (2008). Effective instruction and college student persistence: Some new evidence. New Directions for Teaching & Learning, 115, 55-70.
[20]Eisner, E. (1985). Theart of educational evaluation. London: Falmer Press, 275.
[21]Shulman, L. S. (2004). Professional development: Leaning from experience. In S. Wilson (Ed.), The wisdom of practice: Essays on teaching, learning, and learning to teach. New Jersey: Jossey-Bass, 503-522.
[22]Alexander, P. , D, Schallert & R. Reynolds. (2009). What is learning anyway?A topographical perspective considered. Educational Psychologist, 44, 176-192.
[23]Schön, D. (1987). Educating the reflective practitioner: Toward a new design for teaching and learning in the professions. San Francisco: Jossey-Bass, 376.
[24]Sims, S. , & J. Jerrim. (2022). Traditional and progressive orientations to teaching: New empirical evidence on an old debate (CEPEO Working Paper No.22-08). Centre for Education Policy and Equalising Opportunities, UCL. https://EconPapers.repec.org/RePEc:ucl:cepeow:22-08.
[25]Vogelgesang, J. , J. Bleher, C. Krupitzer, A. Stein, &R. Jung. (2023). Nutzung von ChatGPT in Lehre und Forschung-eine Einschätzung der AIDAHO-Projektgruppe.
[26]Pearl, J. (2019). The seven tools of causal inference with reflections on machine learning. Communications of ACM, 62(3), 54-60. https://cacm.acm.org/magazines/2019/3/234929-the-seven-tools-of-causal-inference-with-reflections-on-machine-learning/fulltext.
[27]Microsoft Research. (2023). Sparks of artificial general intelligence: Early experiments with GPT-4. 92-95. https://arxiv.org/pdf/2303.12712.pdf.
[28]Ouyang, F. , &Jiao, P. (2021). Artificial intelligence in education: The three paradigms. Computers & Education: Artificial Intelligence, 2, 100020.
[29][30]Lyotard, Jean François. (1984). The postmodern condition: A report on knowledge. Minneapolis: University of Minnesota Press, 4-5.
[31]Chalmers, D. J. (2022). Could a large language model be conscious? https://philpapers.org/archive/CHACAL-3.pdf.
[32]Rosa. H. (2019). Resonance: A sociology of the relationship to the world. Polity Press.
The Logic of Education and the Educational Temptation of Artificial Intelligence
WuGang YuanLei
Abstract: Education is carried out based on the individual's mental development and general social and cultural developments. The logic of education refers to the ideal goal of education and the reasonable operating mechanism to achieve the goal, including its evolutionary rules and effective order. Hirst, Benner, Biesta, and other theorists have analyzed the purpose of education from the perspective of subjectivity development. However, the educational process is a relational process, the core of which is the relationship between teaching and learning, a complex, culture-based adaptive activity with emergent effects. Education has been adopting a variety of technologies, but they are only tools for teaching and learning activities. Though they bring more diverse and lively classes, they have little effect on students' academic development. The emergence of ChatGPT as a generative AI brings a new pattern of education, marking a breakthrough in the relationship between AI and education. Future developments in educational AI will present a resonant relationship between teaching and learning.
初审:王远琦
复审:孙振东
终审:蒋立松