当前位置: 首页 > 在线期刊 > 2023年 > 第9期目录(总第一百九十五期) > 正文

机器学习时代的人类学习——ChatGPT引发的教育哲学反思

作者:余明锋
阅读数:54

来源:《北京大学教育评论》2023年第1期


要:ChatGPT在自然语言处理上的突破开启了人工智能通用化的大门。当下取得突破的,不是基于规则的早期人工智能,而是基于机器学习的新型人工智能。机器学习乃是算力、数据和算法三者的聚合,机器学习时代的文明界面由此从人类才能识别的文字转变成了机器能够识别的数据。目前有关ChatGPT和教育人工智能的讨论,多着眼于机器学习的短期效应,我们有必要以机器学习时代的眼光理解ChatGPT的挑战,以此为契机审视人类学习的重组。机器学习在带来种种挑战的同时,或许能让教育机构解脱于生存机构的纠缠,回归“学以成人”的文明理念。

关键词:机器学习;ChatGPT;教育人工智能;人类学习的重组


所谓教育哲学,首要的任务是反思何谓教育、何谓学习。这种反思不是一蹴而就的,因为教育和学习的具体含义有其时代性,必定随时而变。当朱熹注解《论语》时,“学而时习之”的现实意涵已然大大不同于孔子的时代,因为朱熹的时代已经有了印刷术和科举制度,这时候主要学习的不再是礼仪的操练,而是经典的记诵和注解。进入21世纪,其意涵更是大不相同,学习的主要任务不是深入四书五经,而是融入现代知识体系,成为现代国家的公民。教育哲学的反思因此必定包含了一个历史哲学的维度,必定要在时代剧变中重新定义教育和学习,而首要的任务是对时代本身的重新界定。

“随时而变”在这个意义上并非随波逐流,而恰恰是要在加速流转、躁动不安的时代洪流中寻求清晰的定位。历史哲学的眼光和方位感可以让我们一方面敏感于AlphaGo、ChatGPT这样的新事物,另一方面又不至陷入媒体的夸大其词所营造的恐慌情绪。这个意义上的思想者在积极介入的同时处变不惊,着眼于时代深处远为沉静的涌动来理解河面上的激流。

一、机器学习的概念

ChatGPT就是2023年的这样一股激流。人工智能在自然语言处理上的突破意义重大,约略来说,在教育问题的讨论中,有两点值得着重指出。

首先,自然语言处理(natural language processing,简称NLP)虽然仍是一个专用人工智能领域,可自然语言是人类文明的基本媒介,不但承载着人类的知识和思想,而且是人与世界、人与人相交往的主要通道,自然语言处理的突破意味着人工智能的“通用化”大门已经打开。这种通用化一方面指的是GPT-4已经呈现出某种通用人工智能的特征。微软研究院发表了一篇长达154页的重磅论文,题为《通用人工智能的火花 :GPT-4早期试验》(Sparks of Artificial General Intelligence Early Experiment swith GPT-4),得出结论说 :“鉴于GPT-4能力的广度和深度,我们相信它应该被合理视作一个通用人工智能系统的早期(但仍不完整)版本。”所谓通用人工智能(artificial general intelligence,简称AGI),就是不局限于下棋、驾驶、绘画等专项领域,而是“能够像人类那样胜任各种任务”,“具有跨领域的问题处理能力”。[1]微软是Open AI的主要资金来源,所以微软研究院并非中立的第三方,这篇长文的惊人结论必定会遭遇同行的质疑和挑战;可单从表现来看,在聊天、绘画、编程等等领域均表现不俗的GPT-4确实可谓“通用人工智能的星星之火”。有关于此,对通用人工智能和强人工智能的概念做一番区分,或许就能化解争论。强人工智能具有“真实心智”,而通用人工智能未必如此,只是它的表现会给人留下具备“真实心智”的印象。就此而言,我们要警惕自己高估ChatGPT这样的大语言模型(large languagemodel,简称LLM)。它并不是真的在“聊天”,因为背后并没有一个“真实心智”,它并不理解自己输出的句子,而只是在做准确度惊人的词频统计。因此,撇开有关通用人工智能的争论不说,在此所谓“通用化”,在另一方面,指的主要是自然语言处理的突破进一步扫除了人机交流的障碍,而这意味着人工智能向生活世界的全面渗透。人工智能的时代真的到来了。就此而言,ChatGPT确实可谓人工智能发展史上的一座里程碑,意义不容低估。

其次,这个正在到来的人工智能时代,准确来说,是一个机器学习(machine learning)的时代。因为当下取得突破的人工智能,不是基于规则的早期人工智能,而是基于机器学习的新型人工智能。所谓基于规则的早期人工智能,是“让计算机执行某项任务的传统方式”,即“写下算法”或“一系列向计算机发送的指令”,以此直接规定计算机应如何执行任务。[2]而机器学习“涉及大量数据输入以预测全新的结果,而绝非直接命令得到的直接输出”。[3]换言之,“每个算法都有输入和输出 :数据输入计算机,算法对其进行处理,然后输出结果。机器学习将这种情况颠倒过来:输入数据和期望的结果,而输出的是将前者转化为后者的算法”[4]。机器学习所用的算法是“生成其他算法的算法”,是自动化本身的自动化。

机器学习的方法分为三种,分别是监督学习、无监督学习和强化学习。所谓监督学习,用斯图亚特·罗素(StuartJ.Russell)和彼得·诺维格(Peter Norvig)的定义来说,就是通过“观察一些输入和输出的例子之后,获得了从输入映射到输出的函数”[5]。因此监督学习处理的是被标记过的数据,而无监督学习是在没有标记的数据中、没有明确反馈的前提下,从海量的输入中识别出模式。强化学习是让机器“从一系列的强化,即从奖励和惩罚中学习”。

机器学习在近十年的高速发展尤其要归功于基于“人工神经网络”的“深度学习”(deep learning)。所谓“深度”,就是在输入层和输出层之间设置了隐藏的中间层。如论者所言 :“隐藏层是人工神经网络能力的关键,但也带来了一个问题。很难弄清楚人工神经网络是如何找到解决方案的。”[6]这也就是在有关ChatGPT和GPT-4的讨论中备受关注、备受争议的“涌现”和“可解释性”问题。无论是否称之为“涌现”,机器着实在学习。机器的学习严格来说不同于人类的学习,只要强人工智能尚未产生,我们就只能从隐喻的意义上谈论“机器学习”,可机器经过层层训练之后,确实从海量数据中生成了一套相当可靠的算法,这个过程是不妨称之为“学习”的,虽然其学习路径还呈现出一种黑箱性质。

二、机器学习的时代

我们无须在此深入相关的技术细节,而是满足于技术轮廓的勾勒,并从这种勾勒中体察当下时代的若干基本特征,说明我们为何主张以“机器学习”来为时代命名。首先,机器学习的广泛应用可谓19世纪中叶以来技术时代的一次重大变形。当下流行“AI时代”“智能时代”“数据时代”“算法时代”等等提法,可如果想要更准确地标识这一次发展,那就应该称之为“机器学习的时代”。因为机器学习是人工智能的当下形态,也是数据之所以变得如此重要,而算法之所以能够深入生活世界的关键所在。算力、数据和算法三者缺一不可,仅仅强调三者之一,事实上都不能抓住机器学习成功的要害 :“AI之所以能在过去十年中重获新生并呈指数级增长,都得益于机器学习领域取得的重要进展(就像我们已经注意到的一样,这都基于更快的计算机处理器,海量可利用的大数据以及新的计算方法)。”机器学习可谓算力、数据和算法的聚合。如技术史家所言,判断科技发展的方向,要看的不是单方面的突破,而是“一个浪潮的聚集势头”。[7]机器学习正是当下信息技术的聚集势头。

其次,从机器学习的角度会发现,当下知识的承载形式或信息的交互界面正在从人类才能识别的文字转变成机器能够识别的数据。一方面是人类过往的知识库被做了数据化处理,另一方面数据的来源已经从人类的思想扩展到互联网能够记录、传感器能够监测的一切,包括一些看似无意义的人类行为、身体器官的跳动和动物行为等等。智能手机、智能驾驶、植入人身和动物身体的各式传感器等每天都在搜集这样的数据。而机器由此绕过有意识的主体,通过数据总结规律、预测行为。这意味着当下文明的界面已然在相当程度上转移到了机器可识别的数据。据估算,2000年左右,只有四分之一的信息以数据的形式存在;到了2013年,这个比例已经超过98%。可以想象,近十年来,数据几乎覆盖了全部的信息。这个转变可谓印刷术之后最重要的信息革命,是文明界面的转移。有关于此,今天恐怕还很难做出足够充分地估量,因为我们仍然处在转变的早期阶段;不过从机器学习的角度来看,我们至少可以打开一个更为恰切地看待这种转变的视野。

再次,以“机器学习”来命名,才能凸显这个时代独特的知识状况和主体性境况,而这尤其值得在谈论教育问题时作特别的关注。在漫长的文明史中,人类是知识生产的唯一主体。可在机器学习的时代,不但知识的承载或信息交互的主要形式从文字转变成了数据,数据的来源已经扩展至形形色色的传感器,而且数据的处理和知识的生成也将越过人类大脑,发生在机器学习的黑箱之中。机器难道不正因此成了人类之外的认知主体?随着机器学习时代的到来,人在以一种不可低估的加速度将自己的主体地位外化,以至于我们如果仍然固守传统的主体理论模式,将无以把握人类在当下世界的真实处境。“这个世界不再以人为中心。”[8]人已经不是唯一的认知主体,也不是唯一的行动主体。虽然人工智能尚不具有自我意识,也不太可能经由算力和算法的进步“涌现”出自我意识(因为这意味着一种存在论上的跨越),可是不得不说,人工智能已经具备某种类主体性(quasi-subjectivity)地位。

另外,机器学习事实上已在消减人类个体的主体性 :“当我们渗入、穿戴或携带传感器,或当身体植入传感器,向传感器输出我们的生理和行为的历史数据时,我们身体经验的理念发生什么变化呢?”[9]如果机器学习通过数据处理可以绕过人类的自我意识,得出有关人类的更为可靠的知识、做出更为可靠的预测,那么人不是正在经历一种自身的客体化变形吗?无论如何,我们今天事实上迫切需要一种扩展的主体性理论,将人类之外的主体性力量纳入考察范围。而机器学习的概念正是这样一种主体性理论的重要组成部分。

三、ChatGPT与教育人工智能

之所以着重提出“机器学习时代”的概念,一方面是为了更准确地界定这个时代,尤其是这个时代的知识状况和生存境况,另一方面是相应地提出人类学习的概念。未来的人类已经无法脱离机器来理解自身,未来的人类学习同样无法脱离机器学习来得到理解。这个未来甚至已经到来。

ChatGPT最早引起全球范围的关注,就是因为教育领域的强烈反应。2023年初有报道说,北密歇根大学有个学生通过ChatGPT写的论文拿了第一名,于是教育领域喊出了第一声“狼来了”。为什么首先是教育?因为ChatGPT在社会生活各方面的应用往往需要进一步的嫁接,但教育上的应用是最直接的。它可以光速浏览海量文献,以一种相当规整的形式撰写论文。虽然在实际使用中还能发现种种问题,但从北美各高校和顶级期刊的反应,我们已经可以感受到这种冲击的分量。可有关于此的讨论大多仅仅着眼于ChatGPT所带来的短期冲击,尤其是高等教育中的评价问题、学术生产中的知识产权和剽窃问题。如论者所言 :“关于ChatGPT最具争议的问题不是它的回答质量,而是它是否会成为那些需要撰写文本而不付出努力的人使用的工具。”[10]另一方面的讨论更切实地关注“如何成功地将人工智能纳入教育情境,使教师和学生受益,同时促进负责任的和合乎道德的使用”。[11]有关于此的讨论大体在教育人工智能(AIEd)的范围内进行。类似的讨论其实由来已久,《教育中的人工智能》一书甚至将历史追溯至20世纪20年代的心理学家西德尼·普莱西(Sidney Pressey)和行为主义之父斯金纳(B.F.Skinner),而当下最主要的应用是所谓的智能辅导系统(Intelligent Tutoring Systems,简称ITS)。可以想象,ChatGPT如果得到恰当地运用,会是迄今最有效的智能辅导系统;机器学习的进一步发展也将使人工智能越来越深地融入教学。

所有这些讨论与前一方面的讨论同样大有必要,然而相关的讨论往往只是将人工智能视为可用的工具,局限于探讨如何将人工智能运用于教育,开发辅助教学的工具。这都只着眼于机器学习的短期效应,还没有从“机器学习的时代”这样的大判断出发来做教育哲学的反思。

四、人类学习的重组

在这样一个大变革的时代,我们大有必要在短期考量之外作长远的思虑,以教育哲学的眼光反思机器学习时代的人类学习。有关于此的反思是以人类未来为主题的大尺度思考,具有一种“预思”和“猜度”的性质,因而笔者在此仅仅满足于举出以下四点,作抛砖引玉之论。

首先,如果说机器学习时代的到来,意味着人类知识体系、劳动分工和生活方式的重组,那么人类学习的总体内容和整体模式也将面临重组。可人类学习恐怕会在这种重组中面临严峻的挑战,这涉及知识的本性和教育的目的等深层次问题,尤其值得我们做深入的教育哲学反思。面对人工智能的挑战,美国教育委员会(ACE)前任主席约瑟夫·奥恩(JosephE.Aoun)提出“免遭机器入侵的教育”或“防御机器人教育”(robot-proof education)的理念。[12]这并不是要在教育中摒弃机器的介入,而是强调培养的目标要转向那些不能被机器所替代的能力。比如,他提倡培养学生的发散性思维,因为在收敛性思维上,机器远胜于人 :“当我们使用收敛性思维时,我们在权衡数据和替代方案以达到最佳、最清晰的结果。这种思维活动正是高端计算机和机器越来越熟练的领域。发散性思维则是通过创造性生成的多种反映,以自由流动的思想形式存在。”[13]可问题在于,收敛性思维的训练和相关知识的掌握往往正是有效的发散性思维的前提?当下的教育有着种种众所周知的弊病,比如,基础教育过多地强调对“知识掌握程度”的考查,高等教育也有过度专业化、知识化的弊病,就此而言,机器学习的强力看似有着一种解放的潜能,将我们解放于机械记忆和知识的单纯累积的重负,让教育者回归教育的本义。可这种解放会不会反过来撤掉了梯子,让未来一代丧失了逐级攀登的耐心和可能?当人类不再需要记电话号码之后,我们也就记不住一连串的电话号码了。同样,当人类可以便捷地从机器中调取知识,我们在多大程度上会远离经典文本、远离文明的源头?无论如何,机器学习都在成功地将一切知识数据化、信息化,而思想会不会因此一道变形为信息处理?在机器学习的时代,人类学习当以数据和信息之上的思想能力的培养为目的。因此,无论名之为“发散性思维”“创造性思维”“批判性思维”或“系统性思维”[14],抑或“高通路迁移”等等[15],学习的重组都要以机器时代为语境,以超越于机器的人性生活为目标。

其次,在机器学习的时代,有必要重审文理之间的区隔。一方面,科技素养和数据素养当成为未来人类的基本素养,“因为编码是数字世界的通用语言,所以每个人都应该熟悉它”[16]。如果不懂编程语言,也就意味着无法进入机器学习时代的文明界面,无法对时代的运行机制形成一种直觉和判断,因此无法成为未来世界的合格公民。可在另一方面,技术专家也亟需突破自身的盲区。如萨斯坎德所言 :“在科技公司内部,几乎没有工程师身负努力思考其工作的系统性后果的任务。他们中的大部分只需要解决某些分散的技术问题就可以交差了。”[17]如果是这样的技术专家在推动人类的发展,那所谓的“进步”难道不正意味着巨大的冒险?像机器学习这样惊人的技术突破会不会正以光明的名义带来黑暗?

从另一个角度来说,软件工程师可谓机器学习时代的基建工人,当机器学习渐入正轨,软件工程师难道不也正在努力建造一个不需要自己的世界?“人们常说,软件正在吞噬世界,所以我们需要软件开发人员。但当软件吞噬完世界后,我们需要什么就不太清楚了。当机器人学会自己编程时会发生什么?”[18]技术专家同样需要重获人文素养,摆脱“工具人”的地位。

再次,学习的重组也意味着教育制度的重构。现代教育制度是基于启蒙运动以来的知识理念和工业社会的组织架构而建立的,比如划分专业就与整个工业社会的架构分不开。当技术的发展使这些理念和架构都面临失效的时候,基于此而建立的现代教育制度恐怕也到了一个亟需变革的时刻。如奥恩所言 :“美国的教育体系在很大程度上是为了满足19世纪和20世纪工业经济体系的需要而设计的,因此在工厂、官僚结构和分类账簿充斥的世界里,它往往强调这个世界里最有价值的机能。”[19]这样的状况显然决不局限于美国的教育体系,而是普遍表现于全世界的教育体系当中。可如果第二次工业革命所建立的经济体系已渐成历史的陈迹,与之相应的教育体系难道不是成了无本之木?难道不是到了亟待改革的时刻?

最后,在有关“人工智能与教育”的思考中,论者往往以人工智能革命所潜藏的就业危机为出发点,以“工作的未来”为准心来思考和设计“教育的未来”。这本身无可厚非,就今天的情境来说,这毋宁是一种负责任的教育思考。可我们有必要追问,这是否恰恰仍然受缚于工业时代的教育观念和学习观念?如果说机器学习蕴含着某种解放的潜能,那是否有可能将我们从现代的工作观念中解放出来?事实上,早在第二次工业革命之初,尼采就惊呼教育的遗忘,因为真正的“教育机构”被混同于“生存机构”了,前者是“纤足的、娇贵的天国仙女”,后者是“实用的女佣”。[20]而机器学习能否促逼我们跳脱尼采所咒骂的“19世纪的野蛮”,让未来的人类回归“学以成人”的文明观念?这或许是一个太过美好的希望。不过,我们不妨援引尼采的话来总结这篇教育哲学反思,也让这篇关于机器学习的思考不至变得过于灰暗 :“请注意,我的朋友,请不要混淆了两类事情。一个人为生存、为了生存斗争必须进行大量学习,但他作为个体为这个目的所学所做的一切,都与真正的教育毫无关系。只有在远高于这种困境、远离生存斗争和必需之物的大气云层之上,真正的教育才开始。”


注释:

虽然朱熹所强调的是心性的觉悟,可他的《四书章句集注》还是成为流传几百年的标准教科书。有关“学而时习之”,朱熹的解释与其说在追踪孔子时代的原义,不如说是在为理学作印证:“人性皆善,而觉有先后,后觉者必效先觉之所为,乃可以明善而复其初也。”(参见朱熹:《四书章句集注》,中华书局2011年版,第49页。)

但是,教育和学习难道没有超越时代的本质吗?哲学难道不是应该关注这个意义上的本质?这样一个超越于流变的本质之维,诚然存在于我们的思维结构之中。可即便假定它也存在于现实之中,其具体含义总要在历史语境中才能得到理解。就此而言,从历史哲学出发,仍然是一条切实可行的路径。从历史哲学的反思中,我们或许还能比体系化进路更为有效地逼近这个意义上的本质。尼采采取了一种更激进的历史化进路,这种进路直接取消了本质之维。无论我们是否赞同尼采的进路,无论尼采的进路是否内在蕴含着悖论,他对哲学本身所固有的非历史化倾向的批判都发人深思:“哲人关于人的一切言论,其实都只是关于一个非常有限的时段中的人的鉴定。缺乏历史意识乃是所有哲人的遗传缺陷。”(参见尼采:《人性的,太人性的》,魏育青译,华东师范大学出版社2008年版,第19页。)

有关这一区分,可参见徐英瑾:《人工智能哲学十五讲》,北京大学出版社2021年版,第92-93页。当然,还可以进一步追问:如果背后无真实心智可言,那么所谓“通用人工智能”又能通用到何种程度?会不会只能停留于火花状态?

有关技术时代的广义和狭义的界定,参见余明锋:《还原与无限》,上海三联书店2022年版,第60页和第92-93页。

参见韦恩·霍姆斯、玛雅·比利亚克、查尔斯·菲德尔:《教育中的人工智能》,冯建超等译,华东师范大学出版社2021年版,第94页。有关数据的重要性,可参见萨斯坎德的论述:“数据对机器学习来说是至关重要的,如果数据太少,机器学习算法的发展便会受阻,如果数据足够多,‘一种只有几百行的学习程序就能轻松产生千万行的程序,而且它能在不同问题上反复使用’。这就是数据被称为‘新煤矿’,而收集数据的人被称为‘数据挖掘者’的原因。”(杰米·萨斯坎德:《算法的力量》,北京日报出版社2022年版,第10页。)不过,数据之所以如此重要,是因为有了相应的算力和算法;反之亦然。因此单单强调三者之一都是片面的。

参见Kenneth Cukier & Viktor Mayer-Schönberger (2013).The Rise of Big Data. Foreign Affairs, May/June2013https ://www. foreignaffairs. com/articles/2013-04-03/rise-big-data.萨斯坎德在书中引用了这一说法,不过中文版把2000年的“四分之一”错译成“三分之一”。有关这个过程,萨斯坎德做了相当充分的解释 :“有四个因素促成了这个过程。第一,越来越多的社会活动通过数字系统或数字平台展开,可供收集的数据就更多了。第二,在过去五十年中,存储数据的成本每两年就减少一半,而其密度却增加了5000万倍。第三,算力的爆发式增长使我们有能力处理存储的内容。第四,数字信息的复制几乎没有边际成本,它们可以相当廉价地复制数百万次。这些因素共同解释了为什么从基于印刷的信息系统过渡到数字化系统的过程中就产生了如此大规模的数据爆炸。”参见《算法的力量》,第34页。

参见韦恩·霍姆斯、玛雅·比利亚克、查尔斯·菲德尔 :《教育中的人工智能》,冯建超等译,华东师范大学出版社2021年版,第99-100页。当然这只能算是教育人工智能的史前史,因为那时候还不存在所谓的人工智能。


参考文献:

[1]徐英瑾.人工智能哲学十五讲[M].北京:北京大学出版社,2021:76,93.

[2][17]〔英〕杰米·萨斯坎德.算法的力量[M].北京:北京日报出版社,2022:8,vii.

[3][6][15]〔美〕韦恩·霍姆斯,玛雅·比利亚克,查尔斯·菲德尔.教育中的人工智能[M].冯建超等译.上海:华东师范大学出版社,2021:94,233,33.

[4]Domingos, P.(2015).The master algorithm: How the quest for the ultimate learning machine will remakeourworld.London:Allen Lane, 6.

[5] Russell,S.J.,& Norvig, P. (2022) . Artificialintelligence : A modern approach.Global Edition, Pearson,671.

[7]〔英〕阿诺德·佩西,白馥兰.世界文明中的技术[M].北京:中信出版社,2023:195、366.

[8][9]〔意〕柯西莫·亚卡托.数据时代[M].何道宽译.北京:中国大百科全书出版社,2021:87,46.

[10]García-Peñalvo,FranciscoJosé.(2023).The perception of Artificial Intelligence in educational contexts after the launch of ChatGPT : Disruption or Panic ? Educationin the Knowledge Society, 24, 3.

[11] Adiguzel,et al. (2023).Revolutionizing education with: Exploring the transformative potential of ChatGPT. Contemporary Educational Technology, 15(3),1.

[12][13][14][16][18][19]〔美〕约瑟夫·奥恩.教育的未来[M].李海燕,王秦辉译.北京:机械工业出版社,2018:62,64,79-84,62,52-53,66.

[20]〔德〕尼采.论我们教育机构的未来[M].彭正梅译.北京:商务印书馆,2019:76.


Human Learning in the Age of Machine Learning: Reflections onChatGPT and Educational Philosophy


Yu Mingfeng


Abstract :The breakthrough of ChatGPT in natural language processing opened the door to the general application of artificial intelligence. It is not based on rules such as the early artificial intelligence, but based on machine learning as the new artificial intelligence. Machine learning combines computing power, data, and algorithms. The interface in the era of machine learning has thus changed from texts that humans can recognize to data that machines can recognize.The current discussions on ChatGPT and AIED focus on the short-term effects of machine learning. It is necessary for us to understand the challenges of ChatGPT from the perspective of the machine-learning era and take this opportunity to examine the reorganization of human learning. While machine learning brings various challenges, it may allow educational institutions to disentangle themselves from survival institutions and return to the civilized concept of "learning to become human".


初审:伍艳丽

复审:孙振东

终审:蒋立松



010-123456 jiaoyuxuezaixian@163.com

北京市教育学在线

版权所有 |教育学在线 京ICP备1234567号 在线人数1234人