摘 要:人工智能与认识论有着独特而内在的关系,使得两者之间可以进行哲学上的互释:一方面是对人工智能的认识论阐释,包括揭示人工智能的认识论根基,尤其是不同人工智能纲领或范式(符号主义、联结主义和行为主义)的哲学认知观,以及它们进行智能(认知)模拟时与人的认知之间所形成的同理、同构、同行、同情的不同关系;另一方面是对认识论进行基于人工智能视角的阐释,包括依托人工智能范式所进行的认知分型(推算认知、学习认知、行为认知和本能认知),进而揭示这些分型之间的多重关系。在此基础上,还可以对人工智能和认识论之间进行动态互释,揭示两者之间难易互逆的关系,由此对人工智能发展走向形成有根据的预判,有助于正视人类智能和人工智能之间的互补,进而推进不同算法和认知类型的融合,并印证人们对认知本质相关阐释的合理性。
关键词:人工智能;认识论;认知分型;演进;阐释
人工智能(AI)和人类所创造的其他科学技术一样,是不断演进和发展的;基于不同纲领的AI流派(符号主义、联结主义和行为主义)陆续成为人工智能的核心范式,就是这一演进的标识。将认识论与人工智能的演进关联起来进行一种哲学上的相互阐释,可以形成互惠于两者的双向启示。其中,将人工智能纳入认识论研究的视野,有助于揭示不同纲领人工智能所蕴含的不同认知观,从哲学上发掘人工智能范式区分的认识论根基,展现出认识论对于人工智能的阐释力。与此同时,我们也可以且有必要将认识论纳入人工智能考察的视野,对“认识是如何进行的”加以基于AI及其算法演进的分型,从而借助人工智能来揭示不同类型认知的运行机制,“反向地”观照我们对自身认知的理解。这种双向互释还可以“同框”展开:人工智能模拟认知类型的演进序列与人自身的认知演进序列,具有一种“先后互逆”进而“难易互逆”的关系,由此人的认知和机器智能之间的运行机制形成一种对比性阐释,并启示我们如何走向人机协调及智能互惠的关系。
一、人工智能演进的认知观基础
人工智能的演进是伴随其核心技术的算法的演进进行的,例如,从经典算法到深度学习,也是人工智能从20世纪50年代居于支配地位的符号主义人工智能到80年代后逐渐走向统治地位的联结主义人工智能(或人工神经网络AI)的发展,而在机器学习算法中进一步开发了强化学习算法后,则随之有行为主义人工智能在20世纪末的问世。虽然人工智能的范式划分基于不同的标准有不同的结果,但将其划分为上述三种范式已成为目前普遍接受的视角;而这些不同的人工智能及其算法是以不同的认识论理论(亦即不同的哲学)为基础的。
人工智能的演进是对人的智能或认知活动的模拟范围或类型不断扩展从而模拟能力不断提升的过程,这个过程与不同范式的人工智能源自或表达的哲学认知观密切关联。这是因为人工智能在追求“像人一样思考”或相似于人的方式作出反应时,必然涉及人是怎样思考与怎样反应的问题,也就是如何进行认知的问题。“如何认知”既包含认知的方式也包含认知的机理和本质,由此构成了哲学上的“认知观”。人工智能演进中的不同范式所诉诸的不同纲领,就是基于不同的认知观而形成的:阐释“认识是什么”以及“认识如何进行”的哲学认知观,构成人工智能的哲学根基,它决定了人工智能如何去模拟人的认知,以及模拟人的什么样的认知,由此确立人工模拟的不同目标,设计不同的技术进路,进而形成不同范式或流派的人工智能。如同人工智能的创始人之一麦卡锡(John McCarthy)所指出:人工智能和哲学比一门科学与这门科学的哲学有更多的共同之处。这是因为人工智能的研究者需要具备一定的哲学态度,特别是认识论的态度。[1]迄今面世的三种范式的人工智能,分别将认知的本质理解为理性推导、经验学习和人与环境的互动,从而分别建立了基于知识表示、人脑神经网络和感知—行动的人工智能系统或智能体,认识论在这里可视为对人工智能演替进行哲学阐释的主线。
具体地说,基于经典算法的符号主义即传统范式的人工智能与理性主义相关,其方法论基础是演绎推理,哲学上直接受逻辑实证主义的认识论影响。麦卡锡就明确认为:“人工智能(这里当然是指创立之初的符号AI——引者注)已经从分析哲学与哲学逻辑研究中获益”;[2]皮茨(Walter Pitts)、西蒙(Herbert Simon,中文名为司马贺)、所罗门诺夫(Ray Solomonoff)等人工智能的其他重要创始人,也均受到过分析哲学的影响,他们都曾在芝加哥大学因听过卡尔纳普的课程而深受其“哲学就是逻辑分析方法”的启发,以至于他们的思想被认为是发源于卡尔纳普的分析哲学思想。[3]而弗雷格、罗素的数理逻辑以及早期维特根斯坦的《逻辑哲学论》也对符号AI产生了深刻的影响。
逻辑实证主义将认识看作以逻辑为基础的符号推理过程或计算活动。这一认知观在符号主义人工智能中得到了透彻的贯通和体现。由经典算法支配的人工智能的工作模式就是:一个既有的算法犹如先在的理性规则或先验存在的信息加工装置,等待它要处置的个别数据;机器认知的过程就是将输入的数据按算法规则加工成输出的符号,形成知识表征。在哲学家德雷福斯(Hubert Dreyfus)看来,符号AI所主张的这种信息加工模式是一种标准的唯理论,它把“具体的感性同化为用于抽象思维中的受规则支配的符号描述”。[4]这种观念可追溯到柏拉图那里,他把全部的推理活动化约为明晰的规则,再把世界分解为可运用这些规则去处理的原子事实;所以认知无非就是按明晰的规则进行计算,一切知识都可以编码为计算机能够处理的符号。可以说,经典算法及其相应的符号人工智能较为成功地模拟了人的左脑的抽象逻辑思维。
建立在人工神经网络基础上的深度学习算法及其联结主义人工智能则跟经验主义的认识论相关联,在其看来,学习就是大脑所做的事情,学习的过程就是从不断积累的经验中归纳出一般原则的过程,机器学习就是要模拟并实现大脑的这种学习功能。当人把经验数据提供给机器系统,它就基于这些不断积累的数据生成模型,然后用这些模型去进行辨识(如图像、声音识别等,统称为模式识别),这就类似于人所进行的学习。这是一种从经验到理论的认知进路,是从数据中提炼出规律即相应的知识和模型的过程,即从个别到一般的归纳过程;然后在面对新情况时,所形成的一般模型就会提供相应的判断,此即通过训练而生成的模式具有对新对象的识别能力。这一范式的方法论与逻辑学基础是统计学和归纳推理,理论基础是结构主义,它从神经网络及其连接状态来阐释人的认知机理,主张智能是人脑活动的产物,且是简单的单元通过复杂而大量的联结(特定的结构)所涌现出来的功能;学习的过程就是调整神经元之间的联结强度并形成特定结构的过程,这也是一个面对信息输入进行自组织自适应的过程。这种可调整的可塑性也是联结主义赋予人工神经网络学习功能的根据,它重现了人脑在学习时所发生的现象:在外来信息的刺激作用下改变或形成新的突触联系。从经验归纳的认识论进路看,这一人工智能系统具有将数据或信息加工为知识的指向。由于对图像(如人脸、笔迹、医疗图像)具有的强大识别能力,一定意义上可以说基于深度学习的联结主义AI主要模拟的是人的右脑的形象思维。
符号主义人工智能与联结主义人工智能之间的差别,关联着两种认识论的差别:前者是基于规律—规则的人工智能,人将规律—规则模型化程序化,其中包括从专家的经验中整理出来的普遍化知识,它能较好地解决理性思维中的推理或计算问题;后者根据人提供的经验数据等信息去生成模型,即系统从数据中提炼规律,形成知识,能够较好地解决感性认识中的识别问题。两相对比,一个是规则在先,一个是规则在后;前者是一般先于特殊,后者是特殊先于一般,所以后者使得算法背后体现的认识论原则或哲学范式发生了“转型”。正是这种转型,才克服了传统人工智能发展中的瓶颈,即智能机器不可能事先都设定好理论模型去处理各种问题。例如人在识别椅子时,无论它使用了什么材质或做成什么形状,都不会把椅子错认为桌子,但这样的识别过程就无法直接用形式化的符号表述出来,从而不可能事先编好可以识别一切椅子的算法,使得智能机器面对各种椅子时都能进行正确的识别。而通过深度学习算法,通过大数据的训练就可以在人工神经网络中形成识别出椅子的权重结构模型(状态),从而可以有效地完成识别那些没有在训练中出现的椅子的任务。上述两种范式人工智能的重大区别,意味着它所折射的思维认识类型也较之传统的类型发生了“质的转型”,人脑中那些有深度层次化特征的子模块(如视觉皮层)成为把握认知机理的重点对象,也成为智能模拟的新范式。
追求“像人一样行为”的行为主义范式的人工智能与强化学习算法相关联。“强化学习”是指可以用来支持人们去做决策和规划的一种学习方式,它通过对人的一些动作、行为产生奖励的回馈机制来促进学习。作为学习算法中的一个类型,强化学习从某种意义上形成学习算法的又一次演化,使得学习算法在先前只用来解决“识别”和“理解”问题,进一步演进到用来处理与环境互动的问题,也就是从只行使认知功能(“像人一样思考”)扩展到“像人一样行动”的功能。[5]其实,关于人工智能的目标,一开始就并非仅有“像人一样思考”的理解,而且有更广义的“像人一样行动”的追求,后者就是行为主义范式的人工智能。强化学习算法及其行为主义人工智能所秉持的认知观是:智能源自感知和行动,它是在与环境的相互作用中得以体现的,认知就是身体应对环境的一种活动,是智能系统与环境的交互过程,是在不断适应周围复杂环境时所进行的行为调整。这种与环境的互动是造就智能的决定性因素,认知主体是在对环境的行为响应中通过自适应、自学习和自组织而形成智能的,而不是通过符号、表征和逻辑推理等去形成智能,所以传统AI的“感知—建模—计划—行动”中的中间两环节都无必要,“感知—行动”就足以完成与环境的互动,此即“没有表征的智能”,“机动性、敏锐的视觉以及在动态环境中执行与生存相关任务的能力,为发展真正的智力提供了必要的基础。”[6]这就是“基于行为的AI”,它不再把研究重点放在知识表示和推理规则上,而是聚焦于复杂环境下的行为控制问题,将智能的本质理解为“在不可预测的环境中做出适当行为的能力”,[7]这也是具身理论所坚持的立场:认知生成于身体与环境的互动。据此,通过建构能对环境作出适恰应对的行为模块来实现人工智能,使得它具有类似于人类与环境交互的能力,所形成的是环境与行为之间的映射和反馈关系,所模拟的主要是小脑(甚至脊髓)支配运动的功能。
行为主义既是一种哲学认识论,也是认知心理学的一个重要流派,后者早在20世纪初就已产生,但它作为人工智能中的新学派于20世纪末才出现,其标志性口号是“用世界本身代替世界的模型”,[8]其人工物标志是布鲁克斯(Rodney Brooks)研制的新一代“控制论动物”的六足行走机器人:一个模拟昆虫行为的控制系统,目前则以正在开发的自动(无人)驾驶为典型代表。
可以说,以上基于不同算法的人工智能表达和主张了不同的认知观,它不仅论证或支持了某种认识论,也体现了一种反向制约:持何种认识论或认知观,决定着设计出何种范式的人工智能;从而人工智能要获得新的突破,也有待于认识论的整合与突破。同时,不同范式人工智能已经实现和尚未实现的目标,又可以进一步对我们反过来评价既有的认识论理论提供可验证的根据。某种人工智能的长处和不足,在何处成功以及何处陷入困境,可追溯到其认识论立场的长处或不足,从而可以帮助我们反思相关认识论的有效性范围或有限性程度,并为不同认识论之间的互补协同提供启示。在这个意义上,人工智能是认识论展现的新平台或新用武之地,也是认识论理论的校验场,抑或是在人工载体上运行的各种被模拟的人类认知及其能力。因此人工智能可视为人类智能的某种镜像,具有折射人的认知活动某些机制的功能,从而使人的认知间接地成为可以科学研究的“客观”“外在”对象,认识论研究得以在新平台(计算机)上以可以验证的方式展开,因为“计算机被视为一种可以模拟大脑功能的设备,因此也被当作一种方便的工具来测试关于大脑和心理过程的假设。”[9]人工神经网络研究的先驱特伦斯·谢诺夫斯基(Terrence Sejnowski)认为通过研究机器学习这种范式的人工智能,我们可以得到更具说服力的理论来解释大脑中不同的部分是如何联系,了解大脑是如何处理信息的。
从不同人工智能范式模拟了人的不同认知活动这一关联中,我们还可以进一步在人工智能与人的认知之间区分出“同理关系”“同构关系”和“同行关系”等不同的特征,甚至在基于“情感算法”的情感AI成为可能之后,还会形成“同情关系”或“同感关系”。
符号AI只模拟和实现了人的计算、推理一类的认知,可称两者之间的这种关系为“同理”关系:人的认知和机器的信息处理具有类似或同样的理性、推理的属性,都遵循同样的计算原则,表现出类似的程序化过程。这种“同理”的另一个寓意,还在于理性主义和符号AI都将人的认知过程“理想化”为单一的符号或概念的推演过程。这也是迄今最强的一种关联性,是人的相关智能(推理和计算智能)被同类人工智能(符号AI)模拟得最彻底的一个侧面,“图灵测试”和“丘奇—图灵论题”是其理论支柱,它所导向的是认知计算主义,是第一代认知科学的智力基础和思想来源。
联结主义的人工智能范式与人的认知之间主要是“同构”关系:基于深度学习的人工神经网络模型力求与人的神经系统在结构上达到部分的(即同构)仿生意义上的类似,从而类似于通过搭建神经联结来构成一个新的大脑。此时机器的信息处理单元与大脑的神经元相对应,单元之间的连接和权值与神经元的轴突、树突和突触相契合,且两者的构架都按照层级方式得以组织,由此使得其工作机制与人脑的学习功能具有了相似性,从而可以通过技术手段达到机器对人的认知功能的部分模拟。当然,这种“同构”关联性弱于上面的“同理”关系,一是因为人工神经网络作为由硅器组成的电子元件网络,毕竟与人脑由生物神经元组成的网络还具有质的差别;二是因为深度学习算法的工作机制还存在着即使是造就它们的科学家和工程师自己也无法理解的“算法黑箱”:即“用神经网络进行机器学习是有效的,但我们无法详细理解和控制神经网络中的过程”;[10]三是因为机器通过训练习得识别模式或能力的过程与机制跟人习得相应的能力还存在较大的差距,如人的学习就不需要机器学习所需要的那么多的样本;四是因为人的学习是在社会交往中进行的,机器学习则是在彼此没有交互的理想化的“训练”中进行的。当然,随着人工神经网络和人脑之间同构性的增强,可以期待这一视角的关联性将会进一步提高。
在行为主义的范式阶段,相应的人工智能与人应对环境的行为类型的认知相关联,由于所指向的都是行为或行动,可称两者之间的这种关联为“同行”(tóng xíng)关系:智能机器人所执行的算法具有导向和人的智能行为相同的效果,两者此时都可以视为基于“感知—动作”模式的行为控制系统,从而一定意义上两者同为“行动者”(actor)甚至能动自主体(agent)。此外,这种同行水平的关联还具有双关语的意味,即“同行”(tóng xíng)基础上的“同行”(tóng háng)。人和机器人虽不是同类,却由于智能机器可以像人一样行为,因此可以在越来越多的职业和领域中成为同行(tóng háng)或同事,可以进行和人同样的既能知也能行的活动。当然,目前智能机器和人之间的这种“同行”(tóng xíng)关联性还不强,因为机器人的行为与人的行为之间的差距还很大,例如自动驾驶的随机应变、灵活处理新情况的能力还较低,即可主导灵活行为的认知的可算法化有待提高。在这里,背景、身体、互动等纳入了认知观的内容,从而与以具身认知为代表的第二代认知科学相吻合。
此外,人的认知中还有情感、意志、直觉、灵感等要素或方面,存在大量基于本能的“凭感觉行事”的现象,这些方面的能力还未能开发出相应的算法(如情感算法、意志算法……),甚至它们能否被算法化都是存疑的,所以至少迄今还未能与某种算法的类型建立起成熟的关联。乐观的看法认为赋予机器情感只是时间问题。如果相应的算法(如“情感算法”)在将来可以开发出来,则将形成的就是人工智能与人的认知之间的“同情”或“同感”、“同意(志)”“同觉”即“同情共感”(sympathy)的关系,这也正是“终极算法”和“超级人工智能”所追求的目标。
目前“人工情感”(情感计算、情感智能体)、“人工意志”的研究虽然被评价为并不是真正意义上的情感模拟和意志模拟,但从其字面所表达的含义上,至少隐含着建构人与机器之间可以同情共感的期待。
上述的关联也进一步体现了人工智能及其算法具有认识论上的可阐释性。之所以如此,从根本上说,还是在于人工智能及其算法终究是人的认知方法的外推;同时,人工智能算法又不是简单地重复人的认知方法,为了适应机器的特点以及解决新问题的需要,它对既有的认知方法加以了形式化及其他改进甚至创新,这种推进无疑又反过来对理解人的认知活动形成“反哺”或新的启示,使得认识论对于人工智能也产生了内在需求。两相结合,认识论与人工智能之间结成了相互制约、相互需要和相互驱动的内在关系。[11]
二、基于人工智能演进的认知分型
人工智能演进中形成的不同范式所模拟的人的思考方式或思维侧重面各有所不同,由此和认知类型关联起来,并构成一种互相启发的阐释关系。其中,当某种智能模拟成功后又反过来对该类认知形成一种“反向的”阐释力。
人的认知有多种类型,基于不同的视角可以进行不同的分型。算法与人工智能的范式演进,也正在积淀为一种考察认知分型的特殊视角,其根据在于不同的认知类型被机器模拟时采用的是不同类型的算法,基此可以获得关于认知分型的新理解,并呈现出人工智能模拟认知的内在逻辑进程。
从前面所介绍的算法演进的大致过程来看,如果将以后可能出现的情感算法也包括在内,就有一个如下的演进链条:传统算法—深度学习算法—强化学习算法—情感算法,它们对应了人工智能的演进链条:符号主义人工智能—联结主义人工智能—行为主义人工智能—(未来的)情感人工智能。与这些范式相对应的则可以归纳并分型出如下的认知类别:推算认知—学习认知—行为认知—本能认知。
“推算认知”即人所进行的推理和计算活动,是标准的“理性认识”,也是人所从事的“高级形态”的认知活动,甚至是人所具有的与其他动物区别开来(即所谓“人是理性的动物”)的一种认知能力。这一类型的认知也是既有的哲学认识论中被普遍承认的一种认知类型,因此也是一开始就被符号人工智能认定为代表人类认知的本质从而力求加以模拟的对象。作为人工智能及其算法技术发展的起点,推算认知是最早纳入其视野的认知,它是理性主义视野中唯一被推崇的认知类型,基于它开辟了基于人工智能的认知科学中计算主义、功能主义所贯通的信息加工模式:从普遍性的知识出发,根据严格的规则推演出某种特殊的结论,使得输入在经过程序加工后产生输出。这也与亚里士多德的认识分类有部分的交叉,他把灵魂分为无逻各斯的部分和有逻各斯的部分,后者分有逻各斯,遵从数学定理、服从真理。皮亚杰的发生认识论将儿童的认知能力发展的最后阶段归结为“运算”能力的形成,也相当于可以从事我们这里所说的推算类活动。逻辑规则和数学演算既是这类认知的工具,也是其标志。
“学习认知”是人在学习过程中进行的认知活动。人具有学会某种知识、形成某种认知能力的智能,这就是学习认知,它尤其指借助符号表征或语言媒介在信息交流中进行的学习,即“以语言为中介,自觉地、积极主动地掌握社会和个体经验的过程”,[12]可简称为“基于表征的学习认知”。人在学习认知中汲取新知识的过程,就是人脑中已有认知结构对新输入的信息进行同化或顺应的过程,在这个过程中人脑的认知结构被不断地建构。这一学习原理也正是深度学习的工作机理:学习算法中的“调参”(调整神经元联结权重的参数)就相当于学习认知中的调整认知结构,而人脑中认知结构的调整,其生物学底层就是对人脑的神经网络构造的重塑或再构,两者的机理相通:都是通过对网络结构的调整来改变网络的功能,形成新的认知模型,亦即形成知识表征,“学习就是构造或改进对经验的表征,就是通过已有的内在条件对外部实在作出适当的表征。”[13]这也是前面所归结的两者之间同构关系。
基于表征的学习认知是人的一大类认知活动。认知是需要知识的,知识在认知中举足轻重,学习认知就是解决知识的获取问题,而学习算法,就是解决机器如何获得知识的问题。对人来说,学习认知意味着“学而知之”,它不同于后面所要讨论的源于本能的“生而知之”和源于行为的“实践出真知”(直接经验),而是借助语言获得间接经验,它是人在后天所具备的知识和认知能力的重要获取通道。这样的学习认知,使得人具有了指称、定义、理解和构造对象、事实和世界的认知能力,具有了陈述、表达、提问、争辩等交流能力,这些都是在学习中进行认知的方式。基于深度神经网络的人工智能就是对人的这种学习认知的模拟,深度学习就是一种基于对数据进行表征学习的方法,其中的标注学习犹如人通过指称来掌握符号的含义,即通过表征来把握对象,从而是基于表征的学习在人工系统中的再现,它的成功使得我们有充分的必要将学习认知作为人的一种重要的认知类型来看待,并探讨它和其他类型认知活动的关系。例如,如果将学习认知与推算认知加以比较,那么它是比推算认知更基础的认知类型,因为人的推算能力也是通过学习(训练)而形成的。由此还可以看到,学习认知是跨越传统的感性和理性分型的一种涵盖面更大的认知类型,因为学习的初级阶段是在感性识别和分类中所进行的感性经验的积累,而这种经验积累达到一定程度可以形成概念或模式时,就进入理性的阶段,人就可以用这些概念或模式去进行推算类型的认知。学习认知的重要性也反映了人工智能重点的迁移:从以推算为重点,到以知识为重点,再到以学习为重点,因为有效的推理和决策需要充足的知识,而充足的知识仅靠符号AI式的编程输入是不够的,它更需要机器的自我学习能力,深度学习就造就了机器的这种能力。
“行为认知”是人在从事行动、发生行为时贯穿的认知,它主要是人在行动时应对各种周围环境、调节行为指令的认知活动,也是为了在身体与环境的互动中达到预期目的从而需要对行为逻辑加以理解和运用中形成的“实践知识”或“技能知识”,就是基于身体行为的认知或“具身认知”。这是具有行为能力的人都拥有和必须经常从事的一类认知,也是“干中学”(包括皮亚杰所揭明的儿童从游戏中习得知识)所积累和形成的直接经验。在一些秉持具身认知立场的认知科学家看来,认知就是一种具身的行为(cognition as embodied action),心智哲学中的行为主义甚至将行为看作唯一的心智现象。我们虽然不赞同这样的极端化观点,但至少可以将行为认知视为人类认知的一个必不可少的类型。
行为认知具有不同于其他认知的特点和功能,但又与其他类型的认知相互交织。例如,它是人在行为中学习和积累经验而成的,因此它与学习认知部分叠加,或者说它属于广义的学习认知,只是与较狭义的基于表征的学习认知相区别;行为中也有推理和计算的活动,如一个只能负重100斤的人,不会去尝试负重200斤,其中就有对行为的计算和推理。但行为认知也有自己的独特之处,“认知行为理论”就揭示了其中的一些独特特点,如它包含“自动化思考”(automatic thinking),即某些重复性的行为经历长时间的积累后,就形成相对固定的模式,使得该行为的启动和进行似乎不需要经过大脑的有意识思考,而是被既有的模式所不自觉地支配,其实就是关于如何行为的思考与进行行为的过程自动地相结合,是行为中获得的常识经过积淀后形成的潜意识反应,由此在熟悉的场景中完成习惯性的行为目标时就会出现“不假思索地行动”的现象。所以,行为认知既包括自觉支配行为的有意识活动,也包括自发控制行为的那些无意识活动,其功能是调节人与外部世界的互动,使其能够在这种互动中达到人的目的。从认知科学来说,它就是具身—生成理论所主张的认知观,是行动中的身体与环境的互动中生成的认知,这种认知也同时引导身体灵活地应对环境;这种认知也可视为“知行关系”中所说的与行直接融合在一起的知。从知识形态的角度说,行为认知包含的是“如何做”“怎样改变对象”的知识,它与“对象是什么”“为什么对象会如此”之类的知识形成区别。和推算认知通常是从抽象到具体、学习认知通常是从具体到抽象不同,行为认知通常是一种从具体到具体的认知。凡此种种,表明行为认知有独特的特点,并且是人的一个十分重要的认知类型,没有它,就没有属人意义上的行动,就没有改造世界的物质性的活动即实践。
“本能认知”是基于遗传、可凭借本能对外界进行反应的认知活动,也是人与生俱来确保自己能够生存下去的“天赋”认知能力(广义地还包括人的“天性”“本性”等),如“直觉”地理解世界的运作模式,像“儿童在早期就可以利用结构化的表征和算法处理对象、集合、位置以及时空连续性等概念。”[14]本能认知不是自觉的智能行为中所贯穿的认知,其中许多是基于生理反应的心理反应,也是人的七情六欲中所蕴含的认知。以情感为例,喜怒哀乐等许多情感体验和表达是人一出生就具有的认知反映能力,是生理上受到不同刺激后可以在心理层面上映射出来的反应,是人还不具备行为能力和基于表征的学习能力时就已经具有的“本领”,从而是人一开始就内在天生地可以让自己活下去的那些认知能力,也“是将近40亿年的进化才使其成为一种内在的能力”,[15]这种天生内在能力的运行过程和生成机制很难用符号模型来形式化地表征,所以本能认知迄今难以为AI所模拟。
四种认知的不同也表现为它们分别调动的主要能力和行使的主要功能不同:推算认知主要动用逻辑和计算能力,主要行使演绎的功能,主要的任务是表征知识。学习认知主要动用模仿和记忆能力,以及基于语言能力的对新信息的同化和顺应能力(学习能力),主要行使归纳和模拟的功能。行为认知则主要动用身心协调能力,以及与环境互动和进行行为决策的能力,也是知行交互或以肢体行事的能力。本能认知则主要动用由基因决定的原始生存能力,具体如情感能力、直觉能力以及其他主要源于遗传而来的能力,其主要任务是确保认知主体的存在。
四种认知尽管不同,但关联性极强,彼此之间形成从初级到高级的前后相继的阶梯。本能认知是最为基础的认知类型,是一切其他类型认知的“始基”,提供了以后可以形成行为能力、学习能力和推算能力的普适的动作机制、学习机制和计算机制,没有它就没有后面的一切其他认知。它也如同初始条件,可以影响后续各类认知的进行。行为认知是在本能认识基础上衍生的认知类型和认知能力,由它又进一步衍生出基于表征的学习认知和学习能力,所以它既以本能认知为基础,又是学习和推算认知的基础,这也是实践(行)对于认识(知)的基础关系。从行为认知到学习认知,也是从直观认知[16]到符号认知或间接认识的能力提升,使人在不和对象直接交互(行为)时也能认识对象,这是人的认知发展的一次重大飞跃,它使人从只能以实指的方式把握概念到可以用定义(符号界定符号)的方式把握概念,从而使更多无法直观的对象得以认识。基于表征的学习认知对于行为认知和推算认知具有居间性:学习是为了行动,或者说学习包括习得如何行为,如何控制自己的肢体,形成行为方面的默会知识和明言知识;学习也包括推算能力的习得。学习认知可以下沉为感知经验,以便更好地去行动,也可以上升为理性和逻辑能力,以便更好地去进行推算。从总体上四种认知的递进关系是,能推算者必先能学习(通过学习而掌握推算的原理和规则,并掌握熟能生巧的推算技艺),能学习者必先能行动(只有行动中才能取得直接经验,有了直接经验才可能形成间接经验),能行动者必先有生存的本能。
这一前后相继的认知类型演进,可以从皮亚杰所揭示的发生认识论得到直接的印证。皮亚杰在总结多年实验研究的基础上,把儿童的智力(也即认知能力)发展区分为感知运动、前运算、具体运算和形式运算四个阶段,其中感知运动(他又称为“活动”“纯实践性的智力”)与运算是两个基本的阶段,而感知运动阶段相当于我们所分型的本能认知和行为认知,即儿童从基于本能所进行的各种动作中获取认知,某些偶然的动作会使他们认识到客体的某些性质,甚至形成因果观念。皮亚杰的“运算”是指内部化了的观念上的操作,是一种可以进行逻辑推理和符号计算的认知,相当于我们所说的推算认知中对表征的计算。皮亚杰认为感知运动和运算之间有一个过渡阶段,就是在前运算阶段中习得语言、形成符号化(表征)的能力。皮亚杰认为,学会使用符号(即语言)的活动对儿童的智力发展起了重要作用,它使动作得以内化,认知图式得以形成,从而可以凭借象征格式进行表象思维,这就为下一步的抽象思维提供了准备;另外,习得语言又获得了交流和沟通的能力,相当于可以借助语言来进行学习、增长知识、发展认知能力,于是认知就不仅来源于亲身行动(感知运动)的直接经验,而且可更大量地来自学习他人的间接经验。[17]可以说,皮亚杰揭示的儿童智力发展中显现了“本能—动作—语言—运算”的演进环节,本质上吻合于我们关于四种认知分型所构成的链条,只不过他进一步在运算阶段增加了一个离不开具体事物支持的“具体运算”阶段,然后再进入抽象化的“形式运算”阶段,而我们则用更广义的“推算”来加以概括。皮亚杰还认为,每个新阶段的到来都以新的心智能力的形成为标志,使得儿童可以用不断增加的复杂方式去理解世界,[18]从而也映现了我们这里所表述的从本能、行为认知到学习、推算认知的由初级到高级的演进系列。
这一认知分型与“感性”和“理性”的分型之间也相互交叉且部分重叠。如果行为认知多属感性认识,推算认知属于理性认识,学习认知则介于两者之间,既有感性也有理性。于是从行为认知经学习认知再到推算认知,也体现出人的认知由初级阶段的感性到高级阶段的理性的提升过程。
基于人工智能及其算法理论所进行的这种认知分型还可以用来考察人的不同认识方式和路径。对于一个正常的人,这些认知类型所体现的认知能力都为其所需,只不过有的可能是强项,有的可能是弱项,使得现实中不同的人在这些能力中可能有不同的偏重,形成不同的“认知风格”,如有的强于推导,有的擅长学习,有的热衷行动,有的则情感丰富。当然也有人可能不只强于一种认知能力,甚至还有人属于均衡型认知风格或全面拥有各种认知特质,此即通过认知分型呈现出来的人的差异性或丰富多样性,进而也折射为人工智能作为认识手段的形态异质性。
基于人工智能范式区分的这种认知分型对于认知外延的覆盖也具有一定程度的全面性。人工智能力求越来越完全地模拟人的智能,在这一历程中所形成的上述演进,也真实地反映了它对人类智能逐渐趋向更多认知类型的覆盖,所以才有了关于人工智能的越来越多的定义,如认为“人工智能是与人类思考方式相似的计算机程序”,“是会学习的计算机程序”,“是根据对环境的感知,做出合理的行动,并获得最大收益的计算机程序”,[19]如此等等。这些定义也反映了三种范式的人工智能所模拟的分别是人的三种类型的认知,这种“分别模拟”不仅缺乏统一的AI范式,而且还未进入对本能认知的模拟,所以还处于“弱人工智能”的阶段。而到了“强人工智能”阶段,不仅需要实现对三种认知模拟的整合,形成统一的人工智能范式,而且还要能够模拟包括情感认知在内的人的本能认知。如果四类认知能够在人工智能中实现融合与会聚,就可以构成具有完整意义的智能:从情感、意志到感知、认知、推理、学习和执行,这也是所谓“通用人工智能”的真实追求所在。
还需要指出的是,这种认知分型并不是为了在人的认知类型之间划出不可逾越的鸿沟。实际上它们之间是互相渗透和彼此交织的,还是可以过渡和转化的。如基于本能的认识(被火刺激时迅即避开)和从行为中积累的习惯(见火勿触碰)可集合为“常识”,这种常识积累多了,就是一种从经验中学习的认知活动,懂得如何识别和预防火情;而当类似的经验被加以普遍性的总结后,还可以提升为规范性的认知,以此去推导各种需要防火的原则。皮亚杰的发生认识论也主张,儿童智力发展的各阶段既有不变的先后相继顺序,也可以发生一定程度的交叉重叠,并且前阶段的能力被整合到下一阶段,成为新的更复杂的智力。这种交织和过渡也在算法和人工智能的范式中表现出来,例如“人工神经网络的经验知识可以被提炼成为专家系统所需要的规范知识,而人工神经网络的经验知识和专家系统的规范知识又可能被凝聚为常识知识供感知动作系统应用。”[20]
此外,这一认知分型的意义还在于,从中可以发现智能模拟的演进逻辑,并从这种逻辑中获得认识论上的新启示,这就是下面所要讨论的问题。
三、智能模拟的演进逻辑及其意义
(一)人工智能演进中的从易到难过程
人工智能及其算法的演化进程表明,就历史进程来说,AI先是成功地模拟了人的推算认知,然后是学习认知,再然后是行为认知,这一先后序列或演进逻辑的技术合理性在于:所有技术人工物都包含由简单到复杂演进的发明逻辑,人工智能作为一种技术实践,只能从机器最容易模拟的认知类型开始,然后向难以模拟的认知类型过渡。
从“先易后难”的一般过程来看,模拟人的推算认知对于人工智能来说最容易,因为推算认知可以不具身也不具境地理想化表示。由于摆脱了身体和环境介入的各种复杂参数,推算认知最容易形式化和程序化,从而最容易成为一个被单纯化或简约化的认知类型,所以在人工智能的初级阶段首先能够研发的就只能是符号人工智能,所模拟的也只是人是如何理性地思考,其根基也在于它所理解的“和人一样的智能”只是人的推算智能,这种简约化的理解也一度形成“乐观主义”的预测:只要我们愿意,以后就可以造出具有和人完全一样智能的机器。
目前各种范式人工智能的工作原理,都是建立在对符号的计算之上,这也是它所擅长的工作。但不同范式的人工智能在技术性地实现各自的功能时,进入计算所需的环节是不一样的,如符号AI所模拟的推算,在标准化的数据输入后直接就进入计算,所以在技术上最容易实现;人工神经网络所模拟的识别,则增加了对神经网络的形式化建模、对大数据(作为训练样本)的需要,以及还需要对感知到的数据进行编码、压缩、集成、融合的环节,然后才能进行计算,所以较之符号AI的实现难度增大,从而由机器模拟学习认知更难于模拟推算认知,或者说使机器具有学习能力比使机器具有推理能力更难实现。而机器人要模拟人作为agent的行为认知能力,则技术难度进一步提高。拿自动驾驶来说,它面对的不再是一个用符号表示的模型世界,而是千变万化的复杂路况,一方面感知的难度大增,另一方还要由感知的路况生成精准合适的“驾驶动作”,需要增加传感器和执行器的技术环节,更重要的是在这个过程中还需要机器具有灵活应对环境的能力,而人的这种能力来自日常生活中积累的常识、技能知识等,其中有许多是迄今难以算法化而进行计算的,所以它较之仅进行识别的人工神经网络学习系统来说又增加了新的技术环节,于是理想的能像人那样行为的AI(agent)就更难实现。在这个意义上,越能将问题直接纳入计算过程抑或单纯地就是个计算问题的智能模拟就越容易实现,而越需要增加过渡环节才能进入计算过程的智能模拟就在技术实现上越复杂,由此形成的从模拟推算认知到学习认知再到行为认知的演进过程。
当然这仅仅是一种总体性的比较,任何一种范式的人工智能,在向极致发展的过程中,都会变得极为复杂,如符号AI要建成能够满足各种需要的知识库,人工神经网络要建立起真正像人脑一样复杂的神经网络,都比建造出当年布鲁克斯的六足行走机器人要复杂。所以这里所比较的,可以说是不同的人工智能范式模拟或实现出一个正常人的各种认知类型的平均智能的困难程度,也可视为各种AI范式需要达到的成熟水平(例如可以真正成为人所使用的有效工具)之间的比较,[21]此时无疑可以发现,由符号AI所能达到的人的一般人的推算能力最早也相对而言最容易地得到了技术化实现;人工神经网络所模拟人的学习和识别能力次之;而具有agent能力的行为AI则相对来说更困难,它不仅要有推算和学习能力,还要有灵活性和一定程度的自主性,它所模拟的行为认知也不仅是一种智能,而是体能和智能的结合,或体知合一的能力,原则上比模拟单纯的智能更具难度。而模拟人的本能认知从而完全具备人的所有能力的“强人工智能”还遥遥无期:智能机器是否会感到“疼痛”“幸福”,是否会形成“欲望”“爱情”,从而不仅具有“智商”而且具有“情商”等,还只能说是处于概念探讨的阶段。即使本能认知有可能被智能机器所模拟,其难度也远超前述的各个阶段,所以是迄今所能设想的人工智能发展的更为“高端”的形态,相对于几乎已发展到巅峰的符号人工智能来说,它还只是一种遥远的憧憬,因为我们关于牙痛的可怕感受抑或从情侣那里所感受的爱,以及种种因为人拥有身体而形成的基于生理反应的心理反应,要把握清楚其机理并被形式化为机器载体上的一种计算状态,使得机器可以拥有这些源于人的(身体和生理)本能而具备的认知体现能力,某种意义上也是要机器具有人的身体性甚至本性,使其成为“人性化的机器”,无论在概念的解释框架上,还是技术实现的路径上,都还有无数的障碍需要去克服和突破,甚至还可能存在着难以逾越的种种鸿沟。
从适应性的角度看,人工智能及其算法的水平也可以根据对环境和周围情况的适应能力来衡量。只具有推算功能的符号人工智能及其经典算法,所有的前件都是预设好的,它本身就是去语境化去语义化的,其符号是不接地的,所以不具有适应环境的能力。而基于深度学习和强化学习的人工智能,可以在人所设置的环境中适应性地进行识别和决策,所以比起符号人工智能显得更加智能化,也更接近人的日常认识活动。基于行为主义的agent更是将对环境的反应和适应作为其技术的核心,甚至力求向具身的方向提升其与环境互动中的适应性,使得机器认知的从简单到复杂演进,也是从离身性到具身性的演进。如何使机器能够模拟人的具身的行为认知甚至本能认知,是其发展的重要方向。人工智能演进的总体进程,也是一种“自上而下”的发展进路,这个“上”就是抽象的符号和形式化的符号推算,这个“下”,就是符号如何接地、内容如何嵌入环境、载体如何具身、应对如何更加灵活等。
这个序列的延伸,也将是AI从弱到强的发展趋向。弱人工智能只是对人的推算、基于表征的学习和部分行为认知的分别模拟,而强人工智能不仅要将这些局部模拟贯通起来,而且还要实现对人的智能的灵活性、适应性(行为认知中表现)、价值性(情感和本能认知中表现)的模拟,使得包括本能认知在内的人的通用智能得以人工地再现和增强。
(二)人机认知的难易互逆现象
人工智能对认知类型的模拟所形成的上述序列,如果对照人的认知能力形成的过程,一定意义上呈现出先后顺序上的互逆关系,即人工智能首先较为成熟地模拟的是人最后形成的认知(推算)能力,其次是学习能力,再次是行为能力,[22]这种先后互逆的顺序一定程度上隐喻了两者之间难易互逆的性质,这里主要指其技术实现的难度上,后来出现的人工智能更难于先前出现的人工智能,从而也使我们看到:对机器最难实现的,对人来说则是最容易的,对人最难(“最费脑筋”)的对机器来说则是最容易实现的。比如一个人在街上行走并不需要很多智能,他会感到走路比做出一道数学难题容易多了;[23]而对于人工智能来说,要完成像人一样行走则要比完成像人一样计算困难多了。如果说“自上而下”是机器认知由易到难的逻辑顺序,那么人的认知由易到难的提升则表现为正好相反的“自下而上”的逻辑顺序,即从具身、具体的本能认知、行为认知通过学习认知提升到离身、抽象的推算认知。列维-布留尔的原始思维研究和皮亚杰的儿童思维研究共同揭示,人的越原始、越幼小阶段的思维,越是动作化、直观化、具象化的思维,越不具有抽象化、符号化(表征)、形式化的能力;所以无论是人的群体还是个体的认知能力演进,都切合了本文所提出的难易相继链条。
具体说来,对人而言,生而知之的本能认知是人最早也是最容易获得的认知能力。其次是行为认知,像儿童通过游戏等过程中的动作而逐步形成了对世界的初步认识,包括“主客体分化”的观念,可以说人的一生中还未进入利用语言进行学习的阶段之前,就主要是积累这种基于行为的“常识知识”或“直接经验”。再次是习得语言表征能力的过程中也同步学会了通过语言进行学习认知的活动,它可以使人的知识通过间接经验的获取而突飞猛进,人的一生都会不断进行这类认知(所谓“活到老,学到老”),一旦停止了这类认知,人就难以获得新经验、新知识、新能力。推算认知是学习认知在高级阶段的产物,是前面积累的各种认识能力的一种发挥,也是最有可能形成创新和创造的认知形态,所以对人来说也是最复杂最高端的认知。
在这个以人为中心又是基于人工智能及其算法视角所形成的认知分型中,内含这样一个判别标准:越需要更多的学习和训练才能具备和掌握的认知能力就是难度越大的认知能力,从而是越高级的认知类型;反之不学自会或稍学就会的认知能力,就是较容易的认知类型,所对应的就是越初级的认知类型。对机器来说,越容易被设计出来模仿的认知,就是越容易的类型。通过这一考察,可以发现人和机器的认知类型之间,确实呈现出难易互逆的关系,从而蕴含了人工智能演进中的这样一种逻辑关系:对人来说越高级的认知类型,对智能模拟来说越容易实现;对人来说越容易的甚至是生而就会的认知类型,对智能模拟来说则越难实现。这一关系也为“莫拉维克悖论”(Moravec’s paradox)所阐明:要让电脑像成人一样下棋是相对容易的,但要让电脑像一岁的儿童那样感知和行动却是相当困难的,甚至是不可能的,因为下棋所使用的逻辑推理能力只需很少的计算能力,而感知和行动中所包含的无意识的本能、技能和直觉却需要极大的计算能力。其实,下棋属于博弈类游戏,主要使用可以与语境无关的局限于棋盘中的推算能力。人类顶级棋手通常被视为最聪明、拥有超高智商的人,他们从事的对人来说是最复杂最耗智能的脑力活动,而这对于机器智能来说则属于最简单的推算认知模拟,所以在相应的算法开发出来之后,就很容易超过人类的所有棋手;而与此同时,AI中的行为机器人要在行为的灵活性上与人相比,则还有很大的差距,因此确实表现出“人工智能和人做事的难易程度往往恰好相反——对人容易的往往对人工智能难,对人难的(如下围棋)往往对人工智能容易。”[24]所以现实中的人工智能,当它的简单能力远胜于人的复杂能力时,其复杂能力则远逊于人的简单能力。
这一人机认知的难易互逆关系表明,AI的长处恰恰是人的短板,而人的长处则为AI的短板,尤其是人的那些(似乎毫无难度或毫无智能含量)随性而得体的举手投足、顺势而自然的情景反应成为机器智能最难企及的“本领”。换句话说,越是程序化的“照章办事”属性越强的任务对于人工智能来说就越容易,而越是需要随机应变、灵活应对、随意发挥的任务,对于人工智能来说就越困难。此即德雷福斯所说,行为认知或“躯体技能所隐含的知识如何被形式化”对人工智能来说是一个严峻的问题,行为认知中所包含的大量与动作相联系的隐性知识,使得“人脑中所进行的大量活动是无法编成计算机程序的”。[25]而对于人来说,行为认知中存在大量不是“照章办事”就应付得了的情况,需要在新情况新问题出现时创造性地去处理各种“意外”情况。也就是说,一旦人所面对的问题不是模式化问题时,人工智能就难以处理了;而人基于本能、常识、经验和创造力等则可以自由应对和处理这样的问题。诺贝尔奖得主克里克(Francis Crick)也持类似的看法,他认为“计算机按编写的程序执行,因而擅长解决诸如大规模数字计算、严格的逻辑推理以及下棋等某些类型的问题……但是,面对常人能快速、不费气力就能完成的任务,如观察物体并理解其意义,即便是最现代的计算机也显得无能为力。”[26]相较于人的那些轻而易举的认知能力,撇开本能不说(因为智能机器要能模拟人的本能认知还太遥远),[27]仅拿“常识”来说:“要使计算机程序具有人类水平的智能,其重要困难在于,我们尚不知道如何对计算机赋予人类水平的常识。如果没有常识,计算机就无法实现人类水平的智能。一旦计算机程序具有了常识,就可以直接提升计算机性能并改善算法设计,从而使计算机更加智能化。理解常识亦是解决许多哲学问题的关键。”[28]或者说,一项任务需要的背景信息越多,计算机迅速完成它的可能性就越小,因为计算机中没有“常识”方面的信息。[29]与此相关的认识论“框架问题”(即背景信息中哪些该重视哪些该忽视,也是“常识问题”的另一种表述)也是如此,它对人很容易,但对于人工智能则很困难。
可见,越初级的只具有“低端”功能的电脑或人工智能,就只能模拟人的越“高端”、越要经过学习和训练才能掌握的认知类型和能力;而功能越复杂的电脑或人工智能,才能模拟人的越初级、需要越少学习甚至不学自会的认知类型和能力。“我们与其他族群(这里尤指机器——引者注)的巨大差异不是因为我们掌握了二进制或拥有一些基本技能,而是因为我们能通过远比其他族群更为复杂和灵活的方式来使用这些技能”;[30]人和人工智能之间的这种长短互反关系用通俗而简洁的说法就是:对机器越是“高智能”的对人则越是“低智能”的甚至无智能的,从而模拟人的似乎无需什么智能的本能认知对AI来说成为具有最高智能的追求。
若以抽象性为阐释的轴心则可以看到,人的认知演进也是一个从无抽象度的直接认知(本能和行为认知)到借助表征的有一定抽象度的学习认知再到纯抽象的推算认知的抽象度不断演进的链条,它表明越直观化对于人在认知中把握对象就容易,因为所见即所得;越借助表征抽象化则越间接化(所见并非所得而需要赋义释义等认知转换),对于把握对象来说就越复杂越困难;或者说对人来说越要借助抽象能力来进行的学习和推算活动,就越是高层次的信息加工活动。而智能机器起初就是作为符号处理装置设计出来的,所以它依赖表征进行抽象的符号转化或以处理抽象问题为起点,因此越抽象化就越容易形式化、算法化、程序化,从而就越容易在作为逻辑机器的AI系统上基于数字化地操作。无论是认知的四种类型,还是AI的三种范式,都在抽象度或具体度上形成了梯度的差异,因此也形成了难易程度上的不同针对性。
从日常认知与科学认知之间的区别及其在人机之间的难易配置中也能体现这种互逆关系。日常认知直接形成于人的生活实践,最切近于人的本能和行为,因此是人更熟悉从而最易习得的认知;科学认知的理想形态是用精确的符号语言和数学工具建构的数理科学,典型体现在推算类认知中,是现实对象的间接模型,需要人的漫长学习才能把握。从日常认知推向科学认知(自下而上)对于人来说是由易到难的提升,因此对人的认知来说越日常化越初级,越科学化越高级,即“愈下愈易,愈上愈难”。人工智能的演进则与此相反,它的“成长”路径是一个从科学世界向人的生活世界延伸(自上而下)的过程,这个过程就是AI适用范围的不断扩大,使得机器不仅能处理理想化的科学计算和推理问题,而且也能处理某些日常生活问题,如识别对象、进行与环境互动的行为等。所以对于AI的认知模拟来说,越科学化越容易办到,越日常化越难以办到,即“愈上愈易,愈下愈难”。这也是因为以推算为主的科学认知的机制更容易搞清楚,这类认知处于一种理想的、规范的条件中 (如棋子被摆放于棋盘中、符号被置于方程中),它们可以在明言知识的层面上被揭示出来,从而为形式化和机器模拟所容易实现。我们还知道,还原方法是科学思维中的一种普遍方法,对于人工系统的建造来说,越还原就越抽象,处理问题的机制就越简单。符号AI就是对智能活动的一种还原,是将复杂的世界和认知还原为“原子事实”“原子命题”后,在“信息DNA”即0和1两个数字的组合与变换中进行的计算过程,所以最容易成为人工智能的起步之处。而以行为为主的日常认知的机制则难以搞清楚,尤其是如何灵活地应对环境,更是包含了许多难言的经验和需要随机应变的由偶然性触发的灵感。这就是德雷福斯所说的:“没有人知道如何把作为感知和躯体化技能特征的全局性组织及其不确定性编成程序”;[31]或者说,自然智能中的简单性恰恰是人工智能中的复杂性所在。
德雷福斯也对这种难易互逆有特定的表述,他认为可区分出四类智能活动,其中前两类适合数字计算机模拟,第三类只是部分可程序化,第四类全部不可驾驭。第一类包括意义同上下文环境及有关活动无关的、各种形式的初级联想行为(如各种形式的条件反射行为、语言翻译中的机器辞典,问题求解中纯试错搜索程序和模式识别中的根据固定模板匹配模式);第二类为数学思维,它由概念世界而不是感知世界构成,问题可完全形式化,并且完全可以计算,此为“简单—形式化领域”,在其中形式语言取代了自然语言,人工智能在这一领域都是可能的;第三类为“复杂—形式化系统”,其中包括原则上可形式化但实际上无法驾驭的行为;第四类为非形式化行为领域,包括有规律的但无规则支配的我们人类世界中的所有日常活动,如我们对自然语言中歧义的识别,规则不确定的游戏(猜谜),这一层次上的技巧,通常是以概括事例的方法教授的,然后被直觉地遵从,无需求助规则。[32]
总之,如果将人的认知能力发展和认知类型前后相继形成与提升的现实过程,与人工智能演进的客观进程加以同框的逻辑对比,则人机之间难易互逆的关系就成为明显存在的现象或事实。造成这一难易互逆关系的原因,无疑在于人和机器各自的物理构造和运作机制上的差异,这种差异就是前面曾提到的“具身性”:在人那里越具身(与身体关联越紧密的认知)越容易,在机器那里则越具身越困难。由于人是身心统一体,人的认知与自己的身体以及身体与环境的互动密切相关,人本身就是“具体”而非“抽象”地成长起来的,所以越直接与对象或环境进行具身互动对于人来说就越自如,就越是人所原初具有的认知能力;而那些越脱离身体和环境的认知活动,则越是需要经过学习、训练后才能掌握的认知能力,从而对人越具有复杂性和困难性。由于机器没有人的身体,也不是在类似于人的生活环境中成长起来的,所以要在其中融入环境信息就是一种额外的重负,要使其产生出类似人的“切身”认知,显然是勉为其难的要求;也正是因为这一点,所以那些与身体关联相对不紧密的认知,无疑就是AI所“擅长”的。两相对比,人的认知从低级到高级的推进,是一个摆脱具体、得意忘形或“形式摆脱内容纠缠”的过程;而机器认知由简单到复杂的推进,则是一个“符号落地”、概念走向具体、使形式与内容结合、从纯粹表征—计算走向具象化和情景化的过程。
(三)延展意义
把握人机间认知的难易互逆这一演进逻辑还具有如下的意义:第一,根据这一逻辑,可以合理地评价各代人工智能及其算法的恰当地位和功能,并对人工智能发展的走向形成一种有根据的预判。人工智能迄今的发展所显示出来的趋向,预示其自身存在着“循序渐进”的进化序列,这就是人工智能越往后面的阶段演进,所模拟的人的智能类型就越“初级”,这或许可以作为人工智能从业者进行预测和决策的概念基础,从而根据自身的实力和目标做出有所为与有所不为的选择。模拟本能认知的人工智能假如能够实现也需要十分漫长的努力,一定程度上它寄希望于终极算法和超级人工智能的开发,由此也提出了“终极算法是否可能”的问题:当包括本能认知在内的一切认知皆可算法化从而皆可人工地模拟后,也意味着人工认知中“终极算法”的获得,犹如人的认识中“绝对真理”之达成一样。从辩证的真理观来看,这只能是原则上可以追求并无限接近但不可能在某一个具体时段完全穷尽的过程。这也正是“终极算法”的魅力所在:算法化的范围可以无限扩展,但不会在哪一天可以终结这种扩展,使得我们用植入了终极算法的机器解决了一切问题,而人从此无所事事。换句话说,人机在认知上难易互逆的关系也表明了认知研究的不可穷尽性:总存在我们依靠科学手段和技术工具所不能完全把握的认知奥秘和不能完全模拟的认知活动,所以它才是需要无穷探索的研究对象。
第二,这一逻辑使得我们需要正视人的智能和人工智能之间的“各有长短”,不可能也无必要使两种智能完全趋同。由于人工智能不仅要模仿人的智能,还要延伸和扩展人的智能,所以必然既有弱于人的方面(模仿不到位),也有强于人的地方(延展后的智能);它虽然不能解决人脑所能解决的一切问题,但在这种延展中也具有了新的能力:能够解决人脑所不能解决的一些问题,这就需要在有差异的基础上进行人机之间的合理分工。这种各有所长的关系可以使我们更清醒地看到,即使是自然进化而来的人的智能,也不是完美的智能,当然人工智能就更不具备完美性了。尽管不完美,通过相互之间的比较又凸显了各自的优越性,所以人工智能虽然对人的某些认知难以模拟甚至无法模拟,但我们也不能因此而贬低人工智能的价值,因为它已经在若干方面远超于人,如机器的记忆、计算和推理能力已超过人,机器智能进行人脸识别的正确率也高于人,机器智能借助知识库对复杂事物进行预测与判断(如基于医学影像精准识别基础上的医学诊断)的准确度也正在全面超过人。在这个意义上,人也是智能上有缺陷的主体,所以才需要并发明了人工智能来弥补这样的缺陷。因此我们无需要求人工智能只以人的(有缺陷的)智能为终极的模拟对象,不必在人工智能的研究中为模仿人类的错误和缺陷而殚精竭虑,因为即使是有些带有“智力”性质的工作,也“不必按照人的方式进行,也不必具有人的灵活应变性”。[33]同时,也不能因为人工智能在推算和识别上的高效率与高精确度就训练人向机器看齐,即用机器的标准来要求人,这显然隐含着把人变成机器的危险。神经哲学家丘奇兰德(Patricia Churchland)对两者之间这种反差描述道:“在许多事情上,计算机做起来比我们快得多,比如计算。但无论如何,至少到目前为止,计算机却做不出人脑需要缓慢进行的那些深刻的事情。它们提不出有关物质的本性或者DNA的起源的新假设。”[34]基于人机的能力迄今所具有的这种难易互逆关系,更有意义的追求是在两者之间建立一种互补的协同,将人的“弱项”尤其是低效而沉重地充当工具时的任务交由可高效完成的智能机器去承担,如将那些只求效率和精准的认知工作,那些需要有超大数据量和计算量且目标单一明确、数据优质、信息完全的任务,尽可能多地交由人工智能去做;而将基于人的本性合乎人的价值和意义(如能够体验生活、进行创造与获得幸福感)的活动加以保留或更多地开发于人,这对人来说也是一种“卸担”和身心的进一步解放,由此使“人之为人”“机之为机”“各显其长”“各得其所”的人机协同得以形成。
第三,走向算法融合。在目前已取得实际成效的三类认知的智能模拟中,基本上是三种范式各行其是,所模拟的角度也互不协调,分别是功能模拟(物理符号系统)、结构模拟(人工神经网络)和行为模拟(感知—动作系统),由此造就了智能之人工实现的“分而治之”的格局。[35]人工智能本身的发展就是一个新的范式不断克服先前范式缺陷的过程,但新的范式同时也形成了新的局限,所以范式间的融合就成为人工智能进一步发展或突破的根本要求。这种融合的可能性,其根基在于它们所模拟的认知类型之间的可融合性。比如在人的现实认知中,演绎与归纳之间是可以互补的,感性和理性之间是可以互相转化的,经验知识和规范知识之间是可以互相过渡的,所以人工智能中的经典算法和深度学习也是可以相融合的。如AlphaGo的设计者们就打破了符号主义和联结主义的藩篱:“本来,博弈是功能主义人工智能(专家系统)的分支,神经网络是结构主义人工智能的成果,但是他们却把结构主义人工智能(神经网络)的成果利用到功能主义人工智能分支来了,即一方面利用功能主义的博弈搜索技术去发现‘可能的下步走法’;另一方面又用结构主义深层神经网络的深度学习方法(取代原来的‘启发式估价函数’)来估算‘这些可能走法之中何者胜算更大’。这一结合,就使AlphaGo的棋力得到极大提升。”[36]也就是说,当AlphaGo将分别已经存在并发展了数十年的算法(包括线性模型、深度学习、强化学习、蒙特卡洛搜索等算法)等加以融合后,形成了强大的组合优化,由此在围棋水平上实现了对人类的成功超越。这也折射了人的认识能力提高的一种普遍路径:认识的各种类型在融会贯通的过程中往往可以生成更高的认知能力,就类似于不同的物种在杂交后有可能形成品性更优良的物种一样。目前人工智能“分而治之”所面临的各自困境,正是它们排他性地秉持单一的认识论理念和方法所致;而要实现AI的纲领融合或算法融合,在基底上还是要寻求一场“认识论革命”,即走向一种可以整合理性主义、经验主义和具身认知的新的认识论。认识论和人工智能的内在关联在此也愈加紧密。
这种融合如果再回归到对智能或认知本质的理解上,也会带给我们新的启示。目前三种范式的人工智能对认知的本质秉持不同的理解,分别视智能“由计算—表征来定义”“由经验来定义”和“由行动来定义”,这些可以说都是智能或认知的侧面。人工智能不同流派和算法的融合,也反映了人工智能对人的认知本质的更全面、更完整的把握以及在此基础上的模拟;如果要追求“通用人工智能”,也只能在此基础上去追求。这里同样也展现了人工智能与认识论的互释互惠关系,即:我们将智能或认知的本质在认识论上理解为什么,就会在技术上去追求将人工智能做成什么;而我们实现了什么样的人工智能,则印证了我们对认知本质的相关理解之合理性,所以在一定意义上我们甚至可以说:人工智能就是认识论。
注释:
[1]John McCarthy, "What Has AI in Common with Philosophy?" in Proceedings of the 14th International JointConference on AI, Montreal, Canada, August, 1995, quoted in Viola Schiaffonati, "A Framework for the Foundation of the Philosophy of ArtificialIntelligence," Mindsand Machines, vol.13,no.4,2003,pp.537-552.
[2]约翰·麦卡锡:《人工智能之哲学与哲学之人工智能》,道·加比等主编:《爱思维尔科学哲学手册·信息哲学》,殷杰等,译,北京:北京师范大学出版社2015年版,第874-875页。麦卡锡还直接指出:“AI的认识论部分研究的是有关世界的哪些种类事实可提供给在给定的观察条件下的观察者,这些事实怎样能够表达在计算机的存储器中以及有哪些规则可允许从这些事实中得出合理的结论来。”转引自休伯特·德雷福斯:《计算机不能做什么》,宁春岩译,北京:三联书店1986年版,第70页。
[3]尼克:《人工智能简史》,北京:人民邮电出版社2017年版,第226页。
[4]休伯特·德雷福斯:《计算机不能做什么》,第25页。
[5]斯图尔特·罗素(S.Russell)与彼得·诺维格(P.Norvig)在2009年所著的影响广泛的人工智能教材中,从内在和外在表征提出了人工智能的四种不同定义:像人类一样思考的系统;像人类一样行动的系统;理性思考的系统;理性行动的系统。参见S. Russell and P. Norvig, Artificial Intelligence: A Modern Approach, 3rd ed.,Es s ex, England: Pearson, 2009.
[6]Rodney Brooks, Cambrian Intelligence: The Early History of the New AI, Cambridge: The MIT Press,1999,pp.79,81.
[7]本·戈策尔:《创建互联网智能》,戴潘译,上海:上海译文出版社2018年版,第29页。
[8]Rodney Brooks,"Intelligence Without Representation,"Artificial Intelligence, vol.4 7,no.3,1991:139-159.
[9]Mariusz Flasiński, Introduction to Artificial Intelligence, Cham: Springer International Publishing Switzerland,2016:236.
[10]克劳斯·迈因策尔等:《人工智能与机器学习:算法基础和哲学观点》,《上海师范大学学报》2018年第3期。
[11]甚至从学科起源上也可以看到这种关系:人工智能曾被划为认知科学中的一个分支领域,而认知科学和认识论在自然主义背景下甚至具有同一性,由此也看到人工智能和认识论之间独特而又内在的关系。
[12]潘菽:《教育心理学》,北京:人民教育出版社1983年版,第49页。
[13]高新民、付东鹏:《意向性与人工智能》,北京:中国社会科学出版社2014年版,第457页。
[14]唐宁等:《从数据到表征:人类认知对人工智能的启发》,《应用心理学》2018年第1期。
[15]约翰·麦卡锡:《人工智能之哲学与哲学之人工智能》,道·加比等主编:《爱思维尔科学哲学手册·信息哲学》,第872-873页。
[16]也称“直接认识”,“直观”的字面意思是直接看到,其实也包括直接听到、嗅到、尝到、摸到等,总之就是直接感知到对象。
[17]由此可见基于表征、语言的学习,确实是不同于其他类型的认知,它是一种通过交流的知识积累或信息增值的过程,其速度、效果都是其他类型的认知不可替代的,甚至没有这种认知,人的正常的认知能力就无法形成。如儿童智力的形成,除了从自己的动作(游戏)中切身地形成外,就主要是从年长者的话语的教诲中获得的,后者所起的作用甚至比前者更大,所谓儿童智力发展的人类环境也主要是这种语言所能提供的学习环境,“狼孩”“豹孩”正因为没有这样的语言环境(但有动作环境),所以形不成正常人的智力。可见学习认知无论如何都是一种重要的认知类型。
[18]皮亚杰:《发生认识论原理》,王宪钿等译,北京:商务印书馆1985年版,第21-57页。
[19]李开复、王咏刚:《人工智能》,北京:文化发展出版社版2017年,第28-35页。
[20]钟义信:《机制主义人工智能理论——一种通用的人工智能理论》,《智能系统学报》2018年第1期。
[21]例如,最早的人工神经网络研究早于符号AI出现,但真正具有学习功能的多层神经网络则后于符号AI兴起,所以比较的对象是,可以使用深度学习算法从而能为人从事识别任务的多层神经网络AI。同样,能模仿人简单动作的机器人早就出现,但能模仿人具有灵活性行为的智能机器人才能视为行为认知的真正实现,也才能进行像人那样的驾驶活动,所以这里纳入比较的对象也是能够充当agent的智能机器人而不是只能完成固定机械动作的工业机器人。
[22]这里的行为能力不是简单的由固定程序驱动而可以做出动作的能力,而是指可以灵活应对环境的能充当agent的行为能力,即在不可预测的环境中做出适当行为的能力,因此机械地模拟动作和智能地模拟行为之间具有重大的差别。
[23]发生认识论揭明了在感知动作阶段,儿童不能进行抽象运算思维,也表明推算认知对于人来说是难于行为认知的。
[24]陈小平:《人工智能的历史进步:目标、定位和思维演化》,《开放时代》2018年第6期。
[25]休伯特·德雷福斯:《计算机不能做什么》,第28,61页。
[26]克里克:《惊人的假说》,汪云九译,长沙:湖南科技出版社2007年版,第211-212页。
[27]如情感认知中就包含更多的AI难以理解的东西,比如,“由于计算机不能理解孤独,因为它不可能把‘请您今晚同我进餐好吗?’这句话完整地理解为含有‘一个腼腆的青年男子渴求爱’的意思。”参见休伯特·德雷福斯:《计算机不能做什么》,第72页。
[28]约翰·麦卡锡:《人工智能之哲学与哲学之人工智能》,道·加比等主编:《爱思维尔科学哲学手册·信息哲学》,第866页。
[29]佩德罗·多明戈斯:《终极算法》,黄芳萍译,北京:中信出版集团2017年版,第354页。
[30]卢西亚诺·弗洛里迪:《第四次革命:人工智能如何重塑人类现实》,王文革译,杭州:浙江人民出版社2018年版,第33页。
[31]休伯特·德雷福斯:《计算机不能做什么》,第303页。
[32]休伯特·德雷福斯:《计算机不能做什么》,第299-301页。
[33]休伯特·德雷福斯:《计算机不能做什么》,第96页。
[34]帕特里夏·丘奇兰德:《触碰神经我即我脑》,李恒熙译,北京:机械工业出版社2015年,第5页。
[35][36]钟义信:《机制主义人工智能理论———一种通用的人工智能理论》,《智能系统学报》2018年第1期。
初审:赖冬梅
复审:孙振东
终审:蒋立松