来源:《远程教育杂志》2018年第4期 作者:袁立平 陈川南
摘 要:宽度学习是以随机向量函数链接神经网络为载体,并通过神经节点的增量以实现所设计网络横向扩展的一种随机向量单层神经网络学习系统。宽度学习神经网络系统不仅保留了深度学习的优势,而且弥补了深度学习的缺陷,能更高效地进行教育大数据的挖掘。基于宽度学习内部算法和系统结构,宽度学习在教育应用中主要可以通过分类、聚类、回归、时序预测等挖掘技术手段作用于教育大数据。未来,宽度学习可以在准确预测学生学业成绩、给予学生演示精准评价、提供小组个性学习支持、智能辅助教师进行教学和促进远程教学交互发展等方面发挥其优势,并助力于教育事业现代化和智能化的发展。
关键词:宽度学习;人工智能;机器学习;教育大数据;教育数据挖掘;学习分析
一、引言
纵观人类历史的发展,新技术的兴起往往会带来新的变革机遇。近年来,人工智能(Artificial Intelligence)浪潮持续影响全球各个方面,对教育领域的影响也日益显现。人工智能的教育应用(The Application of Artificial Intelligence to Education,以下简称AAIE)逐渐成为学术研究的热点之一。AAIE是将人工智能和学习科学(包括教育学、心理学、社会学等)相结合的跨领域研究,其核心的科学目标是将教育、心理和社会学等隐性知识,转变为计算机可识别和处理的形式,以推动智慧教育等的发展。[1]
2017年7月,国务院印发了《新一代人工智能发展规划》(以下简称《规划》)。《规划》指出,要利用人工智能助力教育发展,推动教学改革,构建新型教育体系,这标志着人工智能技术助力教育已上升到国家战略层面。[2]以人工智能技术驱动教育信息化的发展,以智能教育促进教育的现代化,已成为当前推动教育教学发展的重要途径。教育领域研究者应密切关注人工智能关键技术的发展,并以此为基础,切实推进人工智能在教育领域的研究与发展。[3]
2017年以来,宽度学习(Broad Learning System,BLS)在各项测试中被证明是一种有效的学习系统。
它的出现直接影响了教育人工智能的发展。目前,国内还鲜有相关的研究文献。为此,本文试图通过对宽度学习的内涵发展、优势特性以及应用前景作初步探析,为研究者和教育者进一步开展人工智能在教育领域中的合理应用,提供一定的理论依据和参考。
二、人工智能视域中的学习及其类型
AAIE的相关系统,主要以教育数据挖掘(Educational Data Mining,EDM)、深度学习等技术为基础,利用学习分析(Learning Analytics)等相关技术来跟踪学生行为数据,预测其学习表现以充分支持个性化学习。影响其效率的关键技术,正是当下热门的机器学习(Machine Learning,ML)。
《机器学习》一书的作者汤姆·米歇尔(TomMitchell)认为,机器学习的本质乃是通过经验,不断地提升自身的系统性能。[4]也就是说,机器学习可以从数据中进行学习,并通过利用数据而不断完善自身系统,优化程序性能。根据所需要处理的数据是否存在作为标注,机器学习可以分为有监督学习(Supervised Learning)和无监督学习(Unsupervised Learning)。图1就是一个典型的机器学习任务简化工作流程图,它同时展示了两类机器学习的处理过程。[5](图表略)
总体而言,机器学习就是通过各种类型的机器学习算法,使得机器能从大量输人的数据样本中自动学习数据的隐性结构和存在规律,从而能对新输人的数据进行智能识别,对未来做出预测。
根据现有的研究文献,机器学习伴随着人工智能的研究不断发展,大致经过了三个阶段,分别是浅层学习(Shallow Learning)、深度学习(Deep Learning)和宽度学习(Broad Learning)。
(一)浅层学习
早在20世纪80年代,人工神经网络BP反向传播算法的发明(Back Propagation,BP),使得人工神经网络模型可以从大量训练样本中学习规律,并对未知事件做预测成为可能。与过去基于人工规则的系统相比,这种机器学习方法显示出诸多优越性,因此,在机器学习领域里影响深远。但由于对多隐层神经网络的训练尤其困难,该阶段的学习网络通常只有一层隐含层,被称为浅层学习网络,应用范围十分有限。而深度学习的出现,弥补了以前算法的弱点,对于机器学习领域具有颠覆性的意义。
(二)深度学习
这里讲的深度学习①是相对于前面的浅层学习而言的,实际上源于神经网络,它含有多层隐含层,是人工神经网络(Artificial Neural Network,ANN)算法的衍生。其原理是通过建立分层模型结构,从底层数据提取特征并逐层将数据传递给高层,以便对输人数据进行分级表达。它通过模拟人脑的学习神经网络来处理类似语音、图像和文本等数据,进行特征提取并解释输人数据。
深度学习主要包含输人层、隐藏层和输出层三个部分。输人层各神经元面向输人信号,输人信号到隐藏层各神经元之间都有连接,隐藏层中每个神经元向上又与输出层各神经元相连。一个人工神经网络中的输人以及各层神经元的个数不固定,隐藏层也可以有多层,这些都根据所需要解决问题的复杂性而定。[6]
与传统学习结构相比,深度学习更加强调模型结构的深度,通常含有较多隐含层。同时,特征学习在深度学习中尤其重要。深度学习通过特征的逐层变换,高效地提取数据中的本质特征,从而完成最后的预测和识别,它是一种高效率的特征提取方法,它对于语音识别、图像识别、自然语言处理等领域均有重要的影响。因此,运用深度学习对数据进行挖掘,是机器学习算法适应大数据挖掘的重要产物。
(三)宽度学习
但是,即便深度学习网络功能作用十分强大,深度学习网络结构与人脑相比,对于问题的处理仍有巨大差距。这一方面是由于现有网络均结构复杂且涉及大量的超参数,大多数网络都被极度耗时的训练过程所困扰;另一方面,为了获得更高的精准度,深度模型需要持续增加自身网络层数或调整参数个数。为此,人们开始研究一些以提高训练速度为目的的深度网络以及相应的结合方法等。
2017年,澳门大学陈俊龙教授在机器学习领域提出了宽度学习的概念,成功地为深度学习网络提供了一种替代方法,这是继深度学习以后,机器学习技术发展的一个新阶段。
所谓宽度学习,它是以随机向量函数链接神经网络(Random Vector Functional Link Neural Network,RVFLNN)为载体,并通过神经节点的增量,来实现所设计网络横向扩展的一种随机向量单层神经网络学习系统。[7]与原始随机向量函数链接神经网络不同,该网络用一组一般映射特征,取代RVFL网络中输人和输出之间的直接连接;同时,通过伪逆可快速地更新输出层的权重。因此,上述结构非常适合现代大数据时代的应用。[8]
随之的一些实验结果也证明,宽度学习系统便于扩展到其他神经网络,是机器学习领域一个相当灵活高效的模型。与现有机器学习中的深度学习网络结构相比,我们认为,它具有两个基本的核心要素:第一,宽度学习系统是基于RVFL神经网络而设计的一种网络学习模式;[9]第二,该系统充分利用了陈俊龙在1999年提出的一种快速增量学习算法,解决了数据量和数据维度的增长所带来的问题。[10]
可见,宽度学习的优势在于结构简单、速度快,具有高效的学习性能。为了适应大数据的需求,陈俊龙在其随后发表的论文中构建了一种基于K-means聚类算法特征,提取的改良型宽度学习系统。[11]该系统将IK-means聚类算法作为无监督特征提取的工具,所提出的改良模型汲取了双方的优点,包括K-means聚类可以为无监督特征表示,提供一种强大有效的方法。而宽度学习又是分析目标大数据集的一个较成功的网络,它在各种应用中具有灵活性和较好的潜在价值。
三、宽度学习通过数据挖掘作用于教育领域
多年来,网络学习资源的增加、互联网教育的兴起以及学生信息数据库的建立等,为促进教育发展提供了大量、巨型的资料库数据,这在促进教育信息化发展的同时,也导致了现今教育界面临的最大挑战,即教育数据呈指数型增长和如何对这些数据进行高效的分析与利用问题。早在2012年,美国教育部发布的《通过教育数据挖掘和学习分析促进教与学》报告中指出:大数据时代应推进对教育大数据的有效利用,而在教育中应用大数据的两个领域分别是教育数据挖掘(Educational Data Mining,EDM)和学习分析(Learning Analytics,LA)。[12]
近年来,随着对大数据研究的不断深人,与教育数据挖掘相关的领域也在不断拓展。我们可以从与教育数据挖掘相关学科领域的宏观结构图(见图2)(图表略),看到,目前,教育数据挖掘的理论和方法支持,主要包括数据挖掘、机器学习和数学统计。[13]
我们认为,教育数据挖掘旨在开发一些处理教育环境中出现的高维度数据方法和技术,以更好地理解或解决在这些环境中出现的教育问题。而学习分析依赖于教育情境中产生的大数据,与教育数据挖掘不同的是,它主要侧重于从数据中提取知识以直接促进学习过程。尽管两者存在差异性,但据有关教育数据挖掘和学习分析中使用的主要分析技术的调查表明:教育数据挖掘和学习分析这两大教育数据所应用的领域,均以机器学习和数据挖掘技术为基础,以研究促进教学和学习过程的发展。[14]
(一)人工神经网络的教育适用性
2010年,罗梅罗(Romero)和文图拉(Ventura)指出,人工神经网络(Artificial Neural Network,ANN)是教育数据挖掘研究中最常用的技术。[15]传统人工神经网络技术在教育数据挖掘和学习分析领域中,主要被应用于聚类、分类、回归、时间序列预测和可视化等任务。尽管人工神经网络在数据挖掘中的应用非常广泛,但部分数据挖掘社区对根据这种模式开发的模型,是否存在可解释性,而怀有疑义。
随着算法、网络结构和计算机硬件方面的快速发展,使得对数百万示例数据集上包含数十隐含层、数百万个连接点的网络训练成为可能。由此,产生了一种新型的ANN模式,也就是深度学习。近年来,深度学习已经成功地解决了人工智能发展中长期存在的一系列问题,如:语音识别、文本翻译、文本序列生成、图像分类以及图像文本生成,其效果完全优于传统非深度的ANN人工神经网络。
2017年,比萨奇·科埃略(Bisacchi Coelho)的论文Deep Learning Applied to Learning Analytics and Educational Data Mining: A Systematic Literature Review,系统地用文献综述的方式,回顾了深度学习技术在教育数据挖掘和学习分析领域的典型应用,呈现了深度学习应用教育数据挖掘和学习分析的六个典型应用案例并提出:与传统人工神经网络相比较,深度神经网络具有更加强大的功能,更加适用于教育数据的挖掘和学习分析。[16]
(二)宽度学习在数据挖掘中的优势特性
大量机器学习中的数据挖掘技术,已经被成功应用于教育领域。这些数据挖掘技术,可以分为描述性和预测性两大类(如图3所示),(图表略)。[17]描述性的数据挖掘任务是对目标数据集中数据的属性进行特征描述,主要包括聚类(Clustering)、关联(Association)和概括(Summarization);预测性的挖掘任务是对当前数据进行归纳以进行预测,主要有分类(Classification)、回归(Regression)和时序预测(Time-Series Prediction)。而宽度学习基于其内部算法和系统结构,它在教育应用中主要可以通过分类、回归、聚类和时序预测)等挖掘技术手段,作用于教育大数据。
在众多数据挖掘技术之间,预测和聚类相对应用普遍。预测的目的是从数据的其他方面(预测变量)的某些组合,来推断数据的目标属性或单个方面(被预测变量)。预测方法的主要类型是分类(当预测变量是分类值)和回归(当预测变量是连续值)。在EDM中,预测已被用于预测学生表现和检测学生行为。[18]宽度学习的优势体现在:
1.分类更准确
分类(Classification)是机器学习的主要任务之一,主要用于解决实例数据的分类问题,实现对目标的预测。分类是根据数据不同的本质量化特征和先前标记过的数据训练集信息,将新的数据分置成组的过程。[19]陈俊龙提出的宽度学习系统展示了高效的学习性能。近年来,快速增量学习算法在广泛的扩展中得到发展,不需要对整个模型再培训。与深层结构的系统相比,这种新型系统在分类上非常有竞争力。[20]他将宽度学习算法和增量学习算法应用于常用的神经网络——径向基函数神经网络(RBF)和分层极限学习机(H-ELM)。
实际上,与ELM的原始版本不同,H-ELM的结构可以看作是无监督多层特征表示和监督特征分类的组合,以获得所需网络的最终结果。MINST数据集实验结果证明,宽度学习系统易于扩展到其他神经网络,可以实现对数据更高的分类精确度。此外,宽度学习系统在N0RB数据库上的分类结果表现和SDA等其他模型相比较,显示宽度学习训练时间只需要21.2546秒,同时,能保证高达89.27%的精确度。可见,与其他深度学习算法的结果相比,宽度学习算法是既快又准。
2.回归更精确
回归(Regression)是预测性数据挖掘模型之一,目的是分析数据属性值(Attribute Values)内的依赖关系,这是回归和分类的主要区别。回归主要应用于数值型随机连续变量,通过建立方程来发现两个或多个变量间的关系,是另一种预测方法。在教育中一般应用于测试成绩等连续变化。
陈俊龙团队在对数据维度为1万-3万的20万数据测试中发现,在3-50分钟之内,宽度学习都能够很快地找到神经网络的权重。在UCI数据上回归精度比较分析发现,宽度学习系统和模糊宽度学习系统都表现出较高的精度,具体比较结果参见表1。[21](图表略)
3.聚类更有效
聚类(Clustering)是最重要的描述性数据挖掘模型之一,通常用于发现数据集中事先未知的常见分类。聚类的目标是识别在某些方面具有相似特征的对象并将他们分组,通常使用某种距离度量来确定相似对象的类型。一旦确定了一组集群,就可以通过确定最近的集群来对新目标对象进行分类。通过找到高质量的聚类,以便聚类内相似性高,并且聚类间相似度较低。聚类对探索数据,异常检测,寻找自然分组等非常有用。在教育数据挖掘应用中,聚类可用于对相似课程材料进行分组或根据学习和交互模式将学生分组。[22]
陈俊龙在其所发表的一篇文章中,对所提出涉及无监督的特征提取的模型进行测试后,将CIFAR-10数据及测试结果与原始BLS系统相比较。对于CIFAR-10数据集,通过K-means聚类算法对所提取的特征进行可视化,如图4所示。(图表略)
实验结果(见表2)(图表略),也证明了基于K-means聚类算法的宽度学习系统,在CIFAR-10测试的精确度。[23]
4.时序预测更高效
时序预测(Time-Series Prediction)是根据时间序列,计算和分析历史统计数据,以求获得数据的变化规律,对未来的变化趋势进行预测分析,从而在相关领域对未来可能出现的情况进行预先调整,是现实生活中的常见方法之一。
宽度学习中的快速增量学习算法,可用于更新系统运行时的权重。该模型在多个时间序列数据,包括红外线激光数据集,混沌时间序列,月度面粉价格数据集和非线性系统识别问题上进行测试。测试结果不但验证了所提出方法的有效性,而且还提供了一种相对更快的预测时间序列的方法。相关实验结果图表详见陈俊龙教授的论文,这里不再赘述。[24]
总之,快速增量学习算法主要有两个明显特点:第一,所提出的功能链网络学习算法既快速又高效。快速学习使试验误差方法能够微调一些难以确定的参数。如果将额外的增强节点添加到系统中,而训练算法可实时更新权重矩阵。那么,将新的观测结果添加到系统中,权重也可以很容易地更新。这种列优先(附加神经元)和行优先(附加观测)更新方案,对实时进程(Real-time Process)非常有吸引力。第二,容易更新的权重,大大节省了重新训练网络的时间和资源。这尤其适用于大数据集。
四、宽度学习在教育技术领域的应用前景及案例探究
基于上述对宽度学习作用于教育大数据的主要技术的探究,我们发现:宽度学习较深度学习在数据识别上分类更准确、回归更精确、聚类更有效和时序预测更高效。结合深度学习在教育领域应用的适切性,宽度学习有望在教育大数据应用领域之教育数据挖掘和学习分析上,发挥重要作用。
具体来说,我们期待宽度学习可在准确预测学生学业成绩、给予学生演示精准评价、提供小组个性学习支持、智能辅助教师进行教学和促进远程教育教学交互等方面,发挥其既快又准的优势,为促进教育信息化和智能化发展服务。我们根据宽度学习四个方面的优势特性,以及发挥维度所确定的宽度学习应用前景,建立了如下框架(如图5)。(图表略)
(一)准确预测学生学业成绩
对学生最终成绩的早期预测,是学习分析领域的一项重要任务。2017年,大久保(Okubo)及其同事在一次大学课程中,为学生的最终成绩制定了预测指标。预测是根据学生在每周进行的几项学习活动中得到的评分来进行的。研究结果表明,当学生课程学习完成40%时,该模型预测准确性达90%;而当学生课程学习完成2/3时,对于最终成绩的预测准确率达到了100%。与多元回归分析相比,深度学习网络在此处应用,明显已经达到了更好的结果。[25]
而与深度学习网络算法相比,宽度学习的优势在文中已经阐述。根据宽度学习作用于大数据的主要技术分类和时序预测,该模型在数据分类和多个时间序列数据上的测试结果表明,基于宽度学习所建模型具有更高的有效性和精度。通过宽度学习神经网络方法构建学生成绩预测模型的具体步骤,如图6所示。(图表略)
首先,利用与学生每周学习情况有关的学习数据,包括之前的成绩、上交作业的速率与准确率等时间序列数据,对宽度学习网络进行多次训练和自适应学习逐次优化,有效处理一个完整课程中学生每周学习情况相关的时间序列数据;然后,运用所训练得来的模型对某次新测试数据集进行测试,检验测试精度;最后,当精确度达到要求的时候,将通过检验后的完善模型应用于教育教学场景,可预测学生的最终成绩。
通过宽度学习神经网络方法,数据容易收集,易于实现特征抽取,可以实现更为精确快速地对学生最终成绩的预测,以便教育工作人员通过对学生学习结果的预测认知,为教学管理和改进教学提供重要的依据分析,并提前做好危机干预,驱动学生有效学习,促进学生成绩进步。
(二)给予学生演示精准评价
第一个基于深度学习网络的自动化演讲评估系统是通过人体姿势、手势、目光接触、流畅度、生动性、发音、语速和观众互动,来给每个演讲进行评分。该系统通过Kinect传感器、Google Glass和首频,可以成功地捕获每个演讲者生成的肢体语言、眼神接触和语音等信息。通过深度学习的两组双向长短期记忆网络,分别处理音频输人、视频帧和骨架表征。将处理不同模态的网络连接在一起,并且对所产生的深层结构实现端对端(End-to-End)的培训。当不同模式相结合时,这种深层网络结构可以实现更好的结果。[26]
这一系统运用的是数据挖掘中的分类和回归任务。而宽度学习系统较其他深层网络结构,在分类和回归性能上表现得更加出色;同时,宽度学习中的快速增量学习算法可用于更新系统运行时的权重。当系统需要新增一个数据特征时,并不需要像深度学习那样从头开始重新训练,在保证效果的前提下,可极大地缩短神经网络系统的训练时间。在满足类似“自动演讲评估”这种多特征提取或需要实时变更的系统需求时,宽度学习相对于深度学习的优势在于宽度学习在特征提取的网络重建中更加灵活。
当新增加一个特征时,不需要向深度学习系统一样重新推翻网络计算所有权重,而建立新的模型结构。相反,宽度学习系统的输入值X和输出值Y并不直接影响权重值,权重值是通过与增强节点H做关联。因此,当新增一个特征时,只需将新特征与增强节点H做计算就可以使用了,而不影响整个系统的参数设置。宽度学习应用于学生评价的优势与深度学习对比,如表3所示。(图表略)
计算机高效快速地理解学习者的行为表现,对于自动评估系统是至关重要的。同时,评估系统通过分析学习者行为轨迹而提供的即时反馈和根据此所设计的专门程序,可以帮助学习者改善提高自身的演讲技能。可见,通过将宽度学习神经网络作用于学生评价,可以给予学生更具有针对性、个性化的公平、高效的成绩评价,真实反映学生的情况,实现学习评价精准化、智能化、差异化,帮助学生提高自身的能力水平。
(三)提供小组个性学习支持
基于K-means聚类算法的宽度学习,可以通过聚类将学生分成K组协作学习小组,这些学习小组拥有各自共同兴趣特征或学习特点。宽度学习作用于学生群体分组的过程如图7所示(图表略),首先,将学生成绩的等相关数据输人系统,随机选取K个点确定所要求分的组数;其次,系统会确定每一个聚类的中心,也就是质心;再次,计算每一个数据到质心的距离并将基于最小值的距离进行分组,得到了K个初始聚类组。最后,系统会重新计算每个聚类,以确定新的质心位置。如果所产生的新聚类稳定,则结束聚类,否则持续循环。
其作用在于:一方面,通过聚类分组可以使教师采用不用的教学策略,针对不同个性群体,进行个性化的学习和指导。同时,这种小组式的共同目标的学习模式,对于培养小组团队能力和合作精神具有重要的作用。另一方面,对于网络中的异常行为,系统可以及时有效地进行训练,并划分新的特征用于检测异常数据。通过将基于K-means聚类算法的宽度学习作用于学生群体分组,利用数据挖掘技术划分不同群体,更有利于分析学生各自不同的学习风格和学习行为,有针对性的制定教学策略,进而提供群体个性化的学习支持。
(四)智能辅助教师进行教学
格罗斯(Gross)团队展示了施乐(Xerox)公司的最新教育产品一Ignite教学支持系统的手写识别组件。这是一个专为美国基础教育工作者设计,可以给予学生答案自动评分和允许教师验证成绩的商业系统。识别发生在流水线中,通过图像预处理开始,随后进行字符分割、字符识别和最终单词识别。其中的字符识别是基于深度学习的卷积神经网络CNN和堆叠去噪自动编码器SDA。其中的训练数据集来源于对公开或私有的学生学习相关数据的收集,结果显示,深度学习的运用准确率已经达到92.8%。[27]
与深度学习相关网络相比,宽度学习在MINST数据集实验结果表明,宽度学习作用大数据分类技术具有高精确度以及耗时短的优点。比如,在针对考试中学生错题答疑辅导时,对某个学生经常性犯的错误和班级所有人都容易出错的题目进行数据收集和特征提取,系统进行自动调节推荐类似题目和相关知识点,可以同时实现对单一个体和班级整体的教学辅导,以促进学生进行错题类题目的知识理解和训练。采用宽度学习的神经网络方法作用于学生学习行为相关数据的识别,可以实现更为精确和及时的计算机辅助教学,帮助教师进行学生学习成绩分析,使学生更好地了解自身学习情况,为教师实现因材施教,为学生制定针对性指导计划,提供适切的帮助。
(五)促进远程教育教学交互
远程教育的发展,大大促进了人类教育的进步。实践证明,对远程教育的虚拟网络环境所提供的庞大信息数据的充分利用,显得尤为重要。比如,张琳团队所实现的北京理工大学远程教学平台的教学作弊行为监控子系统中,主要运用了数据挖掘中的聚类技术,基于对远程教学网站交互系统讨论群中的数据,进行聚类算法的文本分析和特征提取的行为分析,实现了对考生考场行为的监控和判断。[28]
远程教育中的讨论互动,对于学生的知识掌握与构建十分重要。基于以上实验的研究,可以将基于K-means聚类算法的宽度学习应用于远程教育讨论交互测评中,通过对具有共同语言行为学习模式的学生的聚类,帮助教师更加了解学生行为,以改进教学策略,加强学生和教师之间的有效互动,促进远程教育教学交互,助力现代远程教育的健康发展。将宽度学习应用于远程教育讨论、交互、测评,可建构如下框架,具体过程与步骤如图8所示。(图表略)
简言之,教育是一个极其复杂的系统,对学生的学习行为和状况进行科学的评价和精准的预测及干预,也是一项非常艰难的任务。但“数据挖掘分析变革教育”已成为新时代必不可挡的发展趋势。人工智能应用教育快速发展,将给教育的信息化和智能化带来诸多新的理念和实现手段。
随着大数据相关技术的兴起与应用,机器学习领域下宽度学习的出现,为我们借助新兴技术收集和分析教育大数据、利用大数据技术应用于教育数据挖掘和学习分析,带来了一种新的途径与可能。宽度学习新技术的发展,对教育领域数据挖掘和分析无疑具有积极作用,但宽度学习对于学习分析和教育数据挖掘方面的具体应用还不多。将宽度学习应用于教育的相关研究,大多还处在试验和探索阶段,未来还需要一个长期的整合和研究过程。
注释:
①教育研究领域也有深度学习的概念,但两者内涵并不相同。因此,本文的深度学习不包含教育研究领域之概念。
参考文献:
[1]Luckin R,Holmes W, Griffiths M,Forcier L B. Intelligence Unleashed: An Argument for AI in Education (Pearson,2016) [EB/OL].
[2]国务院.新一代人工智能发展规划[DB/OL].http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm.
[3]闫志明,唐夏夏,秦旋,张飞,段元美.教育人工智能(EAI)的内涵、关键技术与应用趋势——美国《为人工智能的未来做好准备》和《国家人工智能研发战略规划》报告解析[J].远程教育杂志,2017(1).
[4]Mitchell T. Machine Learning[M]. New York City: McGraw Hill,1997:2.
[5]Natalia Konstantinova. Machine Learning Explained in Simple Words [EB/OL].http://nkonst.com/machine-learning-ex- plained-simple-words/#more-115.
[6]郭丽丽,丁世飞.深度学习研究进展[J].计算机科学,2015(5).
[7][20]Zhulin Liu, C L Philip Chen. Broad Learning System: Structural Extensions Onsingle-layer and Multi-layer Neural Networks[C]//2017 International Conference on Security, Pattern Analysis, and Cybernetics (SPAC), 2017.
[8]C L P Chen, C-Y Zhang. Data-intensive Applications , Challenges, Techniques and Technologies : A Survey on Big Data[J]. Information Sciences ,2014.
[9]Y H Pao, G H Park, D J Sobajic. Learning and Generalization Characteristics of the Random Vector Functional-link Net[J]. Neurocom-puting,1994(2).
[10]C L P Chen,J Z Wan. A Rapid Learning and Dynamic Stepwise Updating Algorithm for Flat Neural Networks and the Application to Time-series Prediction[J]. IEEE Transactions on Systems , Man, and Cybernetics, Part B (Cybernetics), 1999(1).
[11][23]Zhulin Liu, Jin Zhou, C L Philip Chen. Broad Learning System: Feature Extraction Basedon K-means Clustering Algorithm[C]//2017 4th International Conference on Information, Cyberneticsand Computational Social Systems (ICCSS),2017.
[12]徐鹏,王以宁,刘艳华,等.大数据现角分析学习变革——美国《通过教育数据挖掘和学习分析促进教与学》报告的解读及启示[J].远程教育杂志,2013(6).
[13]Romero C, Ventura S. Data Mining in Education[J]. WileyInterdis- ciplinary Reviews -Data Mining and Knowledge Discovery,2013(1).
[14][16]Bisacchi Coelho Orlando, Silveira Ismar. Deep Learning Applied to Learning Analytics and Educational Data Mining: A Systematic Literature Review [EB/OL].http://br-ie.org/pub/index.php/sbie/article/view/7543.
[15]Romero C, Ventura S. Educational Data Mining: A Review of the State-of-the-art[J]. IEEE Transactions on Systems, Man and Cybernetics, Part C: Applicationsand Reviews, 2010(6).
[17]T Mishra, D Kumar, D S Gupta. Mining Students' Data for Performance Prediction[C]//In Proceedings of International Conference on Advanced Computing & Communication Technologies, 2014.
[18]Romero C, Ventura S. Data Mining in Education[J]. Wiley Interdisciplinary Reviews -Data Mining and Knowledge Discovery,2013(1).
[19]P Espejo, S Ventura, F Herrera. A Survey on the Application of Genetic Programming to Classification [J]. IEEE Transactions on Systems Man and Cybern etics part C, 2010(2).
[21]C P Chen, Z Liu. Broad Learning System: An Effective and Efficient Incremental Learning System without the Need for Deep Archi - tecture [J]. IEEE Transactions on Neural Networks and Learning Systems, 2018(1).
[22]Baker R S J d. Data Mining for Education [M]//McGaw B, Peterson P, Baker E, eds. International Encyclopedia of Education. Oxford, UK: Elsevier,2010.
[24]C L P Chen, J Z Wan. A Rapid Learning and Dynamic Stepwise updating Algorithm for Flat Neural Networks and the Application to Time-series Prediction[J]. IEEE Transactions on Systems, Man , and Cybernetics, Part B (Cybernetics), 1999(1).
[25]Okubo F, Yamashita T, Shimada A, Ogata H. A Neural Network Approach for Students ' Performance Prediction[C]// 7th Intl. Conf. Learning Analytics and Knowledge, 2017.
[26]Li J, Wong Y, Kankanhali M S. Multi-stream Deep Learning Framework for Automated Presentation Assessment[C]//2016 IEEE Intl. Symp. Multimedia, 2016.
[27]Gross E, Wshah S, Simmons I, Skinner H. A Handwriting Recognition System for the Classroom [C]//5th. Intl. Conf. Learning Analytics and Knowledge,2015.
[28]张琳,李小平,张少刚,等.基于远程教学视点下的大数据挖掘模式问题研究[J].中国电化教育,2018(4).
Broad Learning System and Its Educational Applications in the View of Artificial Intelligence
Yuan LipingChen Chuannan
Abstract:Broad learning system is a random vector single-layer neural network learning mode based on random vector function linked neural network (RVFLNN) and the system could be flatted in the wide sense by the enhancement nodes.Broad learning neural network system not only preserves the advantages of deep learning,but also makes up for its defects,which can make more efficient and effective educational big data mining.Based on the algorithms and system structure of broad learning,can be applied to educational big data mainly through data mining techniques such as classification,clustering,regression and timing prediction. Broad learning can make full use of its advantages in student achievement prediction,accurate student evaluation,group personality learning support,intelligent tutoring systems,and modern distance education development so as to make a contribution to the modernization and intellectualization of education.
Keywords:Broad Learning System;ArtificialIntelligence;Machine Learning;Educational Big Data;Educational Data Mining;Learning Analytics
责任编辑:王雪婷