【论文选刊】王继茹 朱靖 王建 陈羽:数据驱动的知识图谱在本科教学信息化改革中的作用-k8凯发

【论文选刊】王继茹 朱靖 王建 陈羽:数据驱动的知识图谱在本科教学信息化改革中的作用-k8凯发

发布者:教务处发布时间:2024-06-17浏览次数:10

作者简介:王继茹、朱靖、王建,国防科技大学气象海洋学院讲师;陈羽,国防科技大学气象海洋学院副教授。

基金项目:湖南省普通高等学校教学改革研究项目“基于数据驱动的知识图谱在本科教学中的应用研究”(hnjg-20230041);国防军事教育学科规划课题“军队院校‘沉浸式’教学模式研究——以海洋科学基础·课程为例”(jyky-d2023048);国防科技大学教育教学研究课题“从‘数字孪生’到‘实验室’到‘云探海’——面向海洋探测的智能化多层次实践教学环境建设研究”(u2021212

原文刊载于《高等工程教育研究》2024年第三期121-128页。



  要:为满足新工科建设的需求,教学改革不断朝向数字化和信息化的方向迈进。随着计算技术的发展,数据对于教育的意义越来越重大,不断推动着教与学方式的改变。而且,随着人工智能技术和各领域的深度融合,知识图谱技术近几年在教育领域也崭露头角,在课堂教与学、知识与资源整合、学生个性化学习以及教学评价分析等方面发挥着越来越重要的作用。数据驱动和知识图谱成为国家本科教学改革和创新性人才培养的重要手段。本文分析了数据驱动的知识图谱在本科教育中的作用,探讨了数据驱动的知识图谱在本科教学改革中的应用,并展望了知识图谱在未来教育行业的发展和潜在问题。



关键词:知识图谱  数据驱动  本科教育  教学信息化改革  个性化学习



一、引言

国家在发展本科教育方面,高度重视人工智能、数据驱动、知识图谱等人工智能新技术发展与教育融合[1],旨在推动新工科建设与教育信息化改革创新。2019年,中共中央办公厅、国务院办公厅印发《加快推进教育现代化实施方案(2018-2022年)》,强调大力推进教育信息化建设,实施人工智能助推教师队伍建设行动。新工科建设的需求和本科教学信息化改革的呼声促使我们借助大数据、人工智能等新技术,寻求更智慧、高效的教育方式和教学手段。[2] 对此,一系列政策相继出台,旨在推进新工科建设,支持人工智能技术在教育领域的深度融合。2018年教育部先后发布《高等学校人工智能创新行动计划》《教育信息化2.0行动计划》,指出探索基于人工智能的新教学模式,建设智慧教育。2021年教育部等六部门联合发布《关于推进教育新型基础设施建设构建高质量教育支撑体系的指导意见》,强调应以人工智能助推教师队伍建设,助力教学能力提升和教学管理工作优化。此外,习近平总书记多次强调,“中国高度重视人工智能对教育的深刻影响,积极推动人工智能和教育深度融合,促进教育变革创新”。


人工智能与教育的深度融合,能够促进教育信息化、数字化发展,为培养具有创新能力和实践能力的新型人才助力。[3] 随着人工智能和大数据技术的发展,数据驱动、知识图谱在教育教学中的应用已经成为教育教学改革、人工智能与教育融合研究的前沿课题。[4] 数据驱动是指通过收集和分析数量可观的教育数据,帮助教育工作者做出更准确的教育决策,提高教育教学质量。[5] 知识图谱的核心是将知识元素进行结构化和链接,构建起一张基于知识元素的图谱,通过对知识图谱的挖掘、扩展和应用,可以实现智能化的教育教学。[6] 数据驱动和知识图谱的应用正在逐渐成为教育教学改革的重要手段,可以帮助教育工作者更好地了解学生的学习状态和需求[7],提高教学质量和效果,推动教育教学的智能化和精细化发展。



(一)知识图谱


在人类智力进化中,由神经元组成的、类似图网络的神经构造是学习和记忆的基础。这从本质上反映了人类基于联想的学习模式,即通过将不同知识点联系起来,形成知识网络,从而提高学习效率和记忆效果。在信息技术日新月异的今天,人类依然在将关联学习优势充分放大,知识图谱就是典型体现。基于无数知识、概念等基本单元构成的图网,为万维网、搜索引擎等应用完成知识搜索、推理等提供了强有力的支撑。


2012年,谷歌推出“知识图谱”(knowledge graph)项目,旨在将实体、属性和关系等信息整合到一个大型图谱中,从而更好地理解和回答人们想要查询的问题,由此知识图谱的概念被正式提出[8]。同时,谷歌还将知识图谱加入搜索引擎,使用语义检索从多种来源收集信息,提高搜索质量。此后,知识图谱逐渐成为人工智能和数据科学领域的热门话题,并被广泛应用[9]


如图1所示,知识图谱并不是一个新的概念,其前身可追溯到上世纪六十年代的语义网络[8]。对于发展初期的语义网络来说,结构相对简单:节点—关系—属性,用相互连接的节点和边来表示知识,其中节点表示对象、概念,边表示节点之间的关系。语义网络呈现简单,易于理解。概念或实体之间的层次和从属关系一目了然,相关概念容易聚类。但也存在缺点:节点和边的值可自己定义,缺少统一的标准,而且无法区分概念节点和对象节点。语义网络的规范性也来源于用户本身,所以多源数据融合比较困难。这些都决定了语义网络不能很好实现自主推理。资源描述框架(resource description framework,rdf)的提出解决了语义网络的部分缺点,在节点和边的取值上做了约束,制定了统一的标准,为多源数据融合提供了便利。rdf只能对具体事物进行描述,缺乏抽象能力,无法对同一类别的事物进行定义和描述。资源描述框架模式(rdf schema,rdfs)进一步定义了类、属性、关系来描述资源,并通过属性的定义域和值域来约束资源。rdfs通过引入模式来定义约束规则,而数据在这种规则下进行实例填充。这些发展都为之后知识图谱的提出奠定了基础[10]


一般来说,知识图谱是一种用于组织和表示知识的结构化数据模型,通过将现实世界中的事物、概念及其之间的关系以图谱/图网络的形式展现,提供一个统一、标准的数据结构,以便人们更加方便地理解和使用这些知识。如图2所示,知识图谱的基本元素包括:实体、属性和关系[11]


1)实体:现实世界中的事物和概念,如人、物品、地点、事件等。每个实体或概念用一个全局唯一确定的id标识符;


2)属性:描述实体的内在特性,如人的年龄、物品的品牌和相关参数、某地点的经纬度等。每个属性都对应有具体的值,如“姓名:张三”“年龄:13”“品牌:华为”等;


3)关系:连接实体并刻画实体之间的联系,如人与物品之间的从属关系、人与人之间的社交关系等。



知识图谱的基本结构可用有向无环图来表示,其中节点代表实体,边代表实体之间的关系。实体可以是一个具体事物,也可以是一个抽象概念或属性。关系可以是实体之间的语义关系,也可以是实体和属性之间的关系。由若干节点组成的知识图谱就是一个庞大的知识库,包含了大量实体、属性和关系,它们之间的联系构成了一个图网络,提供了更加直观和丰富的知识视图,帮助人类具象地了解事物和概念之间的关联。


在当前数据驱动时代,知识图谱已成为一种重要技术,涉及搜索引擎、推荐系统、智能客服、自然语言处理等多领域应用。[12] 知识图谱可提供更加丰富和精准的功能支持,快速检索相关知识和资源,进行实体关系自动推理,从而使搜索精准度、效率和性能得到了极大提升。[13]


近年来教育领域“知识图谱 ”模式越来越受到重视。知识图谱技术在教育领域的应用,对学生学习、教师教学和教学决策等有着越来越深刻的影响,也可以帮助教育工作者和管理者进行数据分析,提供教育教学决策支持[14-17],对教育教学改革和创新的影响日趋深远。


(二)教育教学中的数据驱动


2021年3月,教育部发布《关于加强新时代教育管理信息化工作的通知》,强调以数据为驱动力,利用新一代信息技术提升教育管理数字化、网络化、智能化水平,推动教育决策由经验向数据驱动转变[18],以信息化支撑教育治理体系和治理能力现代化。随着计算技术的发展,数据在各领域的积极作用日益凸显,对于教育行业亦是如此。[19,20]


教育领域积累了大量学习数据和学生行为数据。这些数据包含了学生的学习情况、兴趣偏好、学习习惯等信息,可通过数据分析和挖掘揭示出学生的学习规律和需求,为教学提供科学依据。如图3所示,这些数据主要包括:


1)学情:通过调研、问卷等形式展开的学情分析数据;


2)课堂:围绕课堂内容展开的课堂前测、中测和后测数据;


3)在线学习:通过在线平台课后作业、测试等获取的知识掌握度数据;


4)考试测试:对学生进行知识、思维等评估的考试、考核数据。



教育工作者可以通过网络教育教学平台、云阅卷、日常测评、线上考核等各种方式进行数据搜集、统计和分析,为教学与学习提供重要的应用参考价值。


1)通过各类学习痕迹数据进行学生学情、学习状态、知识掌握度等的综合分析,建立学生个人画像,分析学生需要在知识、技能、思维等哪些方面进行强化和提升。


2)对于教师来说,精细跟踪和评价每一个学生成为可能,能够根据学生画像给出贴合学生实际情况的学习建议,优化教学方式。


3)针对具体某一种或几种类型数据的分析还可以帮助教师从中发现问题,积极调整教学对策,提升教学效果,比如:通过结合对考试失分点和日常测试数据的分析,教师可以反思教学设定的知识点难易度与学生实际掌握程度是否相符?教案中设定为重难点的知识点,学生实际掌握程度如何?


数据之于教育教学的意义远不止于此。它不但能够在学生学习、教师备课授课、考核评价分析等各个教学活动环节中发挥重要作用,还能够与知识图谱碰撞出火花,对知识图谱功能起到有效的强化作用。



(一)知识图谱在教育教学中的作用


知识图谱在教育领域的引入,可有效整合教育领域的大量知识资源,提供个性化、深度学习的学习支持[21],旨在为教育管理者、教育工作者和教育对象提供更智能、个性化和高效的教育服务及学习体验。知识图谱以网络图的方式表示教学实体及其联系,并可用于知识体系构建、教学资源检索、教学数据分析,以及学生学习评估和推理的新技术[22],即教育知识图谱。其中所提到的实体不限于狭义上的学科知识点,还可以是学科、课程、章节、概念、教学资源等。


当前教育工作者和管理者越来越重视数据的有效收集,以此为基础可抽象出研究对象的相关信息,从而建立反映研究对象特征的“画像”,这是一种基于对象真实数据的虚拟表征。在教育知识图谱研究中,教学实体关联构建是基础,也是当前研究关注热点。如图4所示,就学科范围而言,根据研究对象的不同,构建三类画像机制,主要包括:


1)学科内前后续课程、课程间知识点的关联构建——学科画像;


2)课程内知识点与教学资源关联构建——课程画像;


3)学生与知识点关联构建——学生画像。



基于以上三个层次建立知识图谱可以视为对学科人才培养计划、课程教学计划,以及教学考核与评估的动态建模。具体如下:


1.学科画像


就学科层面而言,建立学科与课程之间的关联,以便形成跨越课程界限的学科内所有知识点的完整关联(包括具体知识点下挂载的资源),可以看作是人才培养计划中的前后续课程设置的动态建模,形成动态的学科知识体系构建,即学科画像。


如图5所示,以“海洋学”学科为例,在知识图谱中可以通过定义节点之间的关联属性对课程之间的前后序关系进行动态建模。而且图谱中节点、关联进行“属性-值对”设置还可以很好地解决相同知识点在不同课程中的定位不同的问题。如在“海洋学”中,知识点k1在课程c1中可能是重点,但在课程c2中有可能不是重点。但这在图谱中并不会产生冲突,因为图谱允许节点具有若干属性-值对,可以通过设置不同的“属性-值对”将其区别开。



2.课程画像


就课程层面而言,建立课程章节知识点之间的关联对应于教学计划中章节和知识点设置,而知识与资源之间的关联对应于教学教案中涉及的具体教学内容。通过知识图谱技术,形成对教学计划和教学内容两方面动态建模的课程画像(图6)。



代表课程画像的图谱中核心是知识点,对知识点粒度的切分以及知识点之间关联的丰度直接关系到图谱质量的好坏。而且,知识点与资源之间的关联直接关系到教学活动中是否能够向学生做到教学资源的精准推送。这是创建图谱需要关注的重点问题。


3.学生画像


就目前知识图谱在教育领域的应用来说,最多的应用场景可能是上述提到的,以知识点为核心的学科/课程知识结构动态建模,以实现知识体系可视化、知识检索、资源检索和推送等基本功能。然而,如果将学生和知识之间建立关联,知识图谱还可以发挥更强大的作用。基于学生行为信息和学习痕迹,构建知识点与学生的关联,即对应于教师课程考核总结与分析,实现对学生学习诊断和评估的动态建模,即学生画像(图7)。



基于图谱技术对学生画像的动态建模,可以考虑以学生为核心,建立学生与课程/知识点的关联。以评测、考核、考试等学习痕迹为驱动,设置和调整节点之间的关联权重,那么关联权重的大小(关联强弱)便可看作对学生学情和知识掌握度的基本刻画。之后,借助图谱的检索、推理等技术,帮助教师实现精准学情研判,及时向学生提出合理的学习路径规划建议,对学生进行学习资源的个性化精准推送,从而优化教学方法,提升教学效果。


受用户画像相关研究启发[23],在利用学生画像进行学习评估动态建模时,又将其分为学生个体画像和群体画像。在学生个体画像研究中,一般基于单个学生在教育教学场景下的多维度信息,比如基本信息、学习行为数据、线上线下互动数据以及对知识的兴趣偏好数据等进行图谱构建和画像建模,准确刻画个体学生的知识特征。在学生群体画像研究中,研究对象是在教育教学场景中特定范围的学生群体。比如针对某一课程来说,可以研究同一专业所有学生组成的学生群体的知识特征,对此学生群体的相关数据进行统计分析来构建图谱,形成关于本门课程的学生群体画像的动态建模。而且,还可以基于数据挖掘技术,从这些数据中抽取学习特征,进行聚类分析,得到具有相似学习特征的学生群体,创建不同类型的学生群体画像。[24]


(二)知识图谱在教育教学中的具体应用场景


具体到教学活动的组织和实施,知识图谱有多种教学应用场景,比如:


1)学科知识整合与内容组织/导航:本科教育通常涉及多个学科领域知识。知识图谱可以将不同学科知识联系起来,促进跨学科学习。此外,通过对图谱节点进行“属性-值对”设置,将知识划分为不同的主题和子主题,形成层次关系。这可以帮助学生了解课程/学科结构和层次,形成知识体系,避免知识孤岛现象。


2)知识补充和拓展:知识图谱可以为学生提供与课程相关的额外知识资源。它可以链接到相关的学术文献、在线教程、实践案例等,满足不同学生学习需求,拓展学生的学习深度和广度。


3)学习资源组织和推荐:图谱技术可以将知识与对应学习资源进行关联,帮助教师和学生更好地管理、检索和访问学习资源;同时对学习痕迹和状态进行分析和推理,为学习者精准推荐个性化学习资源,提升自适应和高效学习的能力。


4)学习评估和反馈:基于图谱知识节点下关联的测评、考核结果数据的学习轨迹,教师可以了解学生对知识的理解和掌握程度,跟踪学生学习进展,以提供个性化的学习路径规划建议,进行针对性指导。


知识图谱是知识的结构化表示,以网络图的形式将信息组织成实体(节点)和实体之间的关系(边)。它能够捕获和表示教育实体之间的复杂关系,以助力教育工作者开展更有效的课程设计。此外,它能有效强化教学资源的整合和检索。通过编码在知识图谱中的语义关系,教师可以方便、高效地实现相关知识点、概念、学习材料、教学工具和资源的连接,还可以轻松发挥知识发现、搜索等功能[25]。学生也可以根据自身需求精准获取资源,从而形成一个综合性强、互联性强的“学习—教学”生态系统。



知识图谱的建立和维护需要数据挖掘和语义分析工作的支持,以便从现实世界中进行信息抽取,并将其转化为机器理解的数据结构。在数据驱动下,知识图谱可以支持动态更新、检索和节点关联权重动态调整,帮助构建智能化、个性化的教学与学习环境[26]。这种环境下,教学活动能够始终保持以学生为中心,实现个性化教育和精细化评价。数据驱动对知识图谱的强化具体表现为:


1)充实图谱内容:这是数据最基本的作用,尤其是教学资源数据,能够扩充知识点,并丰富与知识点关联的结构化和非结构化资源,方便知识和资源检索。


2)节点关联的构建和强弱调整:源源不断的数据输入,包括教学资源数据和学生学习痕迹等多种相关数据,能够迭代优化和调整图谱节点之间的连接权重,根据实际教学活动更真实的量化节点之间的关联强弱。


在数据驱动理念的加持下,知识图谱除了进行信息有效组织和检索外,还能够支持个性化的教学与学习活动。比如,基于数据驱动的知识图谱,可动态追踪学生学习进度,精准实现学习资料推送,实时提供有针对性的反馈,帮助教师及时调整教学策略。这不仅强化了学生个性化的学习体验,还可以促进学生自适应学习能力的提升。再比如,通过对学生在图谱上的行为痕迹进行实时跟踪和分析,系统可以获取有关学生的学习习惯和学习困难等信息。教师可以根据这些数据提供针对性建议,帮助学生克服困难、改进学习策略,并预测学生的学习结果和未来需求。


通过在教育中应用数据驱动的知识图谱模型,教师和学生都可以从课程设计改进、资源整合、适应性学习以及对教育概念之间关系的深入理解中受益。



在以学科为中心的知识图谱中,节点表示该学科人才培养计划中囊括的课程,节点关联表示课程的前后续关系及其关联强弱。在以课程为中心的知识图谱中,节点表示课程中囊括的知识点,知识节点之间具有关联而且关联有强弱之分。数据源源不断的输入可以使整个知识图谱做到实时动态更新,及图谱节点之间关联的适当削减和强化,起到功能定制化的效果。


(一)云教案/云教材动态组织和定制


随着学科人才培养计划、需求和目标的调整,课程教学计划也需做出相应的变更。对于教师而言,课程教案和教材讲授范围并不是一成不变的,而是动态变化的,需要进行及时调整。传统教案和教材内容相对固定,不能很好地适应教学计划和内容的动态变化,可动态生成和刷新的云教案、云教材可能是更好的k8凯发的解决方案。在这种情况下,知识图谱技术的优势开始显现。因为知识图谱不但能够实现知识架构和学科知识体系的静态展示,它还具有知识动态刷新和筛选功能。而且,由于知识图谱实现了知识点及其相关资源的挂载和连接,因此在教学内容和教案的动态组织,以及云教材定制方面可以发挥很重要的作用。


图8展示了基于知识图谱进行云教案动态组织、云教材动态定制的基本流程。首先根据调整之后的新的教学计划条目,对涉及知识点连接进行适当强化(加大权重)。然后,对调整之后的知识图谱进行动态检索和筛选,并结合知识点下挂载的各类资源进行新教案的重新组织,以及适应新教学计划的云参考教材的重新生成。



综上,基于知识图谱动态特性,教师能够及时响应教学计划的变更,进行课程教案的动态组织和刷新。而且根据教学计划调整定制生成囊括新教学内容的云教材,能够为学生提供和课程内容完全贴合的参考教材,解决了传统教材由于内容相对固定而不能及时适应教学内容变更的问题。


(二)学生复习/备考方案定制


知识图谱的知识和资源组织能力强大,能助力学生实现学科/课程知识架构的搭建,进而对学科和课程知识体系有相对完整的认识和理解。除此之外,它还能在学生期末复习和备考阶段发挥重要作用,并根据学生对知识的掌握情况进行复习资源的精准推送。


如图9所示,基于学生学习痕迹,如日常测试、课堂交互与表现等数据,可以为每位学生动态生成课程知识画像,即学生画像。该画像反映了基于学习痕迹的课程知识点掌握情况。将其反映在知识图谱上,就是以学生为核心,构建学生和知识点之间的连接,形成一张课程知识掌握度图谱。这里需要注意的是,图谱中节点连接是有权重的,即有强弱之分——学生和知识点连接强则说明知识掌握程度较好,连接弱则说明知识点掌握还有所欠缺。通过知识掌握度图谱,系统重点标识掌握欠缺且属于重点的知识点用于学生重点复习备考,实现备考测试题目和相关复习资源的精准推送。不同的学生学习痕迹和可统计的测试、课程表现数据不同,每位学生都能够获得与自己实际情况符合的个人画像与专属知识掌握度图谱,以此实现备考方案个人化定制,更好地服务于学生备考方案和计划的制定。




基于新工科建设的需求牵引,“数据驱动 知识图谱”耦合模式必将在教育教学中碰撞出新火花,成为新一代教育改革关注的要点,但发展中存在的问题也不容忽视。


首先,当前很多高校教育工作者的信息化、数字化素养有待提升。由于技术限制,教学活动中很多学生表现都没能进行数字化整合和纳入教学评估中进行统计分析。作为现代教育工作者,不但要认识到教学数据的重要性,还要注重提升自身的数字素养,培养教学数据积累、获取和有效整合的能力,以及通过数据挖掘、机器学习等进行科学分析的能力。


其次,很多教育工作者对于知识图谱的理解浮于表面,依然停留在可视化、简单搜索等浅显认识上。作为现代教育工作者,除所教授的专业知识外,还要注重学习教学改革所需理论和技术知识[27]。从底层理论和技术实现角度,对知识图谱开展探索和学习,以充分挖掘知识图谱在教学中的强大应用价值。


此外,知识图谱在本科教育中的应用还处于探索和发展阶段,其与教育教学的实际融合方式和深度在不同院校、学科和课程中有所差异。应以辩证、包容和开放的心态去看待其他来自不同专业背景的教育工作者对知识图谱的发展和利用方式。



转载自“”微信公众号

网站地图