基于知识图谱的初等数学关系抽取及其应用
这是一篇关于知识图谱,关系抽取,指代消解,初等数学,关系标注的论文, 主要内容为近年来,随着人工智能领域突飞猛进,深度学习技术为自然语言处理各个方向带来了极大的发展。借助自然语言处理技术和深度学习算法,人们可以从文本中抽取出结构化信息。从数学文本中抽取知识并通过知识的推理实现类人答题的目标成为一些国内外学者研究的方向,其中初等数学关系抽取成为重要研究方向之一。依赖前人的工作和研究成果,本文将知识图谱应用到初等数学关系抽取的研究上。本文主要研究内容有:1.本文提出了一种基于文本特征向量和数学概念知识图谱的关系抽取算法。基于该算法设计了一个初等数学关系抽取系统,该算法采用的思想是如果两个文本相似,那么文本包含的对应实体也拥有相似的实体关系。进一步采用BERT获取文本特征,利用待匹配文本的特征与关系库中的文本特征进行相似度计算,再之有选择的保留来自关系库文本包含的三元组,然后进行知识图谱关系剪枝去除匹配到的不合理的三元组,最终得到关系抽取的结果。2.文本构建了一个初等数学关系标注平台。利用该关系标注平台可以让更多的人参与关系数据的标注,能够更快的、更方便的增加关系库数据,为提高关系抽取的准确率提供了极大的帮助;同时标注的数据构建了一个数学文本关系库,存储了数学文本及其包含的实体关系三元组,它是结构化的数据。因此方便关系抽取系统三元组数据的加载以及关系标注平台数据快速存储。3.本文提出了在初等数学领域中长距离实体依赖问题的解决方案。为了降低关系抽取系统的复杂度,将数学文本按照一定的原则划分成多个短文本,并尽量保证短文本内的实体关系相对完整,但遇到了实体跨多个短文本进行关系抽取问题。提出了在标注数据时使用实体占位符以及跨文本关系抽取时采用最短距离匹配原则的方案来解决该问题,并且该方案也解决了初等数学领域中的指代问题。基于上述方案,本文设计并实现初等数学关系抽取系统,并将该系统应用到“初等数学类人答题关键技术及系统”项目中。本文构建的初等数学关系库中包含的不同数学短句有5623个,实体三元组10875个。为了对系统进行综合测试,本文随机从初等数学题库中选取了1000道数学题目,系统抽取三元组正确率为95.6%。
基于知识图谱的实体关系补全方法研究及应用
这是一篇关于知识图谱,知识图谱补全,知识表示,初等数学的论文, 主要内容为随着互联网技术的迭代更新,越来越多的数据被存储于云服务器和个人终端设备上,不论是图片、视频、音频或是文本数据都是非结构化的,因此它们不能很好的被计算机识别或使用。知识图谱以结构化的形式保存数据,让计算机可以有效地应用这些数据,目前知识图谱在搜索引擎、问答系统、知识推理等领域已经成为了不可或缺的技术。但是知识图谱的构建与维护是一个漫长的工作,需要相关领域内的专家们不断地完善。因此知识图谱补全成为该领域的热门研究方向,它致力于预测缺失的实体与关系,自动完善知识图谱的结构,使其在下游应用中更好的发挥作用。它可以减少大量的人工标注工作,是现在知识图谱构建里一项重要的技术。本文基于初等数学自然语言理解系统,该系统的工作是将非结构化的数学题目理解为结构化的三元组表示。此系统因为设计以及实现上的限制导致了此过程存在知识表示上的缺失问题,因此,本文针对这些问题提出了两种知识图谱补全方法,目的是完善该系统对数学文本题目的知识表示。综上所述,本文的工作主要包含以下几个方面:(1)分析了初等数学自然语言理解系统中存在的知识表示缺失问题,主要存在两方面的知识无法抽取,第一个是文本题目中未提及的隐含实体无法抽取,第二个是关系标注数据集规模以及相似度阈值过高导致的正确关系无法被抽取。(2)提出了基于规则的实体自动补全方法,主要针对隐含实体进行补全。定义了实体补全规则的标准,设计了一个根据规则进行实体补全的框架,实现了对规则的解析以及三元组的自动生成。(3)提出了基于深度学习的关系自动补全方法,主要针对缺失的关系进行补全。设计并训练了一个深度学习模型,在该模型中,引入外部的实体嵌入向量增强实体表示。使用标注好的题目三元组样本训练模型,并将训练好的模型应用于数学知识图谱的补全任务中。(4)构建了融合实体自动补全方法与关系自动补全方法的知识图谱补全模块,应用于初等数学自然语言理解系统中,分别测试了两种补全方法补全的三元组正确率,其中实体自动补全方法的正确率在93%左右,关系自动补全方法的正确率在75%左右,该模块使整体系统的解题通过率提高了30%左右。
初等数学问题知识图谱的半自动构建技术研究及实现
这是一篇关于初等数学,自然语言处理,知识表示,信息抽取,知识图谱的论文, 主要内容为随着互联网进入一个高速发展期,人们的衣、食、住、行等各个方面都发生了日新月异的变化,教育行业也逐步从传统的机械化教育方式到现代的智能化教育方式转变。知识图谱是大数据时代的产物,不仅可以方便的查看学科知识点的结构关系,而且可以为自然语言理解提供可视化的概念——关系表示及深度语义推理。因此,构建初等数学知识图谱,引导学生自主学习、充分发挥主观能动性具有重要的理论意义和实际应用价值。本文在研究分析初等数学学科知识特点的基础上,提出了一种基于核心概念和关系的初等数学知识图谱半自动构建方法,主要研究内容如下:通过对通用领域自然语言处理和知识表示方法的分析和研究,提出了面向数学领域的自然语言处理模型和知识表示方法。按照数学知识使用场景的不同,把数学学科知识分为几何、代数、概率统计和文字题四大类,使用支持向量机实现初等数学问题的场景分类,降低了关系抽取任务的复杂度,便于知识点的模块化管理。使用模式匹配、句法分析和深度学习方法进行关系抽取,同时融合依存句法分析和TextRank算法,提出了一种基于关键词定位的初等数学文本关系自动抽取方法,实现了基于核心概念和关系的初等数学知识图谱构建。手工构建的初等数学核心概念和关系663个,通过本文的方法自动抽取出856个实体和22578个三元组关系,丰富和完善了初等数学知识图谱。最后使用构建的数学知识图谱辅助进行初等数学题意理解,通过对题意理解结果的分析表明,建立的知识图谱可以提高数学题意理解的通过率,具有较好的使用价值。
图神经网络可解释性的研究与应用
这是一篇关于图神经网络,可解释性,初等数学,自动解题的论文, 主要内容为近几年,图神经网络的研究方兴未艾,在诸如知识图谱、社交网络、生物和化学等领域取得了卓越的效果。人们在享受它高效能力的同时,也在从各个方面对其可解释性进行研究,致力于探明其内部决策的机理。数学知识的推理由于知识的标准化、描述的规范化和使用图谱化形式进行推理,与图神经网络具有高度的契合性。因此将图神经网络与数学自动推理系统相结合,可以极大提升系统的学习和推理能力。针对其可解释性进行研究,能够使推理的过程更加透明,令系统更加“类人”。本文将图神经网络的可解释性基于输入的相关性分为两个类别:输入无关的模型级别可解释性和输入相关的实例级别可解释性,并将它们应用于“初等数学类人解题系统”中的知识表示和实例化定理选取。本文的主要工作如下所示:(1)将初等数学知识的表示学习分解为实体关系的嵌入学习和表达式的嵌入学习。对Trans E的计算可解释性进行了研究分析,然后将其应用于实体关系三元组的嵌入表示的学习之中。收集204762条数学三元组,对训练得到的实体关系向量设计基于计算可解释性的分析方法,验证其良好的基于距离的嵌入效果,在计算相近性的实验上准确率为62.78%。(2)对于数学表达式的表示学习,提出了更加符合数学知识的表达式置换等价任务,并构造相应的数据集,生成945882条数据。对BERT的结构可解释性进行探讨,然后应用在数学表达式置换等价任务的训练之上,训练准确率为94.52%。基于注意力结构和置换等价任务目的对训练结果的解释性进行分析探讨,证明表达式向量的有效性。(3)搭建图卷积网络,结合实体关系嵌入向量和表达式的嵌入向量作为节点特征表示,应用于题目图谱和实例化定理图谱的匹配之中。构造3892条数据,测试准确率为73.52%。为探究模型对输入中不同三元组的侧重程度,设计了对数学题目图谱进行扰动的解释性研究方法。然后进行实验并分析,探讨模型的学习效果。
基于知识图谱的初等数学自然语言理解的语义增强技术研究与应用
这是一篇关于知识图谱,语义增强,自然语言理解,初等数学的论文, 主要内容为随着人工智能技术的发展,人工智能在多种领域都得到了广泛的应用,我国是一个教育大国,而初等数学又是初等教育的重中之重,人工智能与教育领域的结合是大势所趋。本文基于初等数学类人解题系统,该系统的首要任务是理解初等数学题目中所表示的含义,但是由于自然语言理解不完善,被提取的知识可用性较差,因此,本文针对这个问题提出了语义增强技术,以提高初等数学题目知识图谱的可用性和确保初等数学知识图谱的完整性。本文的主要工作包括以下几个方面:(1)分析了已构建初等数学知识图谱的所有数学实体和关系,研究将实体抽象为独立实体和非独立实体两个大类,将关系抽象为拥有关系、自环关系和动词关系三个大类,对原有知识图谱进行改进,为后续的语义增强技术提供分层级的实体关系支持。(2)在改进的题目实例知识图谱基础上,提出了一种数学实体自下而上的抽象化和关系自上而下具体化的方法,一方面,使得已有的可用性较差的题目实例知识图谱的结构更简单清晰,另一方面,对原本隐含在实体内部的关系信息挖掘出来,实现对文本语义的关系增强。(3)进一步,对初等数学中的表达式进行语义解析,并自动提取表达式中的赋值单元、命名单元等实体关系信息,实现对数学表达式语义的关系增强。(4)最后,本文将语义增强技术应用于初等数学类人答题系统,在课题组自建的700道初等数学题目上进行了测试,初等数学类人解题系统的平均解题正确率提升了20%,并且平均解题效率也提升了20%。
基于知识图谱的推荐算法在问答系统中的研究及应用
这是一篇关于初等数学,知识图谱,推荐算法,问答系统的论文, 主要内容为教育一直是国家发展的基石,而数学作为所有学科的基础,国家、教师、家长一直在不断加强对学生数学学科的教学。随着科学技术的发展和智能终端的普及,在线教学的模式开始出现在人们视野之中,一大批学生已经在网上开始自主学习。同时在近几年人工智能飞速发展的背景下,各种个性化智能教学软件逐步流行起来。这些教学系统能够为学生制定个性化的学习方案,自动对学生学习进程中的差异性进行处理,让学生能够在没有老师和家长的辅导下独立学习。在本文中研究的是初等数学领域的智能教学系统,这个教学系统以知识点为基础,通过加强学生对数学知识点的理解,让学生掌握数学多种概念的定义和关系,掌握数学解题的关键和技巧,发现数学解题的规律,从而提升学生的数学成绩。在文本中,通过参考多方权威资料,从知识点的分类、知识点的属性、知识点之间的关系三个维度出发,构建了一个比较完整并且清晰的多维度的数学知识图谱。在该知识图谱中,一共包含有721个数学知识点和786个数学关系。在建立的知识图谱的基础上,本文提出了四种与知识点相关的问答形式,每种问答形式都能够让学生从不同角度来理解知识点、练习知识点。四种问答形式分别为根据题目推荐相关知识点、根据题目推荐相似题目、根据知识点推荐相关题目、根据知识点推荐相关知识点。在这四种推荐形式中,题目到知识点的推荐至关重要,本文使用的推荐算法是基于向量空间的文本相似度计算方法,首先采用了一万多道数学题目对BERT词向量模型进行训练,再使用了余弦相似度来计算题目与知识点之间的匹配程度。在本文研究的系统的帮助下,学生可以随时将理解不清晰的知识点或者不会解的数学题目以合适的问答形式输入到系统中,系统能够立即返回该知识点的局部知识图谱或者相关题目,通过这种自主学习的方式,学生能够不断促进自我进步,达到举一反三,融会贯通。在文本构建的系统中,本文使用了500道数学题目对系统进行了测试,其中题目推荐单个知识点的平均准确率达到85%以上,知识点推荐相关题目的准确率达到88%。从测试的过程和结果可以看出,本文构建的系统能够稳定运行,并且对实际的运用也具有一定的价值。
图神经网络可解释性的研究与应用
这是一篇关于图神经网络,可解释性,初等数学,自动解题的论文, 主要内容为近几年,图神经网络的研究方兴未艾,在诸如知识图谱、社交网络、生物和化学等领域取得了卓越的效果。人们在享受它高效能力的同时,也在从各个方面对其可解释性进行研究,致力于探明其内部决策的机理。数学知识的推理由于知识的标准化、描述的规范化和使用图谱化形式进行推理,与图神经网络具有高度的契合性。因此将图神经网络与数学自动推理系统相结合,可以极大提升系统的学习和推理能力。针对其可解释性进行研究,能够使推理的过程更加透明,令系统更加“类人”。本文将图神经网络的可解释性基于输入的相关性分为两个类别:输入无关的模型级别可解释性和输入相关的实例级别可解释性,并将它们应用于“初等数学类人解题系统”中的知识表示和实例化定理选取。本文的主要工作如下所示:(1)将初等数学知识的表示学习分解为实体关系的嵌入学习和表达式的嵌入学习。对Trans E的计算可解释性进行了研究分析,然后将其应用于实体关系三元组的嵌入表示的学习之中。收集204762条数学三元组,对训练得到的实体关系向量设计基于计算可解释性的分析方法,验证其良好的基于距离的嵌入效果,在计算相近性的实验上准确率为62.78%。(2)对于数学表达式的表示学习,提出了更加符合数学知识的表达式置换等价任务,并构造相应的数据集,生成945882条数据。对BERT的结构可解释性进行探讨,然后应用在数学表达式置换等价任务的训练之上,训练准确率为94.52%。基于注意力结构和置换等价任务目的对训练结果的解释性进行分析探讨,证明表达式向量的有效性。(3)搭建图卷积网络,结合实体关系嵌入向量和表达式的嵌入向量作为节点特征表示,应用于题目图谱和实例化定理图谱的匹配之中。构造3892条数据,测试准确率为73.52%。为探究模型对输入中不同三元组的侧重程度,设计了对数学题目图谱进行扰动的解释性研究方法。然后进行实验并分析,探讨模型的学习效果。
初等数学问题知识图谱的半自动构建技术研究及实现
这是一篇关于初等数学,自然语言处理,知识表示,信息抽取,知识图谱的论文, 主要内容为随着互联网进入一个高速发展期,人们的衣、食、住、行等各个方面都发生了日新月异的变化,教育行业也逐步从传统的机械化教育方式到现代的智能化教育方式转变。知识图谱是大数据时代的产物,不仅可以方便的查看学科知识点的结构关系,而且可以为自然语言理解提供可视化的概念——关系表示及深度语义推理。因此,构建初等数学知识图谱,引导学生自主学习、充分发挥主观能动性具有重要的理论意义和实际应用价值。本文在研究分析初等数学学科知识特点的基础上,提出了一种基于核心概念和关系的初等数学知识图谱半自动构建方法,主要研究内容如下:通过对通用领域自然语言处理和知识表示方法的分析和研究,提出了面向数学领域的自然语言处理模型和知识表示方法。按照数学知识使用场景的不同,把数学学科知识分为几何、代数、概率统计和文字题四大类,使用支持向量机实现初等数学问题的场景分类,降低了关系抽取任务的复杂度,便于知识点的模块化管理。使用模式匹配、句法分析和深度学习方法进行关系抽取,同时融合依存句法分析和TextRank算法,提出了一种基于关键词定位的初等数学文本关系自动抽取方法,实现了基于核心概念和关系的初等数学知识图谱构建。手工构建的初等数学核心概念和关系663个,通过本文的方法自动抽取出856个实体和22578个三元组关系,丰富和完善了初等数学知识图谱。最后使用构建的数学知识图谱辅助进行初等数学题意理解,通过对题意理解结果的分析表明,建立的知识图谱可以提高数学题意理解的通过率,具有较好的使用价值。
基于知识图谱的初等数学关系抽取及其应用
这是一篇关于知识图谱,关系抽取,指代消解,初等数学,关系标注的论文, 主要内容为近年来,随着人工智能领域突飞猛进,深度学习技术为自然语言处理各个方向带来了极大的发展。借助自然语言处理技术和深度学习算法,人们可以从文本中抽取出结构化信息。从数学文本中抽取知识并通过知识的推理实现类人答题的目标成为一些国内外学者研究的方向,其中初等数学关系抽取成为重要研究方向之一。依赖前人的工作和研究成果,本文将知识图谱应用到初等数学关系抽取的研究上。本文主要研究内容有:1.本文提出了一种基于文本特征向量和数学概念知识图谱的关系抽取算法。基于该算法设计了一个初等数学关系抽取系统,该算法采用的思想是如果两个文本相似,那么文本包含的对应实体也拥有相似的实体关系。进一步采用BERT获取文本特征,利用待匹配文本的特征与关系库中的文本特征进行相似度计算,再之有选择的保留来自关系库文本包含的三元组,然后进行知识图谱关系剪枝去除匹配到的不合理的三元组,最终得到关系抽取的结果。2.文本构建了一个初等数学关系标注平台。利用该关系标注平台可以让更多的人参与关系数据的标注,能够更快的、更方便的增加关系库数据,为提高关系抽取的准确率提供了极大的帮助;同时标注的数据构建了一个数学文本关系库,存储了数学文本及其包含的实体关系三元组,它是结构化的数据。因此方便关系抽取系统三元组数据的加载以及关系标注平台数据快速存储。3.本文提出了在初等数学领域中长距离实体依赖问题的解决方案。为了降低关系抽取系统的复杂度,将数学文本按照一定的原则划分成多个短文本,并尽量保证短文本内的实体关系相对完整,但遇到了实体跨多个短文本进行关系抽取问题。提出了在标注数据时使用实体占位符以及跨文本关系抽取时采用最短距离匹配原则的方案来解决该问题,并且该方案也解决了初等数学领域中的指代问题。基于上述方案,本文设计并实现初等数学关系抽取系统,并将该系统应用到“初等数学类人答题关键技术及系统”项目中。本文构建的初等数学关系库中包含的不同数学短句有5623个,实体三元组10875个。为了对系统进行综合测试,本文随机从初等数学题库中选取了1000道数学题目,系统抽取三元组正确率为95.6%。
基于知识图谱的几何问题自动求解系统设计与实现
这是一篇关于知识图谱,自动解题,Neo4j,初等数学的论文, 主要内容为近年来对知识图谱的研究越来越火热,随着知识图谱在各行各业中的应用越来越广泛,大家对领域知识图谱也越来越关注。其中,教育领域的知识图谱将会是知识图谱研究的一个重要方向,本论文的研究目标是设计实现一个基于知识图谱几何问题的自动求解系统。主要研究内容如下:构建初等数学领域的概念知识图谱。知识获取是要获取初等数学领域的知识,本文知识的来源主要是目前初中、高中的数学科目的教材,同时参考教辅书籍和互联网上相关的信息。接着是实体和关系的抽取,因为该知识图谱主要是为了给后面的自动求解系统作为基础的,而数学的解题需要有准确的信息,目前自动或半自动生成知识图谱的方法达不到我们需要的准确度要求,因此采用的是用人工的方式提取其中的实体和关系。知识表示采用的是利用JAVA语言中的类来表示实体和关系,每一个实体对应一个实体类,每一类关系对应一个关系类。知识存储用的是图数据库Neo4j,编写一个知识图谱转换模块将实体类和关系类分别转换成节点和关系存储在Neo4j中。知识可视化是利用Neo4j的可视化功能来实现的。设计实现几何问题的自动求解系统。该系统是基于知识图谱的,一共有三种类型的知识图谱,分别为:概念知识图谱,题目知识图谱,实例知识图谱。概念知识图谱前面已经介绍过了,题目知识图谱是由具体的几何题目生成的知识图谱,实例知识图谱是具体的实例生成的知识图谱,类似于规则。这两个知识图谱的知识分别来源于题目和输入的条件、结论描述,实体关系的提取都是自然语言处理,知识表示都是JAVA语言中的类对象,实体和关系分别对应Entity类和Relation类,知识存储和知识可视化分别Neo4j和Neo4j的可视化功能。解题的方法是将实例知识图谱放入实例知识图谱库中,让题目知识图谱和库中的实例知识图谱互相匹配对比,对比的是三元组,查看题目知识图谱中是否包含了所有的实例知识图谱中的条件三元组,如果是题目知识图谱就会按照实例知识图谱中的结论三元组进行扩充,匹配对比结束的条件是所有实例图谱都匹配完或者是产生题目需要的实体(关系)或者是超时。概念知识图谱有实体409个,关系3398条,解题率为61.5%。基本完成初期系统所设置的目标。
基于知识图谱的增强个性化学习推荐系统
这是一篇关于推荐系统,知识图谱,初等数学,同级扩散,多跳传播的论文, 主要内容为随着大数据时代的到来以及信息科技的迅猛发展,数据量与日俱增。教育行业也在进行着信息化和数字化的革新,极大便利了人们的生产和生活。与此同时,人工智能的发展为教育行业带来了新的突破,将知识图谱与推荐技术结合,可以为学生提供更精确多样的个性化推荐。本文所研究的基于知识图谱的增强个性化学习数学习题推荐系统就是基于此背景下提出的,主要包括以下内容:1、根据初等数学基本定义和定理构建出概念知识图谱,并使用Trans E进行训练,将实体、关系以及三元组转译成向量表示,为后续系统实现基于图谱的个性化推荐做准备。并将每道独立的无结构数学题目转化为有结构的三元组知识表示,去除了题目中无意义、冗余的信息,构建出题目实例化知识图谱。再通过图谱映射的手段,将各独立的题目联系起来,映射出实例化-概念知识图谱。2、为实现用户的个性化定制,本文创造性地提出了“同级扩散”和“多跳传播”的策略,在实例化-概念知识图谱的基础上扩散三元组知识,帮助用户完成兴趣的扩展,实现多样化的个性推荐。同时,引入用户历史数据来控制多跳传播的随机性,并对题目的相似性判断加入表达式评价,实现增强个性化学习。一整套推荐架构流程可以解决初等数学题目个性化推荐的问题,摆脱传统的知识点标签,从题目的内容语义角度去分析题目特征,得到的个性化题目更加精准且多样。3、除此之外,本文还提出并实现了基于词嵌入语言模型BERT的题目推荐系统,从题目文本序列的角度去研究题目特征。对题库中的题目文本数据进行预处理,去除不定长表达式,并使用这些处理后的数据对BERT中文预训练模型进行微调得到MATH-BERT模型;将题目文本训练成固定长度的向量表示,通过向量之间的交互计算来得到相似题目。通过这样的手段来完成用户的个性化推荐,为初等数学题目推荐提供了另一种思路。最后,本文通过三个用户的数据对基于知识图谱的增强个性化学习推荐系统的各项功能进行测试,展示了系统实现的“同级扩散”、“多跳传播”以及“增强个性化学习”功能的最终实现效果。同时与使用语言模型BERT的个性化推荐系统测试做对比分析,验证了基于知识图谱的增强个性化学习推荐系统,对用户兴趣偏好扩展功能的完备实现。
基于知识图谱的实体关系补全方法研究及应用
这是一篇关于知识图谱,知识图谱补全,知识表示,初等数学的论文, 主要内容为随着互联网技术的迭代更新,越来越多的数据被存储于云服务器和个人终端设备上,不论是图片、视频、音频或是文本数据都是非结构化的,因此它们不能很好的被计算机识别或使用。知识图谱以结构化的形式保存数据,让计算机可以有效地应用这些数据,目前知识图谱在搜索引擎、问答系统、知识推理等领域已经成为了不可或缺的技术。但是知识图谱的构建与维护是一个漫长的工作,需要相关领域内的专家们不断地完善。因此知识图谱补全成为该领域的热门研究方向,它致力于预测缺失的实体与关系,自动完善知识图谱的结构,使其在下游应用中更好的发挥作用。它可以减少大量的人工标注工作,是现在知识图谱构建里一项重要的技术。本文基于初等数学自然语言理解系统,该系统的工作是将非结构化的数学题目理解为结构化的三元组表示。此系统因为设计以及实现上的限制导致了此过程存在知识表示上的缺失问题,因此,本文针对这些问题提出了两种知识图谱补全方法,目的是完善该系统对数学文本题目的知识表示。综上所述,本文的工作主要包含以下几个方面:(1)分析了初等数学自然语言理解系统中存在的知识表示缺失问题,主要存在两方面的知识无法抽取,第一个是文本题目中未提及的隐含实体无法抽取,第二个是关系标注数据集规模以及相似度阈值过高导致的正确关系无法被抽取。(2)提出了基于规则的实体自动补全方法,主要针对隐含实体进行补全。定义了实体补全规则的标准,设计了一个根据规则进行实体补全的框架,实现了对规则的解析以及三元组的自动生成。(3)提出了基于深度学习的关系自动补全方法,主要针对缺失的关系进行补全。设计并训练了一个深度学习模型,在该模型中,引入外部的实体嵌入向量增强实体表示。使用标注好的题目三元组样本训练模型,并将训练好的模型应用于数学知识图谱的补全任务中。(4)构建了融合实体自动补全方法与关系自动补全方法的知识图谱补全模块,应用于初等数学自然语言理解系统中,分别测试了两种补全方法补全的三元组正确率,其中实体自动补全方法的正确率在93%左右,关系自动补全方法的正确率在75%左右,该模块使整体系统的解题通过率提高了30%左右。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码码头 ,原文地址:https://m.bishedaima.com/lunwen/55130.html