基于知识图谱的几何问题自动求解系统设计与实现
这是一篇关于知识图谱,自动解题,Neo4j,初等数学的论文, 主要内容为近年来对知识图谱的研究越来越火热,随着知识图谱在各行各业中的应用越来越广泛,大家对领域知识图谱也越来越关注。其中,教育领域的知识图谱将会是知识图谱研究的一个重要方向,本论文的研究目标是设计实现一个基于知识图谱几何问题的自动求解系统。主要研究内容如下:构建初等数学领域的概念知识图谱。知识获取是要获取初等数学领域的知识,本文知识的来源主要是目前初中、高中的数学科目的教材,同时参考教辅书籍和互联网上相关的信息。接着是实体和关系的抽取,因为该知识图谱主要是为了给后面的自动求解系统作为基础的,而数学的解题需要有准确的信息,目前自动或半自动生成知识图谱的方法达不到我们需要的准确度要求,因此采用的是用人工的方式提取其中的实体和关系。知识表示采用的是利用JAVA语言中的类来表示实体和关系,每一个实体对应一个实体类,每一类关系对应一个关系类。知识存储用的是图数据库Neo4j,编写一个知识图谱转换模块将实体类和关系类分别转换成节点和关系存储在Neo4j中。知识可视化是利用Neo4j的可视化功能来实现的。设计实现几何问题的自动求解系统。该系统是基于知识图谱的,一共有三种类型的知识图谱,分别为:概念知识图谱,题目知识图谱,实例知识图谱。概念知识图谱前面已经介绍过了,题目知识图谱是由具体的几何题目生成的知识图谱,实例知识图谱是具体的实例生成的知识图谱,类似于规则。这两个知识图谱的知识分别来源于题目和输入的条件、结论描述,实体关系的提取都是自然语言处理,知识表示都是JAVA语言中的类对象,实体和关系分别对应Entity类和Relation类,知识存储和知识可视化分别Neo4j和Neo4j的可视化功能。解题的方法是将实例知识图谱放入实例知识图谱库中,让题目知识图谱和库中的实例知识图谱互相匹配对比,对比的是三元组,查看题目知识图谱中是否包含了所有的实例知识图谱中的条件三元组,如果是题目知识图谱就会按照实例知识图谱中的结论三元组进行扩充,匹配对比结束的条件是所有实例图谱都匹配完或者是产生题目需要的实体(关系)或者是超时。概念知识图谱有实体409个,关系3398条,解题率为61.5%。基本完成初期系统所设置的目标。
数学自然语言处理中新定义的理解及其应用研究
这是一篇关于中文自然语言处理,初等数学,新定义问题,未登录词的论文, 主要内容为自然语言处理(Natural Language Process,NLP)是一种让计算机尝试学会理解和处理人类口语或书面语的计算机技术。它与基于语言理解的语言学相关,在人工智能领域中占据了重要的地位,是众多科研学者研究的方向之一。中文初等数学自然语言处理作为中文NLP的一个垂直领域,一方面有着相当规范化的语言结构;另一方面属于中文名词与英文数学符号组合而成的中英文混合语言,对文本解析的准确度有着严格的要求。目前,初等数学中基于新的定义构造新词的新定义问题已成为教学的重点和难点。而且在数学文本中,有些词语可能并不在规范的数学词库中。在自然语言处理中,上述两种词语统称为新定义的未登录词。新定义的未登录词因为属于词库之外的词语,具有新的含义,对其的自然语言处理比一般NLP的实现难度更大。所以,如何在初等数学领域中完成新定义的理解及其应用研究,是本文的主要目的。本文研究内容主要包括以下两点:1.基于初等数学文本中英文混合的特点,本文采用实体二元组和关系三元组的知识表示方法,利用知识图谱与哈工大的LTP模型实现了一个自然语言处理模型Math NER。在新定义问题方面,采用了“看找代解”四步法设计了新定义解析模块接口来理解和解决新定义问题。最终的Math NER模型可以实现包含新定义问题在内的初等数学文本的自然语言理解,具有解析时间短、纠错性良好的特点,在有关的新定义测试集上获得了83.3%的前端理解准确率和64.8%的后端解题分值,且第三方测试中解决包含新定义问题的压轴数列题的效果比起原项目提升了100%。2.在发现未登录词方面,本文设计了一种基于深度学习的序列标注模型Math Seq和基于文本的信息熵原理的无监督模型Word Extract。两个模型可以主动地发现未登录词以达到扩充词库的目的,具有召回率高和可迁移性强的特点,在有关数据集上分别获取了785个和1280个未登录词。同时本文将Math Seq模型与Math NER模型进行了融合,在新定义测试集中发现了35.7%的未登录词以及报告了70%的错误分词,进一步提升了MathNER模型的泛化能力和解析效果。
基于知识图谱的初等数学关系抽取及其应用
这是一篇关于知识图谱,关系抽取,指代消解,初等数学,关系标注的论文, 主要内容为近年来,随着人工智能领域突飞猛进,深度学习技术为自然语言处理各个方向带来了极大的发展。借助自然语言处理技术和深度学习算法,人们可以从文本中抽取出结构化信息。从数学文本中抽取知识并通过知识的推理实现类人答题的目标成为一些国内外学者研究的方向,其中初等数学关系抽取成为重要研究方向之一。依赖前人的工作和研究成果,本文将知识图谱应用到初等数学关系抽取的研究上。本文主要研究内容有:1.本文提出了一种基于文本特征向量和数学概念知识图谱的关系抽取算法。基于该算法设计了一个初等数学关系抽取系统,该算法采用的思想是如果两个文本相似,那么文本包含的对应实体也拥有相似的实体关系。进一步采用BERT获取文本特征,利用待匹配文本的特征与关系库中的文本特征进行相似度计算,再之有选择的保留来自关系库文本包含的三元组,然后进行知识图谱关系剪枝去除匹配到的不合理的三元组,最终得到关系抽取的结果。2.文本构建了一个初等数学关系标注平台。利用该关系标注平台可以让更多的人参与关系数据的标注,能够更快的、更方便的增加关系库数据,为提高关系抽取的准确率提供了极大的帮助;同时标注的数据构建了一个数学文本关系库,存储了数学文本及其包含的实体关系三元组,它是结构化的数据。因此方便关系抽取系统三元组数据的加载以及关系标注平台数据快速存储。3.本文提出了在初等数学领域中长距离实体依赖问题的解决方案。为了降低关系抽取系统的复杂度,将数学文本按照一定的原则划分成多个短文本,并尽量保证短文本内的实体关系相对完整,但遇到了实体跨多个短文本进行关系抽取问题。提出了在标注数据时使用实体占位符以及跨文本关系抽取时采用最短距离匹配原则的方案来解决该问题,并且该方案也解决了初等数学领域中的指代问题。基于上述方案,本文设计并实现初等数学关系抽取系统,并将该系统应用到“初等数学类人答题关键技术及系统”项目中。本文构建的初等数学关系库中包含的不同数学短句有5623个,实体三元组10875个。为了对系统进行综合测试,本文随机从初等数学题库中选取了1000道数学题目,系统抽取三元组正确率为95.6%。
基于知识图谱的初等数学关系抽取及其应用
这是一篇关于知识图谱,关系抽取,指代消解,初等数学,关系标注的论文, 主要内容为近年来,随着人工智能领域突飞猛进,深度学习技术为自然语言处理各个方向带来了极大的发展。借助自然语言处理技术和深度学习算法,人们可以从文本中抽取出结构化信息。从数学文本中抽取知识并通过知识的推理实现类人答题的目标成为一些国内外学者研究的方向,其中初等数学关系抽取成为重要研究方向之一。依赖前人的工作和研究成果,本文将知识图谱应用到初等数学关系抽取的研究上。本文主要研究内容有:1.本文提出了一种基于文本特征向量和数学概念知识图谱的关系抽取算法。基于该算法设计了一个初等数学关系抽取系统,该算法采用的思想是如果两个文本相似,那么文本包含的对应实体也拥有相似的实体关系。进一步采用BERT获取文本特征,利用待匹配文本的特征与关系库中的文本特征进行相似度计算,再之有选择的保留来自关系库文本包含的三元组,然后进行知识图谱关系剪枝去除匹配到的不合理的三元组,最终得到关系抽取的结果。2.文本构建了一个初等数学关系标注平台。利用该关系标注平台可以让更多的人参与关系数据的标注,能够更快的、更方便的增加关系库数据,为提高关系抽取的准确率提供了极大的帮助;同时标注的数据构建了一个数学文本关系库,存储了数学文本及其包含的实体关系三元组,它是结构化的数据。因此方便关系抽取系统三元组数据的加载以及关系标注平台数据快速存储。3.本文提出了在初等数学领域中长距离实体依赖问题的解决方案。为了降低关系抽取系统的复杂度,将数学文本按照一定的原则划分成多个短文本,并尽量保证短文本内的实体关系相对完整,但遇到了实体跨多个短文本进行关系抽取问题。提出了在标注数据时使用实体占位符以及跨文本关系抽取时采用最短距离匹配原则的方案来解决该问题,并且该方案也解决了初等数学领域中的指代问题。基于上述方案,本文设计并实现初等数学关系抽取系统,并将该系统应用到“初等数学类人答题关键技术及系统”项目中。本文构建的初等数学关系库中包含的不同数学短句有5623个,实体三元组10875个。为了对系统进行综合测试,本文随机从初等数学题库中选取了1000道数学题目,系统抽取三元组正确率为95.6%。
基于知识图谱的推荐算法在问答系统中的研究及应用
这是一篇关于初等数学,知识图谱,推荐算法,问答系统的论文, 主要内容为教育一直是国家发展的基石,而数学作为所有学科的基础,国家、教师、家长一直在不断加强对学生数学学科的教学。随着科学技术的发展和智能终端的普及,在线教学的模式开始出现在人们视野之中,一大批学生已经在网上开始自主学习。同时在近几年人工智能飞速发展的背景下,各种个性化智能教学软件逐步流行起来。这些教学系统能够为学生制定个性化的学习方案,自动对学生学习进程中的差异性进行处理,让学生能够在没有老师和家长的辅导下独立学习。在本文中研究的是初等数学领域的智能教学系统,这个教学系统以知识点为基础,通过加强学生对数学知识点的理解,让学生掌握数学多种概念的定义和关系,掌握数学解题的关键和技巧,发现数学解题的规律,从而提升学生的数学成绩。在文本中,通过参考多方权威资料,从知识点的分类、知识点的属性、知识点之间的关系三个维度出发,构建了一个比较完整并且清晰的多维度的数学知识图谱。在该知识图谱中,一共包含有721个数学知识点和786个数学关系。在建立的知识图谱的基础上,本文提出了四种与知识点相关的问答形式,每种问答形式都能够让学生从不同角度来理解知识点、练习知识点。四种问答形式分别为根据题目推荐相关知识点、根据题目推荐相似题目、根据知识点推荐相关题目、根据知识点推荐相关知识点。在这四种推荐形式中,题目到知识点的推荐至关重要,本文使用的推荐算法是基于向量空间的文本相似度计算方法,首先采用了一万多道数学题目对BERT词向量模型进行训练,再使用了余弦相似度来计算题目与知识点之间的匹配程度。在本文研究的系统的帮助下,学生可以随时将理解不清晰的知识点或者不会解的数学题目以合适的问答形式输入到系统中,系统能够立即返回该知识点的局部知识图谱或者相关题目,通过这种自主学习的方式,学生能够不断促进自我进步,达到举一反三,融会贯通。在文本构建的系统中,本文使用了500道数学题目对系统进行了测试,其中题目推荐单个知识点的平均准确率达到85%以上,知识点推荐相关题目的准确率达到88%。从测试的过程和结果可以看出,本文构建的系统能够稳定运行,并且对实际的运用也具有一定的价值。
基于知识图谱的初等数学关系抽取及其应用
这是一篇关于知识图谱,关系抽取,指代消解,初等数学,关系标注的论文, 主要内容为近年来,随着人工智能领域突飞猛进,深度学习技术为自然语言处理各个方向带来了极大的发展。借助自然语言处理技术和深度学习算法,人们可以从文本中抽取出结构化信息。从数学文本中抽取知识并通过知识的推理实现类人答题的目标成为一些国内外学者研究的方向,其中初等数学关系抽取成为重要研究方向之一。依赖前人的工作和研究成果,本文将知识图谱应用到初等数学关系抽取的研究上。本文主要研究内容有:1.本文提出了一种基于文本特征向量和数学概念知识图谱的关系抽取算法。基于该算法设计了一个初等数学关系抽取系统,该算法采用的思想是如果两个文本相似,那么文本包含的对应实体也拥有相似的实体关系。进一步采用BERT获取文本特征,利用待匹配文本的特征与关系库中的文本特征进行相似度计算,再之有选择的保留来自关系库文本包含的三元组,然后进行知识图谱关系剪枝去除匹配到的不合理的三元组,最终得到关系抽取的结果。2.文本构建了一个初等数学关系标注平台。利用该关系标注平台可以让更多的人参与关系数据的标注,能够更快的、更方便的增加关系库数据,为提高关系抽取的准确率提供了极大的帮助;同时标注的数据构建了一个数学文本关系库,存储了数学文本及其包含的实体关系三元组,它是结构化的数据。因此方便关系抽取系统三元组数据的加载以及关系标注平台数据快速存储。3.本文提出了在初等数学领域中长距离实体依赖问题的解决方案。为了降低关系抽取系统的复杂度,将数学文本按照一定的原则划分成多个短文本,并尽量保证短文本内的实体关系相对完整,但遇到了实体跨多个短文本进行关系抽取问题。提出了在标注数据时使用实体占位符以及跨文本关系抽取时采用最短距离匹配原则的方案来解决该问题,并且该方案也解决了初等数学领域中的指代问题。基于上述方案,本文设计并实现初等数学关系抽取系统,并将该系统应用到“初等数学类人答题关键技术及系统”项目中。本文构建的初等数学关系库中包含的不同数学短句有5623个,实体三元组10875个。为了对系统进行综合测试,本文随机从初等数学题库中选取了1000道数学题目,系统抽取三元组正确率为95.6%。
图神经网络可解释性的研究与应用
这是一篇关于图神经网络,可解释性,初等数学,自动解题的论文, 主要内容为近几年,图神经网络的研究方兴未艾,在诸如知识图谱、社交网络、生物和化学等领域取得了卓越的效果。人们在享受它高效能力的同时,也在从各个方面对其可解释性进行研究,致力于探明其内部决策的机理。数学知识的推理由于知识的标准化、描述的规范化和使用图谱化形式进行推理,与图神经网络具有高度的契合性。因此将图神经网络与数学自动推理系统相结合,可以极大提升系统的学习和推理能力。针对其可解释性进行研究,能够使推理的过程更加透明,令系统更加“类人”。本文将图神经网络的可解释性基于输入的相关性分为两个类别:输入无关的模型级别可解释性和输入相关的实例级别可解释性,并将它们应用于“初等数学类人解题系统”中的知识表示和实例化定理选取。本文的主要工作如下所示:(1)将初等数学知识的表示学习分解为实体关系的嵌入学习和表达式的嵌入学习。对Trans E的计算可解释性进行了研究分析,然后将其应用于实体关系三元组的嵌入表示的学习之中。收集204762条数学三元组,对训练得到的实体关系向量设计基于计算可解释性的分析方法,验证其良好的基于距离的嵌入效果,在计算相近性的实验上准确率为62.78%。(2)对于数学表达式的表示学习,提出了更加符合数学知识的表达式置换等价任务,并构造相应的数据集,生成945882条数据。对BERT的结构可解释性进行探讨,然后应用在数学表达式置换等价任务的训练之上,训练准确率为94.52%。基于注意力结构和置换等价任务目的对训练结果的解释性进行分析探讨,证明表达式向量的有效性。(3)搭建图卷积网络,结合实体关系嵌入向量和表达式的嵌入向量作为节点特征表示,应用于题目图谱和实例化定理图谱的匹配之中。构造3892条数据,测试准确率为73.52%。为探究模型对输入中不同三元组的侧重程度,设计了对数学题目图谱进行扰动的解释性研究方法。然后进行实验并分析,探讨模型的学习效果。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设客栈 ,原文地址:https://m.bishedaima.com/lunwen/48867.html