航空安全事件知识图谱关系推演方法的研究
这是一篇关于航空安全事件,知识图谱,表示学习,规则学习,特征增强,关系推演的论文, 主要内容为知识图谱以图的方式有效组织和处理现实世界中的知识,基于知识图谱的航空安全事件管理能够有效提升航空安全管理水平。目前通用知识图谱和领域知识图谱的研究主要集中在知识图谱的构建方面,高质量的知识图谱及其应用的研究仍较少。因此,本文围绕知识图谱关系推演方法及其在航空安全领域的应用在以下方面进行了相关研究。在深入研究知识图谱关系推演方法的基础上,针对Iter E网络模型在表示学习过程中实体与关系之间相对独立,无法充分学习到实体与关系之间丰富的语义信息且规则学习效率较低的问题,提出了一种通过特征增强实体与关系相关性的知识图谱关系推演方法SIter E,该方法首先利用Simpl E方法学习知识图谱中的实体和关系,通过add方式对关系特征进行叠加使特征得到重用,有效提升了模型的泛化能力;其次依据OWL2的公理挖掘知识图谱的公理集,采用改进的评分机制进行公理评分,最后依据高分公理进行关系推演。实验结果表明,SIter E方法在公共数据集上均取得了更好的链接预测效果和更高的规则学习效率,能够学习到更多高质量的规则。针对目前构建的航空安全事件知识图谱质量低的问题,以航空安全网(ASN)的事故数据库系统中发布的历史事件为基础,分析航空安全领域数据集的特点并进行数据处理和参数选择,并将SIter E应用到航空安全事件知识图谱的关系推演中。实验结果表明,SIter E方法在航空安全领域数据集上的MRR、Hits@1、Hits@2、Hits@3指标上相对于Iter E方法有了显著的提升。在进一步挖掘出航空安全知识图谱中潜在关系的同时,不断改进了航空安全事件知识图谱的质量。
基于过滤的规则进行数据增强的知识图谱嵌入
这是一篇关于知识图谱,知识图谱嵌入,翻译模型,规则学习的论文, 主要内容为知识图谱如今已被广泛应用于个性化推荐系统、智能问答系统等领域,由于知识图谱的完整性极大地影响了我们后续对知识图谱的使用,而且知识图谱中的事实信息往往是不完整的,实体之间的一些显而易见的关系在原有的知识图谱中并不存在,因此我们需要对知识图谱进行补全。在进行知识图谱补全的方法中,表示学习方法占据了主流的地位,而在表示学习方法中,翻译模型是其中的代表模型,基于翻译模型的表示学习方法具有很高的可扩展性,且可以有效地评测实体之间复杂的语义信息和关系。数据的丰富程度对于表示学习模型来说至关重要,但已有知识图谱中往往存在了大量的稀疏实体,实体间的联系并不紧密,这就导致了表示学习模型无法准确地补全带有稀疏实体的三元组。传统的方法通过将规则学习的方法与表示学习的方法进行结合来缓解这一问题,但要求表示学习的模型需要满足线性映射假设,而翻译模型并不满足这一假设。为了解决这一问题,我们提出使用一种自底向上的规则学习算法来与翻译模型进行结合以增强翻译模型的表达能力的方法,即通过使用规则学习算法来生成增强数据以增强翻译模型。使用这种自底向上的规则学习算法时,其产生的规则置信度的定义也随之不同,当我们在进行三元组推断时,高置信度的规则产生的三元组大部分已经存在于原知识图谱中了,仅有少部分新三元组为有效三元组,而进行数据增强时,我们需要保证增强数据的数量。这一问题的存在使得我们不能简单地指定一个规则置信度的阈值来筛选规则和产生新三元组,为了解决这一问题,我们提出了一种基于规则置信度的规则筛选方法。同时,由于知识图谱中存在的稀疏实体与稀疏关系导致了表示学习模型对包含稀疏实体或稀疏关系的三元组的学习效果不足够好,我们又提出了着重增强包含稀疏实体或稀疏关系的三元组的方法。本文的主要贡献如下:(1)为了增强翻译模型链接预测的准确性,提出了使用自底向上的规则学习算法来产生高质量的规则,并使用中间模块来推断生成可靠的三元组,以增强翻译模型的表达能力。(2)鉴于自底向上的规则学习算法中对于规则置信度的定义和数据增强对于数据数量的要求,为了在产生新三元组的质量与数量之间达到一个平衡,我们对传统方法进行了改进,不像传统方法那样简单地规定一个置信度阈值来筛选规则,而是根据规则置信度降序遍历规则。(3)知识图谱中也存在稀疏关系,稀疏关系的存在使得传统模型对稀疏关系的链接预测效果不够理想,我们在已有方法着重增强包含稀疏实体三元组的基础上,同时增强包含稀疏关系的三元组。本文分别在WN18、FB15k、WN18RR、FB15k-237数据集上和多个模型上应用了本文提出的两种改进方法,并与不使用这两种方法的多个模型进行了对比。结果表明,这两种方法在三种类型的链接预测评价指标下整体优于原模型,一定程度上增强了翻译模型的表达效果。
面向电商知识图谱的规则学习模型研究
这是一篇关于规则学习,强化学习,知识图谱,表示学习的论文, 主要内容为规则学习是数据挖掘中应用前景广泛的领域,一直以来都备受关注。针对有特定数据结构的电商知识图谱的规则生成任务,流行的关联规则挖掘算法虽然应用简单且具有可解释性,但无法用于挖掘特定数据结构的关联规则。而目前主流的基于知识图谱的规则学习算法大都都针对分布均匀的稠密知识图谱,且其基于图遍历搜索的特性也让这类算法在大规模知识图谱上会遇到明显的效率问题。用于知识图谱推理的表示学习方法则大都侧重推理结果,无法生成对人友好的高质量推理规则。因此,本文针对电商领域的场景挂载规则生成的任务,从知识图谱的角度出发,将已有的商品的属性项P(Property)和属性值V(Value)及其对应场景构造成一个针对挂载关系的知识图谱。同时将挂载问题构造成链接预测问题,引入注意力机制,提出了一种基于知识图谱表示学习的规则学习模型,利用场景和挂载关系的表示得到商品属性的权重,从现有数据中生成规则,用于挂载新的商品,提高商品挂载的效率,降低人工成本。同时,本文也从强化学习的角度出发,将商品挂载问题构造成分类问题,将规则生成问题构造成序列决策问题,提出了一种基于强化学习的规则学习模型,训练一个智能体来选择规则的Body部分,在奖励函数中加入规则长度项以生成长度较短的规则。且由于商品数据序列长度较长,智能体需要探索的序列决策空间较大,为了让模型可以尽可能探索更多的空间,本文也应用了包括Rollouts,Reward Baseline以及加入信息熵在内的方法来帮助模型训练,取得了不错的效果。
大规模知识图谱的规则学习研究
这是一篇关于知识图谱,规则学习,链接预测的论文, 主要内容为随着人工智能技术取得了前所未有的发展,以知识图谱为代表的知识工程以及深度学习等相关领域得到了广泛的关注。知识图谱的概念最早是由谷歌于2012年正式提出的,它是新一代知识库,主要用来描述真实世界中存在的各种实体和概念,以及他们之间的关系。知识图谱能够弥补机器学习、深度学习算法的描述能力,规则等表示形式与神经网络相比是显性的知识,因此可基于此对学习的结果,例如链接预测,提供人类可理解的解释。本文针对规则学习,提出了一种针对大型知识图谱的、基于规则学习的链接预测的有效方法,提高链接预测任务的精度,进一步将知识图谱进行补全;除此之外,将学习到的规则从语义相似性和语义相关性的角度进行进一步拓展,增加学习到的规则数量。本文提出了大型知识图谱规则学习系统R-Linker,并基于规则进行链接预测和规则扩展,其具体研究内容与创新点在于以下几个方面:首先,针对规则学习部分,本文提出分层采样算法,并将采样过程与规则搜索过程有机结合,大大降低了系统在计算上的消耗,提高了系统的运行效率;利用向量嵌入优化得分函数,使得在保持向量嵌入信息量的同时减少中间计算量;将规则评估过程的计算过程与质量评估置信度结合,提出针对规则头部评估的优化措施。其次,基于规则学习的结果,提出基于规则推理的链接预测方法,并且将规则进一步进行语义扩展,创新性的结合基于嵌入的方法和传统的归纳逻辑编程的思想,挖掘语义相似性和相关性高的关系进行规则原子的替换,从而生成更多的高质量规则。由实验结果验证可知,R-Linker相较当前最先进的规则学习系统,在系统的运行效率、规则的数量以及链接预测任务的准确率上体现出了较明显的优势。
基于过滤的规则进行数据增强的知识图谱嵌入
这是一篇关于知识图谱,知识图谱嵌入,翻译模型,规则学习的论文, 主要内容为知识图谱如今已被广泛应用于个性化推荐系统、智能问答系统等领域,由于知识图谱的完整性极大地影响了我们后续对知识图谱的使用,而且知识图谱中的事实信息往往是不完整的,实体之间的一些显而易见的关系在原有的知识图谱中并不存在,因此我们需要对知识图谱进行补全。在进行知识图谱补全的方法中,表示学习方法占据了主流的地位,而在表示学习方法中,翻译模型是其中的代表模型,基于翻译模型的表示学习方法具有很高的可扩展性,且可以有效地评测实体之间复杂的语义信息和关系。数据的丰富程度对于表示学习模型来说至关重要,但已有知识图谱中往往存在了大量的稀疏实体,实体间的联系并不紧密,这就导致了表示学习模型无法准确地补全带有稀疏实体的三元组。传统的方法通过将规则学习的方法与表示学习的方法进行结合来缓解这一问题,但要求表示学习的模型需要满足线性映射假设,而翻译模型并不满足这一假设。为了解决这一问题,我们提出使用一种自底向上的规则学习算法来与翻译模型进行结合以增强翻译模型的表达能力的方法,即通过使用规则学习算法来生成增强数据以增强翻译模型。使用这种自底向上的规则学习算法时,其产生的规则置信度的定义也随之不同,当我们在进行三元组推断时,高置信度的规则产生的三元组大部分已经存在于原知识图谱中了,仅有少部分新三元组为有效三元组,而进行数据增强时,我们需要保证增强数据的数量。这一问题的存在使得我们不能简单地指定一个规则置信度的阈值来筛选规则和产生新三元组,为了解决这一问题,我们提出了一种基于规则置信度的规则筛选方法。同时,由于知识图谱中存在的稀疏实体与稀疏关系导致了表示学习模型对包含稀疏实体或稀疏关系的三元组的学习效果不足够好,我们又提出了着重增强包含稀疏实体或稀疏关系的三元组的方法。本文的主要贡献如下:(1)为了增强翻译模型链接预测的准确性,提出了使用自底向上的规则学习算法来产生高质量的规则,并使用中间模块来推断生成可靠的三元组,以增强翻译模型的表达能力。(2)鉴于自底向上的规则学习算法中对于规则置信度的定义和数据增强对于数据数量的要求,为了在产生新三元组的质量与数量之间达到一个平衡,我们对传统方法进行了改进,不像传统方法那样简单地规定一个置信度阈值来筛选规则,而是根据规则置信度降序遍历规则。(3)知识图谱中也存在稀疏关系,稀疏关系的存在使得传统模型对稀疏关系的链接预测效果不够理想,我们在已有方法着重增强包含稀疏实体三元组的基础上,同时增强包含稀疏关系的三元组。本文分别在WN18、FB15k、WN18RR、FB15k-237数据集上和多个模型上应用了本文提出的两种改进方法,并与不使用这两种方法的多个模型进行了对比。结果表明,这两种方法在三种类型的链接预测评价指标下整体优于原模型,一定程度上增强了翻译模型的表达效果。
基于规则学习和推演的知识图谱补全
这是一篇关于知识图谱,知识图谱补全,规则学习,逻辑规则推演的论文, 主要内容为随着知识图谱(Knowledge Graph,KG)在许多任务和领域的广泛应用,大多数KG还在快速发展并且亟需充分发掘实体之间的关系。近年来,科研人员将KG嵌入到不同的向量空间中,通过向量计算发掘潜在的关系,或利用神经网络对KG中缺失的关系或实体进行预测。传统的方法需要前期使用大量的训练数据进行模型训练以保证表示和补全精度,然而现实世界中,KG能提供的知识或数据在规模上并不统一。如何在仅有少量训练数据的情形下对KG中缺失的关系或实体进行补全,提高KG补全的准确性和可靠性成为当前研究的热点。KG基于语义网发展而来,利用KG本体规则可以直接、有效的表示出KG中所蕴含的知识。在学习本体规则的过程中需要学习规则的结构和内容,结构学习复杂而且耗时间,内容学习过程通常采用完全遍历的方法以保证规则学习的覆盖率,然而大大增加了学习时间。在获得与KG有关的规则后,需要有效的策略从规则中挖掘新知识为KG补全提供帮助。本文的研究内容概括如下:(1)通过扩展Horn规则和逻辑规则推导,定义了适用于KG的本体规则作为基本规则,并提出基于规则学习和推演进行KG补全的框架RuleB。(2)针对遍历KG学习规则需要消耗大量时间的问题,提出了一种随机游走和范围遍历相结合的规则学习算法(Random Walk K-sized,RWK)。为了进一步解决RWK不能保证规则覆盖率的问题,基于Bloom Filter提出一种能在降低学习时间的同时保证规则学习覆盖率的方法。(3)利用从KG中学习到的规则,提出了一种通过推演产生新规则并利用新规则获取新知识的策略,最终将获取的新知识用于KG补全。(4)基于真实数据集测试了利用RuleB的规则学习方法的效率,以及KG补全的精度、召回率和F1值,实验结果表明,本文提出的方法在仅有少量数据情形下能有效地提升KG补全精度。
基于不确定知识图谱的规则学习与推理技术研究
这是一篇关于知识图谱,不确定性,表示学习,规则学习,规则推理的论文, 主要内容为近年来,知识图谱在许多知识驱动的人工智能应用中起到越来越重要的作用。然而随着知识图谱的规模不断增大,人工构造图谱的方式已经难以满足需求,许多自动化的图谱构建步骤如实体链接、关系抽取等被引入图谱构建过程,这些方法相较于人工标注方式其正确性难以保证,这使得图谱中的数据具有不确定性。不确定知识图谱通过给三元组附加置信度来表征一个事实为真的概率,从而描述这种不确定性。规则学习与推理方法由于具有较强的可解释性,在许多应用中有着不可替代的作用。然而当前规则学习与推理方法通常针对确定性知识图谱设计,没有考虑噪声和不确定性,导致其在不确定知识图谱中学习到的规则质量较低,不能很好地进行图谱的推理补全。为了解决以上问题,本文提出一种新的不确定知识图谱规则学习与推理方法。该方法以不确定知识图谱表示学习为基础,首先将不确定知识图谱中的结构语义信息、置信度信息、关系逻辑信息嵌入到表示向量中;然后在规则学习过程中利用表示向量辅助规则生成,从而降低不确定性对于规则学习的干扰;在规则推理中,通过学习规则的变量特征向量来描述规则应用范围,从而将规则和实例的匹配程度也加入规则推理的考虑当中。本文的主要贡献如下:(1)提出了一个不确定知识图谱表示学习与规则编码评估方法。通过该方法,实体与关系的表示向量可以同时嵌入不确定知识图谱的结构语义信息、置信度信息以及关系的逻辑性质,用于支持后续规则学习与推理过程。此外,本文还提出一种基于注意力机制的规则编码及评估方法,通过注意力权重和关系表示向量编码规则语义,并实现对规则质量的评分从而指导规则学习。(2)提出了一种迭代式的不确定知识图谱规则学习与推理方法。方法主要由三个模块构成:首先,规则生成器基于不确定知识图谱表示向量,生成候选逻辑规则;接着,规则变量学习器通过采样和归纳的方式学习规则的变量特征向量,用于描述规则的适用范围;最后,规则推理器利用规则及规则的变量特征向量进行图谱的推理补全,并在推理补全中筛选高质量的规则用于规则生成器的迭代训练。(3)实验验证:本文围绕所研究的不确定知识图谱补全任务,对提出的方法进行了实现,并在四个不确定知识图谱数据集上进行了实验验证。实验包含了总体对比实验以及具体消融分析等内容,实验结果表明,本文提出的方法在四个数据集上均优于现有相关方法。从实践层面,本研究可以有效支持许多对可解释性、精确性要求较高的应用,如军事决策、医药研发等。从理论层面,本研究也是对符号-神经联合推理方法的有益探索。
大规模知识图谱的规则学习研究
这是一篇关于知识图谱,规则学习,链接预测的论文, 主要内容为随着人工智能技术取得了前所未有的发展,以知识图谱为代表的知识工程以及深度学习等相关领域得到了广泛的关注。知识图谱的概念最早是由谷歌于2012年正式提出的,它是新一代知识库,主要用来描述真实世界中存在的各种实体和概念,以及他们之间的关系。知识图谱能够弥补机器学习、深度学习算法的描述能力,规则等表示形式与神经网络相比是显性的知识,因此可基于此对学习的结果,例如链接预测,提供人类可理解的解释。本文针对规则学习,提出了一种针对大型知识图谱的、基于规则学习的链接预测的有效方法,提高链接预测任务的精度,进一步将知识图谱进行补全;除此之外,将学习到的规则从语义相似性和语义相关性的角度进行进一步拓展,增加学习到的规则数量。本文提出了大型知识图谱规则学习系统R-Linker,并基于规则进行链接预测和规则扩展,其具体研究内容与创新点在于以下几个方面:首先,针对规则学习部分,本文提出分层采样算法,并将采样过程与规则搜索过程有机结合,大大降低了系统在计算上的消耗,提高了系统的运行效率;利用向量嵌入优化得分函数,使得在保持向量嵌入信息量的同时减少中间计算量;将规则评估过程的计算过程与质量评估置信度结合,提出针对规则头部评估的优化措施。其次,基于规则学习的结果,提出基于规则推理的链接预测方法,并且将规则进一步进行语义扩展,创新性的结合基于嵌入的方法和传统的归纳逻辑编程的思想,挖掘语义相似性和相关性高的关系进行规则原子的替换,从而生成更多的高质量规则。由实验结果验证可知,R-Linker相较当前最先进的规则学习系统,在系统的运行效率、规则的数量以及链接预测任务的准确率上体现出了较明显的优势。
基于过滤的规则进行数据增强的知识图谱嵌入
这是一篇关于知识图谱,知识图谱嵌入,翻译模型,规则学习的论文, 主要内容为知识图谱如今已被广泛应用于个性化推荐系统、智能问答系统等领域,由于知识图谱的完整性极大地影响了我们后续对知识图谱的使用,而且知识图谱中的事实信息往往是不完整的,实体之间的一些显而易见的关系在原有的知识图谱中并不存在,因此我们需要对知识图谱进行补全。在进行知识图谱补全的方法中,表示学习方法占据了主流的地位,而在表示学习方法中,翻译模型是其中的代表模型,基于翻译模型的表示学习方法具有很高的可扩展性,且可以有效地评测实体之间复杂的语义信息和关系。数据的丰富程度对于表示学习模型来说至关重要,但已有知识图谱中往往存在了大量的稀疏实体,实体间的联系并不紧密,这就导致了表示学习模型无法准确地补全带有稀疏实体的三元组。传统的方法通过将规则学习的方法与表示学习的方法进行结合来缓解这一问题,但要求表示学习的模型需要满足线性映射假设,而翻译模型并不满足这一假设。为了解决这一问题,我们提出使用一种自底向上的规则学习算法来与翻译模型进行结合以增强翻译模型的表达能力的方法,即通过使用规则学习算法来生成增强数据以增强翻译模型。使用这种自底向上的规则学习算法时,其产生的规则置信度的定义也随之不同,当我们在进行三元组推断时,高置信度的规则产生的三元组大部分已经存在于原知识图谱中了,仅有少部分新三元组为有效三元组,而进行数据增强时,我们需要保证增强数据的数量。这一问题的存在使得我们不能简单地指定一个规则置信度的阈值来筛选规则和产生新三元组,为了解决这一问题,我们提出了一种基于规则置信度的规则筛选方法。同时,由于知识图谱中存在的稀疏实体与稀疏关系导致了表示学习模型对包含稀疏实体或稀疏关系的三元组的学习效果不足够好,我们又提出了着重增强包含稀疏实体或稀疏关系的三元组的方法。本文的主要贡献如下:(1)为了增强翻译模型链接预测的准确性,提出了使用自底向上的规则学习算法来产生高质量的规则,并使用中间模块来推断生成可靠的三元组,以增强翻译模型的表达能力。(2)鉴于自底向上的规则学习算法中对于规则置信度的定义和数据增强对于数据数量的要求,为了在产生新三元组的质量与数量之间达到一个平衡,我们对传统方法进行了改进,不像传统方法那样简单地规定一个置信度阈值来筛选规则,而是根据规则置信度降序遍历规则。(3)知识图谱中也存在稀疏关系,稀疏关系的存在使得传统模型对稀疏关系的链接预测效果不够理想,我们在已有方法着重增强包含稀疏实体三元组的基础上,同时增强包含稀疏关系的三元组。本文分别在WN18、FB15k、WN18RR、FB15k-237数据集上和多个模型上应用了本文提出的两种改进方法,并与不使用这两种方法的多个模型进行了对比。结果表明,这两种方法在三种类型的链接预测评价指标下整体优于原模型,一定程度上增强了翻译模型的表达效果。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码工厂 ,原文地址:https://m.bishedaima.com/lunwen/56243.html