基于卷积神经网络的知识图谱补全研究
这是一篇关于知识图谱,知识图谱补全,知识表示学习,卷积神经网络的论文, 主要内容为知识图谱是节点和边组成的语义网络,通常采用三元组(头实体,关系,尾实体)的形式表示知识,提供了结构化描述客观世界的能力,在搜索、智能助手等领域广泛应用。尽管现有的知识图谱包含了海量知识,但其完备性亟待改善。知识图谱补全旨在补全现有的知识图谱,提升其完备性,解决数据稀疏性问题,进而进行知识推理,挖掘隐含的知识。现有知识图谱补全模型通常采用知识表示学习的方法,利用知识图谱中的三元组结构信息,将实体与关系嵌入到低维稠密向量空间,得到实体和关系的向量表示,再进行知识图谱补全。除去三元组信息,知识图谱还包含着丰富的多源信息(如文本、图像)。根据利用的信息以及评分函数,现有知识图谱补全模型可以分为平移距离模型、语义匹配模型与融合多源信息的模型。平移距离模型结构简单,易于扩展,但对实体和关系之间复杂语义联系的拟合能力有限;语义匹配模型拟合能力强但复杂度高,可扩展能力低;融合多源信息的模型在融合多源信息时存在融合方法较为简单,目标信息利用程度较低。针对现有模型存在难以兼顾对实体和关系之间复杂语义联系的拟合能力与可扩展性问题,本文提出了面向三元组结构的知识图谱补全模型,即CNN-KG模型。该模型借助卷积神经网络强大的非线性表示能力、特征提取能力,提取实体和关系之间的隐含特征,高效利用三元组结构信息,提升实体和关系之间复杂语义联系的拟合能力,较好地兼顾了拟合能力与可扩展性。现有模型在利用实体描述等文本信息时,融合方法较为简单,信息利用程度较低。因此,本文提出了融合三元组结构与实体描述信息的模型,即CNN-DKG模型。该模型首先使用卷积神经网络对实体描述信息进行编码,得到基于描述的实体表示,随后利用TransE模型得到基于三元组结构的向量表示,最后采用卷积神经网络对二者进行融合,有效利用了实体描述信息。本文采用伯努利分布进行负采样,在WN18RR和FB15k-237两个数据集上通过Adam优化训练目标,通过实体预测、关系预测、三元组分类三个任务对模型的训练结果进行评价。实验结果表明,CNN-KG模型和CNN-DKG模型在平均排名、平均排序倒数、前10命中率和分类准确率等指标上均优于现有模型。
漏洞知识图谱的构建与知识管理系统的设计与实现
这是一篇关于漏洞知识图谱,漏洞知识检索,知识图谱补全,实体和关系抽取,数据可视化的论文, 主要内容为随着计算机软件技术的迅猛发展,软件的规模和复杂程度不断提高,不可避免地导致更多软件漏洞的发生。因此,漏洞的理解与修复成为了软件维护过程中不可或缺的重要环节。漏洞的修复要求开发者具备良好的网络安全和软件安全的知识储备,但并不是所有开发者都具备这一条件。因此,开发者往往需要通过检索漏洞数据库来学习与获取漏洞相关的知识。但是,目前缺少便捷易用的漏洞知识库,开发者往往需要前往不同的漏洞数据库或者开源软件管理系统去获取漏洞知识,并通过人工审计来判断哪些漏洞知识对其有帮助。这种手动检索与分析的过程大大增加了开发者对漏洞知识的学习成本。此外,碎片化存储的漏洞知识也使开发者难以建立不同漏洞知识之间的联系。针对上述问题,本文基于多源异构漏洞知识构建了软件漏洞知识图谱,并开发了软件漏洞知识管理系统,从而帮助开发者快速学习与检索漏洞相关的知识。首先,本文研究了多源异构漏洞知识的整合方法。本文先是设计了漏洞本体结构,然后在漏洞本体的指导下使用Scrapy网络爬虫框架挖掘原始漏洞数据。针对结构化的原始漏洞数据,采用基于规则的方法抽取实体和关系。针对非结构化的数据,通过词法分析器和语法分析器进行实体抽取。通过上述步骤,构建了漏洞知识图谱,并采用表示学习方法实现漏洞知识图谱的补全,最后基于Neo4j图数据库实现了知识图谱的存储。为了让开发者能够更方便快捷地对漏洞知识进行管理和检索,本文基于JavaWeb前端、SpringBoot、图数据库、d3.js数据可视化等技术,采用MVVC模式,设计并实现了一个基于C/S架构的漏洞知识管理系统。本文研究了漏洞知识图谱的可视化方案,并且针对不同规模的子图谱实现了一套通用的数据可视化方法,该系统借助力导向图和搜索算法,将用户感兴趣的实体和关系信息进行定制化动态可视化。同时,系统还允许用户通过人机交互实现对漏洞知识图谱中实体和关系的管理。此外,该系统为用户提供了三种搜索方法,分别是关键字搜索,高级搜索和相似搜索,支持用户以多种方式和多种条件搜索用户感兴趣的漏洞知识。最后,对漏洞知识管理系统进行了测试,测试结果表明该系统达到了预期目标,能够成为开发人员快速获取漏洞信息和学习漏洞知识的平台,并且为开发者管理图谱中的数据提供了便利渠道,具有一定的实用价值。
基于胶囊神经网络的知识图谱补全模型研究
这是一篇关于知识图谱,知识图谱补全,胶囊神经网络,知识表示学习的论文, 主要内容为知识图谱是由许多事实组成的语义网络,这些事实通常可以用三元组(头实体,关系,尾实体)的形式表示,其在搜索引擎、问答系统和智能助手等领域广泛应用。尽管目前的知识图谱包含了海量的信息,但是其依然存在大量的隐藏信息未被发掘。知识图谱补全的目的就是解决这一问题,发掘知识图谱中隐含的知识,提升知识图谱的完备性,从而提高知识图谱的准确率和效率。知识图谱补全的方法多种多样,其中大多数是采用的表示学习方法。近年来,由于深度学习的快速发展,有许多研究者利用卷积神经网络对知识进行表示学习。但是基于卷积神经网络的知识图谱补全模型存在两点缺陷:一是特征无关性,采用卷积神经网络无法捕获知识(实体和关系)向量中特征之间的关系;二是池化层信息损失,卷积神经网络池化过程会丢失知识向量的特征信息。此外,当前的许多知识表示学习模型中,实体向量与关系向量的特征交互数量不足,弱化了三元组中实体与关系的语义关系。针对卷积神经网络在知识图谱补全模型中存在的两点缺陷,本文提出了基于胶囊神经网络的知识图谱补全模型,即Caps-KGC模型。Caps-KGC模型利用胶囊神经元来封装实体向量和关系向量的特征,因此,相同胶囊中的特征能够互相关联。同时,该模型抛弃了池化层操作,采用动态路由算法传递胶囊层之间的信息,可以让知识向量中的特征信息全部传递到下一层。针对表示学习模型中实体向量与关系向量特征交互数量不足的问题,本文在Caps-KGC模型的基础上提出了基于改进的胶囊神经网络的知识图谱补全模型,即HCaps-KGC模型。HCaps-KGC模型引入了超网络的思想,利用关系向量构造卷积核来对实体向量进行特征提取。此外,HCaps-KGC模型还加入了一种增强实体向量特征的方法。本文最后对Caps-KGC和HCaps-KGC模型进行了实验,实验结果表明Caps-KGC模型在大多数评价指标上均优于现有模型,改进后的HCaps-KGC模型在各项评价指标上也有进一步的提高。
面向开放世界的知识图谱补全研究
这是一篇关于开放世界知识图谱,胶囊网络,异构信息网,GCN,链接预测,实体分类,知识图谱补全的论文, 主要内容为知识图谱是一种典型的多关系结构,由许多实体和关系组成。现有的知识图谱大多都非常稀疏,还不够完整。因此知识图谱补全任务应运而生,旨在通过原有知识图谱中的事实对那些可能存在的隐藏关系进行预测。常见的知识图谱补全方法,采用嵌入表示学习的模型借助三元组中实体、关系嵌入表示向量的近距离假设对隐藏关系进行预测。这类方法针对封闭世界知识图谱补全能发挥出较好的效用,但是针对开放世界知识图谱中的新实体类型与相关关系的预测效果较差。为此针对上述开放世界知识图谱补全中的问题,本文提出了一种面向开放世界知识图谱的胶囊网络模型Caps-OWKG。模型对原有知识图谱进行编码获得实体的结构性向量,又对实体的描述信息进行编码获得实体的描述性向量,将两种向量融合后得到新的表示向量,并经过胶囊网络处理后,获得三元组真实性的概率。Caps-OWKG通过新实体的描述信息作为桥梁与原始知识图谱建立联系,这种方法有效但还略显单一,没有更好的挖掘新实体与原始知识图谱的潜在关系。为此,本文构建了一个包括开放世界知识图谱中所有实体、关系和描述的异构信息网络,并提出了一种基于异构信息网络的知识图谱表示学习模型,利用图卷积神经网络对异构信息网中的节点进行编码,再利用两个不同的解码层完成新实体的分类和预测两个任务,实现对知识图谱的补全。
基于胶囊神经网络的知识图谱补全模型研究
这是一篇关于知识图谱,知识图谱补全,胶囊神经网络,知识表示学习的论文, 主要内容为知识图谱是由许多事实组成的语义网络,这些事实通常可以用三元组(头实体,关系,尾实体)的形式表示,其在搜索引擎、问答系统和智能助手等领域广泛应用。尽管目前的知识图谱包含了海量的信息,但是其依然存在大量的隐藏信息未被发掘。知识图谱补全的目的就是解决这一问题,发掘知识图谱中隐含的知识,提升知识图谱的完备性,从而提高知识图谱的准确率和效率。知识图谱补全的方法多种多样,其中大多数是采用的表示学习方法。近年来,由于深度学习的快速发展,有许多研究者利用卷积神经网络对知识进行表示学习。但是基于卷积神经网络的知识图谱补全模型存在两点缺陷:一是特征无关性,采用卷积神经网络无法捕获知识(实体和关系)向量中特征之间的关系;二是池化层信息损失,卷积神经网络池化过程会丢失知识向量的特征信息。此外,当前的许多知识表示学习模型中,实体向量与关系向量的特征交互数量不足,弱化了三元组中实体与关系的语义关系。针对卷积神经网络在知识图谱补全模型中存在的两点缺陷,本文提出了基于胶囊神经网络的知识图谱补全模型,即Caps-KGC模型。Caps-KGC模型利用胶囊神经元来封装实体向量和关系向量的特征,因此,相同胶囊中的特征能够互相关联。同时,该模型抛弃了池化层操作,采用动态路由算法传递胶囊层之间的信息,可以让知识向量中的特征信息全部传递到下一层。针对表示学习模型中实体向量与关系向量特征交互数量不足的问题,本文在Caps-KGC模型的基础上提出了基于改进的胶囊神经网络的知识图谱补全模型,即HCaps-KGC模型。HCaps-KGC模型引入了超网络的思想,利用关系向量构造卷积核来对实体向量进行特征提取。此外,HCaps-KGC模型还加入了一种增强实体向量特征的方法。本文最后对Caps-KGC和HCaps-KGC模型进行了实验,实验结果表明Caps-KGC模型在大多数评价指标上均优于现有模型,改进后的HCaps-KGC模型在各项评价指标上也有进一步的提高。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码码头 ,原文地址:https://m.bishedaima.com/lunwen/46233.html