5个研究背景和意义示例,教你写计算机跨语言实体对齐论文

今天分享的是关于跨语言实体对齐的5篇计算机毕业论文范文, 如果你的论文涉及到跨语言实体对齐等主题,本文能够帮助到你 多模态跨语言实体对齐的方法研究 这是一篇关于知识图谱

今天分享的是关于跨语言实体对齐的5篇计算机毕业论文范文, 如果你的论文涉及到跨语言实体对齐等主题,本文能够帮助到你

多模态跨语言实体对齐的方法研究

这是一篇关于知识图谱,异质性,跨语言实体对齐,等价实体,实体筛选的论文, 主要内容为虽然知识图谱的发展日益成熟,但是随着大量异质知识图谱的出现使得实体对齐成为知识图谱研究不可或缺的重要技术之一。语言多种多样、质量参差不齐、数据模态不一是导致知识图谱异质性的主要原因。因此,需要通过跨语言实体对齐技术整合异质知识图谱,从而形成一个大规模、高质量、多语言、多模态的知识图谱,进而为基于知识图谱的相关研究提供有力支持。即便现有方法在跨语言实体对齐任务中取得了不错的结果,但是仍旧存在着等价实体在对齐过程中产生噪声,导致实体对齐的准确率难以提升的问题。因此,提出一种邻居实体筛选规则,用来筛除冗余的等价邻居实体,以确保对齐实体的质量。同时为了降低噪声的干扰,进一步优化了实体筛选规则,并且结合了实体描述信息与图像信息实现跨语言的实体对齐。在公共数据集上,本文与现有的跨语言实体对齐方法进行了比较,实验结果表明,本文提出的方法均有效改善了实体对齐效果。本文主要做了以下研究工作。1)设计一种基于对偶关系图与邻居实体筛选的跨语言实体对齐方法。针对等价邻居实体问题,提出一种基于实体名称和属性的邻居实体筛选规则,用以筛除冗余的等价邻居实体。同时,为了避免实体属性可能不足的情况,为实体筛选带来困扰,本文通过构建对偶关系图作为辅助证据完成实体筛选,并且利用对偶关系图来加强实体之间的紧密联系,使得实体的邻居信息得到充分利用。2)设计一种基于实体假设替换的优化邻居实体筛选方法。现实语料库中,两个名称相同的实体,它们的属性信息可能相似或者存在包含关系,通常这种情况便认为两个实体是等价的,然而事实上未必等价。因此,基于这种情况,本文提出一种优化的邻居实体筛选策略。通过假设两个实体等价,然后替换它们在知识图谱中的位置,并结合邻居实体信息判断替换实体后的知识图谱结构是否成立,最后,通过对比替换前后实体的邻域特征向量是否相似来判断两个实体等价与否。3)设计一种基于实体描述与图像的跨语言实体对齐方法。利用脉冲耦合神经网络抽取实体描述中隐含的关系,然后结合实体名称、属性和预对齐实体对进行迭代交互,从而实现初步对齐。利用图像特征提取方法提取图像特征知识,并通过图像特征投影实现降维处理,然后与实体描述特征向量结合。通过关系聚合网络来聚合所捕获到的实体的每一层邻居输出特征向量,然后利用预对齐实体对指导对齐,并通过计算两个实体的输出特征向量的相似度来判断两个实体是否可以对齐,最后将两次对齐的结果进行对比,并且以最小值作为最终的对齐结果。

多模态跨语言实体对齐的方法研究

这是一篇关于知识图谱,异质性,跨语言实体对齐,等价实体,实体筛选的论文, 主要内容为虽然知识图谱的发展日益成熟,但是随着大量异质知识图谱的出现使得实体对齐成为知识图谱研究不可或缺的重要技术之一。语言多种多样、质量参差不齐、数据模态不一是导致知识图谱异质性的主要原因。因此,需要通过跨语言实体对齐技术整合异质知识图谱,从而形成一个大规模、高质量、多语言、多模态的知识图谱,进而为基于知识图谱的相关研究提供有力支持。即便现有方法在跨语言实体对齐任务中取得了不错的结果,但是仍旧存在着等价实体在对齐过程中产生噪声,导致实体对齐的准确率难以提升的问题。因此,提出一种邻居实体筛选规则,用来筛除冗余的等价邻居实体,以确保对齐实体的质量。同时为了降低噪声的干扰,进一步优化了实体筛选规则,并且结合了实体描述信息与图像信息实现跨语言的实体对齐。在公共数据集上,本文与现有的跨语言实体对齐方法进行了比较,实验结果表明,本文提出的方法均有效改善了实体对齐效果。本文主要做了以下研究工作。1)设计一种基于对偶关系图与邻居实体筛选的跨语言实体对齐方法。针对等价邻居实体问题,提出一种基于实体名称和属性的邻居实体筛选规则,用以筛除冗余的等价邻居实体。同时,为了避免实体属性可能不足的情况,为实体筛选带来困扰,本文通过构建对偶关系图作为辅助证据完成实体筛选,并且利用对偶关系图来加强实体之间的紧密联系,使得实体的邻居信息得到充分利用。2)设计一种基于实体假设替换的优化邻居实体筛选方法。现实语料库中,两个名称相同的实体,它们的属性信息可能相似或者存在包含关系,通常这种情况便认为两个实体是等价的,然而事实上未必等价。因此,基于这种情况,本文提出一种优化的邻居实体筛选策略。通过假设两个实体等价,然后替换它们在知识图谱中的位置,并结合邻居实体信息判断替换实体后的知识图谱结构是否成立,最后,通过对比替换前后实体的邻域特征向量是否相似来判断两个实体等价与否。3)设计一种基于实体描述与图像的跨语言实体对齐方法。利用脉冲耦合神经网络抽取实体描述中隐含的关系,然后结合实体名称、属性和预对齐实体对进行迭代交互,从而实现初步对齐。利用图像特征提取方法提取图像特征知识,并通过图像特征投影实现降维处理,然后与实体描述特征向量结合。通过关系聚合网络来聚合所捕获到的实体的每一层邻居输出特征向量,然后利用预对齐实体对指导对齐,并通过计算两个实体的输出特征向量的相似度来判断两个实体是否可以对齐,最后将两次对齐的结果进行对比,并且以最小值作为最终的对齐结果。

基于多特征融合的跨语言实体对齐技术研究

这是一篇关于跨语言实体对齐,RotatE,BERT,特征融合,文本摘要的论文, 主要内容为跨语言实体对齐可以在多个不同语言的知识图谱中找到具有相同语义的实体,并将这些实体映射到真实世界的同一对象,从而实现知识的互补和跨语言增强。然而,现在大多数跨语言实体对齐方法并不能充分的提取和融合知识图谱中实体的多种特征。对此,本文提出了两种跨语言实体特征抽取方法,并通过合理的方法将实体的多种特征融合到一起,从而为上述问题提供了解决方案。针对跨语言实体多种特征提取和融合问题,本文主要做了以下工作:(1)基于语料库融合和RotatE模型提出了一种跨语言实体关系特征提取方法。本方法首先通过语料库融合将跨语言知识图谱中的实体映射到统一的空间中,然后通过RotatE模型提取出实体的复杂关系特征。(2)基于TextRank和SIF算法提出了一种多语言文本摘要算法,然后通过该文本摘要算法和BERT模型提出了一种跨语言实体名称和属性特征提取方法。本方法首先通过多语言文本摘要算法提取实体属性、属性值组合序列中的关键部分,然后通过BERT模型对实体名称和实体关键属性、属性值组合序列进行特征提取。(3)基于BERT模型嵌入层和加权融合思想构建了一个多特征融合的跨语言实体对齐模型。在模型训练阶段,本模型首先通过GCN-Align模型获取实体结构特征,然后结合BERT模型嵌入层去融合实体的结构、名称和属性特征。在模型测试阶段,本模型将基于加权融合思想把融合后的实体结构、名称和属性特征再次和实体关系特征融合到一起,并用于完成跨语言实体对齐任务。本文在DBP15K数据集上将本文提出的方法与其它基线模型进行了比较和分析,实验结果表明本文所提方法优于基线模型,证明了本文方法的有效性。

噪声敏感的关系感知跨语言实体对齐方法研究

这是一篇关于知识图谱,双语词典提取,对偶关系图谱,噪声检测,跨语言实体对齐的论文, 主要内容为知识图谱是一种用图来描述知识的技术方法,在表示从不同领域收集的知识方面起着至关重要的作用。然而,不同的知识图谱通常由不同的技术或不同的语言构造,这些单独构建的知识图谱之间包含异构但互补的内容,因此将不同来源或不同语言的知识图谱整合为统一的知识图谱很有意义,一种有效的对齐知识图谱的方法是把多个不同来源但代表相同对象的实体进行对齐。在大数据时代的背景下,为了实现知识的全球共享,跨语言实体对齐作用愈加明显。双语词典是跨语言自然语言处理中一项非常重要的资源,对跨语言实体对齐任务有着奠基的作用。本文以中英文两种语言为例,提出了一种基于百科语料的中英文双语词典的提取方法。方法是在对文本内容提取的基础上结合在线百科的结构特点,分别用五种不同的方法对百科语料进行提取,与以往的基于部分双语语料的提取方法相比,本方法在在线百科语料上的提取数量提高了170.75%。目前实现跨语言实体对齐方法主要是基于知识图谱表示学习以及图卷积网络(Graph Convolutional Networks,GCN)方法,前者学习知识在不同知识图谱中的向量表示,并通过计算不同知识图谱中向量的相似度来对齐实体,但这种方法对知识图谱中大量存在的复杂的关系的获取比较困难,而后者则更容易获取复杂的关系。然而以上两种方法的训练集通常是人工标注的预对齐的实体对,可能包含噪声,这会影响最终的对齐结果。因此本文提出了一种噪声敏感的关系感知双图卷积网络模型(Noise Sensitive Relation Aware Dual Graph Convolution Network,NSRDGCN),模型解决了关系感知类的跨语言实体对齐模型对数据集要求更高的问题,提高鲁棒性。模型由两部分组成,分别是关系感知跨语言实体对齐模块和噪声检测模块,其中噪声检测模块利用生成式对抗网络(Generative Adversarial Network,GAN)来检测训练集中的噪声,生成器生成噪声,而判别器鉴别噪声与真实数据,二者进行对抗训练;关系感知跨语言实体对齐模块通过(实体,关系,实体)三元组以及其对应的(关系,实体,关系)三元组之间的影响来学习更好的实体表示,并通过连接GCN层来增强邻居的影响。论文在DBP15K的三个真实的跨语言数据集上进行了实验,把现有的跨语言实体对齐模型JE、MTrans E、JAPE、IPTrans E、Boot EA、GCN-Align、KECG、SEA、REA、RDGCN作为基线模型,进行不同评分函数的实验对比,实验结果表明,NSRDGCN方法明显优于这些基线模型方法,尤其在英文日文双语数据集中,NSRDGCN的对齐性能Hits@1和Hits@10分别提升了1.1%和1.3%以上。该论文有图20幅,表8个,参考文献99篇。

基于多特征融合的跨语言实体对齐技术研究

这是一篇关于跨语言实体对齐,RotatE,BERT,特征融合,文本摘要的论文, 主要内容为跨语言实体对齐可以在多个不同语言的知识图谱中找到具有相同语义的实体,并将这些实体映射到真实世界的同一对象,从而实现知识的互补和跨语言增强。然而,现在大多数跨语言实体对齐方法并不能充分的提取和融合知识图谱中实体的多种特征。对此,本文提出了两种跨语言实体特征抽取方法,并通过合理的方法将实体的多种特征融合到一起,从而为上述问题提供了解决方案。针对跨语言实体多种特征提取和融合问题,本文主要做了以下工作:(1)基于语料库融合和RotatE模型提出了一种跨语言实体关系特征提取方法。本方法首先通过语料库融合将跨语言知识图谱中的实体映射到统一的空间中,然后通过RotatE模型提取出实体的复杂关系特征。(2)基于TextRank和SIF算法提出了一种多语言文本摘要算法,然后通过该文本摘要算法和BERT模型提出了一种跨语言实体名称和属性特征提取方法。本方法首先通过多语言文本摘要算法提取实体属性、属性值组合序列中的关键部分,然后通过BERT模型对实体名称和实体关键属性、属性值组合序列进行特征提取。(3)基于BERT模型嵌入层和加权融合思想构建了一个多特征融合的跨语言实体对齐模型。在模型训练阶段,本模型首先通过GCN-Align模型获取实体结构特征,然后结合BERT模型嵌入层去融合实体的结构、名称和属性特征。在模型测试阶段,本模型将基于加权融合思想把融合后的实体结构、名称和属性特征再次和实体关系特征融合到一起,并用于完成跨语言实体对齐任务。本文在DBP15K数据集上将本文提出的方法与其它基线模型进行了比较和分析,实验结果表明本文所提方法优于基线模型,证明了本文方法的有效性。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码码头 ,原文地址:https://m.bishedaima.com/lunwen/56277.html

相关推荐

发表回复

登录后才能评论