基于知识表示学习的信息可信评估方法的研究与实现
这是一篇关于知识表示学习,神经网络,可信评估的论文, 主要内容为随着大数据时代的来临,5G通讯等新型传播技术,以及在线社交平台等信息传播形式不断发展,导致信息的传播速度以及规模出现爆炸式增长。然而海量网络信息在与人便利的同时,其中所隐藏的虚假信息也给人们生活乃至国家信息安全带来困扰。因此,对于网络信息可信评估的研究有着十分重要的现实意义。在大数据网络环境下,信息数据呈现出多源异质、有效信息密度低等特征,使得人们难以有效的对信息数据进行有效的收集利用。以往的信息可信评估方法无法对大规模数据进行高效挖掘,且需要大量的人力和时间成本,因而研究如何有效利用信息数据是解决网络信息可信评估的关键。为解决以上问题,本文针对大数据环境下网络信息的可信评估方法进行研究,主要的研究内容如下:(1)针对大数据网络环境下,信息数据呈现出的体量大、结构各异的特点,为数据的有效收集利用提出较高要求。本文结合知识图谱这一新型数据结构,利用结构化和非结构化数据的不同表征,对信息数据所包含的实体和关系进行抽取,并以三元组的形式加以存储,进而方便整合挖掘实体间复杂关联关系。针对基于模板的关系抽取方法受限于模板覆盖度问题,基于深度学习算法进行有监督的关系抽取,得到具有复杂关系的知识图谱。(2)针对网络环境中有效信息密度低的特征,本文提出一种基于知识表示学习的信息可信评估方法。将信息实体与实体间关联关系映射至向量空间中,基于向量的平移不变性和信息三元组满足向量三角形法则的假设进行建模。考虑到传统知识表示学习处理复杂关系能力较弱,且对超参数依赖性较强,模型采用基于实体分类的负采样方法,减少受损三元组的随机性和非负性。同时通过超参数的自适应调节机制,通过对损失函数的监测,在参数更新前期采用较大学习率使模型快速收敛,而后减小参数使模型收敛精确。在大型真实知识库上的性能表明,预测结果的平均排名提高约4%,预测结果处于前十的准确率提高了 10%以上。(3)针对传统翻译嵌入模型仅参考直接关系的局限性,模型通过基于神经网络的单路径聚合算法和基于邻居的多路径聚合算法,对实体间的直接关系与间接关系进行综合考量。利用长短期记忆人工神经网络在处理存在语义依赖的序列上的优越性,且能在一定程度上减轻循环神经网络在处理长序列中可能存在的梯度消失问题,更好的表示实体间的语义关系。(4)针对企业用户和普通用户对于自动化信息可信评估的市场需求和业务功能需求,本课题设计实现了一个网络信息的自动化可信评估系统。系统可分为知识图谱构建模块,信息可信评估模块,评估结果可视化模块,以网络中的结构化信息和非结构化文本信息作为目标利用爬虫技术进行收集,以三元组的形式进行存储,基于知识表示学习算法和人工神经网络构建能量模型,通过自适应机制更新参数,同时提供可视化界面向用户分别展示待评估关系结果及系统预测结果。该系统不仅可以应用于信息可信评估方面,在知识补全、数据库清洗等领域也可进行应用。
面向多源知识图谱的三元组可信评估模型的设计与实现
这是一篇关于知识图谱,关系三元组,可信评估,多数据源的论文, 主要内容为知识图谱对结构化知识进行存储与表示,能够有效提升行业数据治理的能力。然而近些年出现知识图谱的质量往往参差不齐,因此需要对知识图谱进行可信评估。其中关系三元组作为知识图谱最重要的单元,对其进行可信评估是知识图谱可信评估的核心任务。近年来,越来越多的学者关注到三元组可信评估问题,并提出多种三元组可信评估方法。然而目前知识图谱三元组可信评估方法没有考虑多个知识图谱互相关联、彼此影响的场景。此外,以往三元组可信评估方法没有考虑在得到评估结果后对其进行标注校验评估结果的场景,也没有考虑标注数据缺乏且标注难度较大的问题。且其通常注重于全量数据的训练,无法重复利用之前训练的结果。基于此,本文针对多源知识图谱的错误信息传递和信息互补问题,提出一种考虑多源知识图谱情景的三元组可信评估方法。在此基础上,针对模型数据标注问题和模型衰减问题,提出一种知识图谱可信评估动态更新方法。本文贡献主要包括:(1)提出了一种基于跨图谱信息交互的多粒度三元组可信评估方法。该方法在通过表示学习提取知识图谱数据源内部多特征的基础上,建模了多源知识图谱数据之间的交互信息。针对噪声三元组干扰问题,提出了调节性动态可信评估训练方法。相较于以往仅在单图谱内部进行三元组评估的方法,提升了三元组可信评估的效果,尤其是噪声数据集上的噪声发现能力。(2)提出了一种基于主动学习和环境感知的三元组可信评估动态更新方法。该方法针对缺乏三元组可信评估标注数据的问题,使用基于主动学习的异常检测模型以减少人工校验的工作量。同时使用基于环境感知的样本采样方法以提高待校验样本的代表性。针对模型的有效性衰减问题,使用基于样本重采样的模型微调方法对模型进行更新,从而在保证模型评估性能的基础上,将人工校验三元组可信评估结果融入模型。(3)设计并实现了一个多源知识图谱三元组可信评估原型系统。结合上述所提方法,分析、设计并实现了可信评估原型系统,用于展示知识图谱三元组可信评估模型的训练、评估和更新过程,为后续方法改进提供了平台载体,并通过真实数据进行演示。
BPM领域构件可信评估系统的研究与实现
这是一篇关于业务流程管理(BPM),领域构件,可信评估,可信性指标,可信证据的论文, 主要内容为目前,许多BPM (Business Process Management)软件企业使用基于构件复用的软件开发方法,缩短了开发周期、节约了开发成本、提高了企业的市场竞争力。然而,随着用户需求的不断增多,BPM软件系统变得越来越复杂和难以控制,所导致的事故也频频发生,出现了前所未有的“信任危机”。因此,如何打造和选取可信度高的构件来进行BPM软件系统的开发,成为了BPM软件企业亟待解决的问题。而BPM领域构件的可信评估是解决这两个问题的基本前提和有效手段之一,因此BPM领域构件的可信评估研究具有重要的理论和现实意义。 本论文结合实验室承担的国家“863”重点项目,分析和参考了相关理论研究成果和技术方法,提出了一个完整的BPM领域构件可信评估体系,并在此基础上实现了BPM领域构件可信评估系统的开发。本文的主要工作体现在以下几个方面: 1.分析和总结了与BPM领域构件可信评估相关的理论和方法的国内外研究现状和目前面临的一些问题。 2.研究了BPM领域构件的可信性指标体系,给出了BPM领域构件的可信性定义、提出了BPM领域构件的可信性参考模型、并对可信性指标进行定义和度量。然后,研究了BPM领域构件的可信证据理论,提出了BPM领域构件的可信证据参考模型、给出了可信证据的获取方法以及可信证据与可信性指标的关系。 3.研究了BPM领域构件的可信等级划分理论,给出了BPM领域构件的可信等级定义以及可信分级模型。然后,研究了BPM领域构件的可信评估过程,提出了BPM领域构件的评估过程模型以及评估算法模型。 4.在相关理论研究的基础上,采用java、struts2、spring、hibernate等技术,设计和实现了BPM领域构件可信评估系统。
基于知识表示学习的信息可信评估方法的研究与实现
这是一篇关于知识表示学习,神经网络,可信评估的论文, 主要内容为随着大数据时代的来临,5G通讯等新型传播技术,以及在线社交平台等信息传播形式不断发展,导致信息的传播速度以及规模出现爆炸式增长。然而海量网络信息在与人便利的同时,其中所隐藏的虚假信息也给人们生活乃至国家信息安全带来困扰。因此,对于网络信息可信评估的研究有着十分重要的现实意义。在大数据网络环境下,信息数据呈现出多源异质、有效信息密度低等特征,使得人们难以有效的对信息数据进行有效的收集利用。以往的信息可信评估方法无法对大规模数据进行高效挖掘,且需要大量的人力和时间成本,因而研究如何有效利用信息数据是解决网络信息可信评估的关键。为解决以上问题,本文针对大数据环境下网络信息的可信评估方法进行研究,主要的研究内容如下:(1)针对大数据网络环境下,信息数据呈现出的体量大、结构各异的特点,为数据的有效收集利用提出较高要求。本文结合知识图谱这一新型数据结构,利用结构化和非结构化数据的不同表征,对信息数据所包含的实体和关系进行抽取,并以三元组的形式加以存储,进而方便整合挖掘实体间复杂关联关系。针对基于模板的关系抽取方法受限于模板覆盖度问题,基于深度学习算法进行有监督的关系抽取,得到具有复杂关系的知识图谱。(2)针对网络环境中有效信息密度低的特征,本文提出一种基于知识表示学习的信息可信评估方法。将信息实体与实体间关联关系映射至向量空间中,基于向量的平移不变性和信息三元组满足向量三角形法则的假设进行建模。考虑到传统知识表示学习处理复杂关系能力较弱,且对超参数依赖性较强,模型采用基于实体分类的负采样方法,减少受损三元组的随机性和非负性。同时通过超参数的自适应调节机制,通过对损失函数的监测,在参数更新前期采用较大学习率使模型快速收敛,而后减小参数使模型收敛精确。在大型真实知识库上的性能表明,预测结果的平均排名提高约4%,预测结果处于前十的准确率提高了 10%以上。(3)针对传统翻译嵌入模型仅参考直接关系的局限性,模型通过基于神经网络的单路径聚合算法和基于邻居的多路径聚合算法,对实体间的直接关系与间接关系进行综合考量。利用长短期记忆人工神经网络在处理存在语义依赖的序列上的优越性,且能在一定程度上减轻循环神经网络在处理长序列中可能存在的梯度消失问题,更好的表示实体间的语义关系。(4)针对企业用户和普通用户对于自动化信息可信评估的市场需求和业务功能需求,本课题设计实现了一个网络信息的自动化可信评估系统。系统可分为知识图谱构建模块,信息可信评估模块,评估结果可视化模块,以网络中的结构化信息和非结构化文本信息作为目标利用爬虫技术进行收集,以三元组的形式进行存储,基于知识表示学习算法和人工神经网络构建能量模型,通过自适应机制更新参数,同时提供可视化界面向用户分别展示待评估关系结果及系统预测结果。该系统不仅可以应用于信息可信评估方面,在知识补全、数据库清洗等领域也可进行应用。
面向多源知识图谱的三元组可信评估模型的设计与实现
这是一篇关于知识图谱,关系三元组,可信评估,多数据源的论文, 主要内容为知识图谱对结构化知识进行存储与表示,能够有效提升行业数据治理的能力。然而近些年出现知识图谱的质量往往参差不齐,因此需要对知识图谱进行可信评估。其中关系三元组作为知识图谱最重要的单元,对其进行可信评估是知识图谱可信评估的核心任务。近年来,越来越多的学者关注到三元组可信评估问题,并提出多种三元组可信评估方法。然而目前知识图谱三元组可信评估方法没有考虑多个知识图谱互相关联、彼此影响的场景。此外,以往三元组可信评估方法没有考虑在得到评估结果后对其进行标注校验评估结果的场景,也没有考虑标注数据缺乏且标注难度较大的问题。且其通常注重于全量数据的训练,无法重复利用之前训练的结果。基于此,本文针对多源知识图谱的错误信息传递和信息互补问题,提出一种考虑多源知识图谱情景的三元组可信评估方法。在此基础上,针对模型数据标注问题和模型衰减问题,提出一种知识图谱可信评估动态更新方法。本文贡献主要包括:(1)提出了一种基于跨图谱信息交互的多粒度三元组可信评估方法。该方法在通过表示学习提取知识图谱数据源内部多特征的基础上,建模了多源知识图谱数据之间的交互信息。针对噪声三元组干扰问题,提出了调节性动态可信评估训练方法。相较于以往仅在单图谱内部进行三元组评估的方法,提升了三元组可信评估的效果,尤其是噪声数据集上的噪声发现能力。(2)提出了一种基于主动学习和环境感知的三元组可信评估动态更新方法。该方法针对缺乏三元组可信评估标注数据的问题,使用基于主动学习的异常检测模型以减少人工校验的工作量。同时使用基于环境感知的样本采样方法以提高待校验样本的代表性。针对模型的有效性衰减问题,使用基于样本重采样的模型微调方法对模型进行更新,从而在保证模型评估性能的基础上,将人工校验三元组可信评估结果融入模型。(3)设计并实现了一个多源知识图谱三元组可信评估原型系统。结合上述所提方法,分析、设计并实现了可信评估原型系统,用于展示知识图谱三元组可信评估模型的训练、评估和更新过程,为后续方法改进提供了平台载体,并通过真实数据进行演示。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码客栈 ,原文地址:https://m.bishedaima.com/lunwen/52103.html