基于关系路径的知识图谱推理技术研究
这是一篇关于知识图谱,知识推理,语义网络,深度学习,强化学习的论文, 主要内容为知识图谱作为目前最新的知识表达方式之一,通过对语义网络进行建模,以结构化的形式描述客观世界中多类型实体及复杂的语义关系,为用户提供了一种更好组织、管理和理解互联网海量信息的能力,其重要性随着人工智能技术的蓬勃发展日益凸显。知识图谱推理技术则进一步根据图谱中已知知识推理出所蕴含的未知新知识,利用实体间的关系路径进行相关预测任务,为信息检索,语义理解和智能问答等知识驱动的智能化信息服务提供辅助决策支撑,在智慧医疗,金融安全和网络空间安全等不同领域显现出了良好的应用前景,具有重要的理论意义和实际应用价值。然而,在系统研究该领域当前工作的基础上,本文发现该技术仍存在一些待解决的实际问题,主要包括稀疏知识图谱中推理链中断、大规模图谱中推理长度短和低时延应用需求下推理效率不足等。本文基于关系路径推理的角度,从动态路径补全、多智能体层次推理、关系路径生成式推理三个方面,对上述三个关键问题进行深入研究,并且对其应用前景进行展望。本文主要完成以下工作:1.从推理过程可解释性的角度,综述了目前知识图谱推理领域的相关方法。在长期的研究和实践过程中,研究人员相继提出了多种知识图谱推理方法,并尝试从不同的角度,比如分布式表示、图嵌入等,对已有工作进行综述。然而,对于推理模型的可解释性则缺少相关的总结与对比。本文首次从可解释性的角度对现有知识图谱推理方法进行了探究。针对不同知识图谱推理技术的核心思想及演进过程,分析对比其特点、性能和优缺点,进而给出了模型推理效率和可解释性的综合评价。2.提出了一种基于动态路径补全策略的知识图谱推理方法,实现了结合全局信息动态地对局部路径进行补全,提高了模型在稀疏图谱中进行推理的能力。目前构建的领域知识图谱很多都是稀疏的,在相应图谱中进行知识推理时,图谱环境的稀疏造成很多关键推理路径缺失,经常出现推理链中断的现象。针对该问题,本文提出了一种基于动态路径补全策略的知识图谱推理方法SparKGR。该方法采用强化学习的推理方式,将知识推理中的多跳推理问题建模为一个序列化决策问题,通过反馈和交互的方式训练强化学习的智能体。当在稀疏图谱推理的过程中,出现推理路径缺失的情况时,强化学习智能体根据当前实体的状态和历史路径信息,进行路径的动态补全从而扩充推理路径,提高了模型在稀疏图谱中进行推理的能力。3.提出了一种基于多智能体强化学习的层次知识图谱推理方法,实现了层次地对复杂推理任务进行推理,提高了模型进行长距离推理的能力。基于路径的推理方法在知识推理过程中需要探索大量的路径,推理模型的搜索空间普遍较大,很难进行长距离的推理任务。针对该问题,本文提出了一种基于多智能体强化学习的知识图谱推理方法RMLH。该方法通过多智能体强化学习将推理过程划分为独立的抽象关系子任务,然后,再对每个子任务进行细粒度的路径探索,实现搜索空间大幅度地降低。同时,这种层次化的推理方式也更加符合人类分而治之的思维方式,推理结果更具有可解释性。4.提出了一种基于序列模型的生成式知识图谱推理方法,实现了并行化地学习关系路径推理序列,生成式输出下一步推理动作,提高了模型推理的效率和鲁棒性。目前基于路径探索的方法仅能对推理路径级联式串行探索,造成模型需要很长收敛时间,推理速度较慢。针对该问题,本文提出了一种基于序列模型的生成式知识图谱推理方法DT4KGR。与以往基于路径探索的方式不同,该方法利用Decision Transformer模型对强化学习的交互过程进行模拟,推理模型在对历史推理序列中的奖励,状态和动作输入进行并行学习的基础上,生成式地输出下一步推理动作,加快推理效率的同时,提高了模型对推理路径缺失的鲁棒性,实现了更加快速高效的知识推理。
基于强化学习和语义表征的语义通信及网络研究
这是一篇关于语义通信,语义网络,语义相似度,语义表征,强化学习的论文, 主要内容为语义通信在近些年引起了研究人员的广泛关注,并被认为是一种可能会在下一代通信中起重要作用的传输方式。作为语义通信前中期的工作之一,本研究为点对点语义通信的实施架构和异构语义网络设计提供了一定的理论以及实验经验。在语义通信的方案设计上,现有的许多方法以交叉熵和均方误差为设计准则,对语义提取模型和传输方式展开了较多的研究。不同于以上思路,本文指出一种(由学习目标语义缺陷导致的)在文献中通常被忽略的语义-符号准确率差异。为了解决这一问题,本文提出一种以广义语义相似度为优化目标的语义通信实现方法。这一思想回答了如何进行语义保真的问题,并实现了通信系统从比特准确度向语义测度下优化的转变。技术方法层面,为了实现在任意不可微语义测度上的通用优化,并同时处理通常被忽略的未知(特别是不可微)信道问题,本文提出使用强化学习中的决策过程建模语义通信系统,并使用基于语义相似度的策略梯度实现端到端的优化。实验表明本文所提方案更好地保留了消息中的高阶语义关系,并具有良好的鲁棒性和通用性。进一步地,本文将语义通信的思想从点对点系统拓展到多对多的异构网络,并提出了一种“对语义负责(以语义为传输对象和目的),对(具有异构语义知识的)用户特异”的语义网络架构。特别地,在本文设想的语义网络框架下,来自异构语义体系下的不同符号消息被映射到统一的联合语义表征空间;网络对不同形式消息所含有的共同本原语义进行传输,并使用异构用户各自的语义知识在接收端进行特异化的符号表达。这一思想与以往“对用户负责,对语义特异”的多用户语义网络设计有着显著的区别,也是对现有方案的补充。此外,本文首次从表征学习的角度重新思考了语义通信系统设计中语义可解释性、通用性、安全性等问题,并提供了相应的解决方案。实验验证了本文所提语义网络在异构语义表征准确性与可解释性、对抗语义攻击的安全性、系统可拓展性等方面相较以往语义通信方案的显著优势。本文所提使用语义相似度构建语义通信系统的方案是对早期点对点语义通信如何实现的探索,回答了如何实现语义测度优化的基础问题(语义保真问题),而所提本原语义网络是对未来异构多用户语义网络架构的探索,近一步回答了点对点语义通信如何拓展、语义如何实现统一表征的发展性问题(通用语义表征问题)。所研究的两大问题在目的上各有侧重,整体以发展的脉络承接,在语义通信历史进程的不同时期为学术和工业界提供了相应的解决方案。
中医健康知识图谱的构建研究
这是一篇关于语义网络,中医知识图谱,本体,Schema,信息抽取,相关性分析,实体对齐,Jena,Protege的论文, 主要内容为知识图谱(Knowledge graph)是大数据时代进行知识管理和应用的重要数据资源,已经成为搜索引擎语义检索和各领域基于知识的推理和决策的关键技术基础。作为语义网络的重要成员,知识图谱使得大规模知识的存储更为规范,应用更加高效。知识图谱中往往包含各类实体及其属性,以及各种实体之间的语义关系。知识图谱的构建包括诸多具体技术环节,如命名实体获取、关系抽取、数据融合、知识推理和知识图谱表示等,而本体是知识图谱的概念模型表示的主要方法。在Web搜索和通用领域,已经形成了多种大规模的知识图谱库,但医学与中医领域的知识图谱的构建仍处于起步阶段,虽然已有较大规模的医学本体库,但专门的医学特别是中医知识图谱库的构建研究仍较少,由此较大程度阻碍了中医概念知识的信息应用和共享。因此,本文通过整合多种数据资源,就以症、证、病和药等为主要实体的中医健康知识图谱的构建进行研究,主要研究内容与结果包括如下两个方面:(1)面向中医领域中主要的概念实体如症状、证候、疾病和中药等的知识图谱构建问题,设计了相应的图谱模式(Schema),确定了该图谱的基本类别、类别属性和语义关系。在此基础上,通过处理和整合四种不同的数据源(包括百度百科知识库、脾胃病临床病例数据、病症分类数据和现有西医本体),利用信息抽取和相关性分析进行不同数据来源的知识抽取,并采用基于属性向量的实体对齐方法进行不同源数据的知识融合,形成了包含4类实体(3927种症状,2128种疾病,450种证候和572种中药)和5种语义关系的中医健康知识图谱。最后,本文通过利用Jena数据生成功能,进行了知识图谱OWL表示和数据生成。(2)本文还通过Protege本体编辑器对中医知识图谱中的实体及其关系增加了约束限定,并利用Protege将知识图谱中部分知识进行图形化展示。最终在形成的知识图谱基础上,利用开源工具包Jena以及依据中医诊疗逻辑设定的推理规则进行了基于知识图谱的知识推理示范分析和应用,分析结果表明具有一定的可行性和诊疗应用价值。本文中医知识图谱构建研究重点对知识表示和多种数据来源的融合进行了探索性研究,但在知识推理应用和知识学习方法方面仍有待进一步深入,此方面将在后续研究中进行完善。
领域知识图谱构建及其在财务审计的应用——以A高校为例
这是一篇关于审计方法,语义网络,知识图谱,可视化,财务审计的论文, 主要内容为近年来,各行各业在科技领域上的不断创新不仅推动着社会经济的发展,而且改变了社会的方方面面,其中审计监督的改变也很突出。习近平总书记在2018年5月23日中央审计委员会第一次会议上明确提出了要坚持科技强审,加强信息化建设的要求。随着科技社会的发展,未来社会经济形势也会有所改变,想要快速适应社会发展,就应该着重将科学技术融入审计工作中,提高科学技术在审计机关应用的深度和广度,将科学技术融入到审计实务中,融入到审计管理中。知识图谱作为一种大数据技术,在当前大数据环境下,不仅具有知识表达的优势,同时又在信息检索、智能问答、推荐系统等应用方面发挥巨大作用,可有效的解决审计任务繁重与审计力量不足的矛盾。探索知识图谱技术能够给审计领域带来的变化与发展成为了本文探讨的重点。本文的主要研究内容如下:(1)本文首先研究了财务与业务指标间的关联对应关系的构建方法,设计并实现了财务与业务指标对应关系语义网络;(2)系统提出基于机器学习财务审计知识图谱构建的模块及流程,设计并实现了财务审计所需遵循的法律法规知识图谱的构建;(3)以A高校为例,可视化展示了财务及业务指标间的语义网络,以及高校财务审计知识图谱的构建结果;(4)基于上述结果,探讨了语义网络及知识图谱在财务审计的可能应用途径。本文从理论上提出了财务与业务指标间语义网络的构建方法、以及财务审计法规知识图谱的构建方法。在实践方面,本文以A高校的财务审计为例,展示了高校财务与业务指标间的关联挖掘结果,高校财务审计法规的知识图谱及其应用。财务与业务指标间语义网络的构建,可揭示财务与业务指标内在的关联程度,有助于基于业务指标提高财务审计的效果。财务审计法规知识图谱的构建,可揭示财务会计实体、组织实体及审计客体等实体之间的业务逻辑关系,有助于提高审计人员的检索及关联比对效率。
电商空调产品的评论数据情感分析
这是一篇关于格力空调,情感倾向性分析,语义网络,LDA主题模型,TF-IDF的论文, 主要内容为在网络上,对大量的评论数据进行情感分析是Web挖掘的最新范畴,受到各个学科的普遍关注。伴随着信息技术的快速成长,人们更加倾向于用网络的方式来购买自己喜欢的东西,中国现在有很多的电商平台,网络购物的盛行为各大电商平台和对应商品的生产厂家带来了机遇,但同时也为各大平台与生产厂家带来了挑战和竞争,所以各个电商如果希望商品销量增长,除了保证正品、提高商品质量和降低商品价格之外,还需要去了解消费者的心声。现在越来越多的人选择在电商平台上购物,很多的电商平台也相应地有了评论系统,用户可以在系统中表达对商品的看法,用户的看法也日渐成为电商平台和生产厂家发展的重要依据。因此对消费者的文本评论数据进行情感分析,可以使对应的生产厂家和电商平台的自身竞争力得到大幅度的提升,可以为相应的生产厂家和电商平台制定新的营销策略。利用计算机帮助生产厂家和电商平台挖掘并处理相关的文本评价信息是本文的重要工作。我们选择京东电商的格力品牌空调的三种产品格力KFR-35GW/(35592)FNhDaA3、格力KFR-72LW/(72596)FNAa-A3、格力KFR-35GW/(35559)FNAd-A3(WIFI),对这三种产品的评论进行挖掘,通过爬虫软件-八爪鱼采集器去抓取2016年7月11日之前的评论数据评论信息。接下来对获取的数据进行基本的数据处理工作,主要有文本去重、机械压缩去词、中文评论分词、去掉英文及英文字符等工作。文本评论数据经过预处理之后,对处理好的文本数据用基于情感词典的方式对文本的情感倾向做判断和处理,从而把文本数据分成积极情绪和负面情绪两大部分;接下来对评论数据进行语义网络分析,构建语义网络,实现数据可视化;紧接着分别对把三种空调产品的正面和负面评论进行基于LDA模型的主题分析,提取三个潜在主题,寻找评论数据中的高频特征词,挖掘商品的特征;最后对空调产品评论数据用tf/idf的方法来提取商品属性,对三种商品的属性做出对比。最后通过上述的分析结果中获取挖掘出文本评论数据中有价值的内容,寻找三种空调中,最具优势和潜力的商品,为京东电商和格力厂商提供建议。
电商空调产品的评论数据情感分析
这是一篇关于格力空调,情感倾向性分析,语义网络,LDA主题模型,TF-IDF的论文, 主要内容为在网络上,对大量的评论数据进行情感分析是Web挖掘的最新范畴,受到各个学科的普遍关注。伴随着信息技术的快速成长,人们更加倾向于用网络的方式来购买自己喜欢的东西,中国现在有很多的电商平台,网络购物的盛行为各大电商平台和对应商品的生产厂家带来了机遇,但同时也为各大平台与生产厂家带来了挑战和竞争,所以各个电商如果希望商品销量增长,除了保证正品、提高商品质量和降低商品价格之外,还需要去了解消费者的心声。现在越来越多的人选择在电商平台上购物,很多的电商平台也相应地有了评论系统,用户可以在系统中表达对商品的看法,用户的看法也日渐成为电商平台和生产厂家发展的重要依据。因此对消费者的文本评论数据进行情感分析,可以使对应的生产厂家和电商平台的自身竞争力得到大幅度的提升,可以为相应的生产厂家和电商平台制定新的营销策略。利用计算机帮助生产厂家和电商平台挖掘并处理相关的文本评价信息是本文的重要工作。我们选择京东电商的格力品牌空调的三种产品格力KFR-35GW/(35592)FNhDaA3、格力KFR-72LW/(72596)FNAa-A3、格力KFR-35GW/(35559)FNAd-A3(WIFI),对这三种产品的评论进行挖掘,通过爬虫软件-八爪鱼采集器去抓取2016年7月11日之前的评论数据评论信息。接下来对获取的数据进行基本的数据处理工作,主要有文本去重、机械压缩去词、中文评论分词、去掉英文及英文字符等工作。文本评论数据经过预处理之后,对处理好的文本数据用基于情感词典的方式对文本的情感倾向做判断和处理,从而把文本数据分成积极情绪和负面情绪两大部分;接下来对评论数据进行语义网络分析,构建语义网络,实现数据可视化;紧接着分别对把三种空调产品的正面和负面评论进行基于LDA模型的主题分析,提取三个潜在主题,寻找评论数据中的高频特征词,挖掘商品的特征;最后对空调产品评论数据用tf/idf的方法来提取商品属性,对三种商品的属性做出对比。最后通过上述的分析结果中获取挖掘出文本评论数据中有价值的内容,寻找三种空调中,最具优势和潜力的商品,为京东电商和格力厂商提供建议。
基于强化学习和语义表征的语义通信及网络研究
这是一篇关于语义通信,语义网络,语义相似度,语义表征,强化学习的论文, 主要内容为语义通信在近些年引起了研究人员的广泛关注,并被认为是一种可能会在下一代通信中起重要作用的传输方式。作为语义通信前中期的工作之一,本研究为点对点语义通信的实施架构和异构语义网络设计提供了一定的理论以及实验经验。在语义通信的方案设计上,现有的许多方法以交叉熵和均方误差为设计准则,对语义提取模型和传输方式展开了较多的研究。不同于以上思路,本文指出一种(由学习目标语义缺陷导致的)在文献中通常被忽略的语义-符号准确率差异。为了解决这一问题,本文提出一种以广义语义相似度为优化目标的语义通信实现方法。这一思想回答了如何进行语义保真的问题,并实现了通信系统从比特准确度向语义测度下优化的转变。技术方法层面,为了实现在任意不可微语义测度上的通用优化,并同时处理通常被忽略的未知(特别是不可微)信道问题,本文提出使用强化学习中的决策过程建模语义通信系统,并使用基于语义相似度的策略梯度实现端到端的优化。实验表明本文所提方案更好地保留了消息中的高阶语义关系,并具有良好的鲁棒性和通用性。进一步地,本文将语义通信的思想从点对点系统拓展到多对多的异构网络,并提出了一种“对语义负责(以语义为传输对象和目的),对(具有异构语义知识的)用户特异”的语义网络架构。特别地,在本文设想的语义网络框架下,来自异构语义体系下的不同符号消息被映射到统一的联合语义表征空间;网络对不同形式消息所含有的共同本原语义进行传输,并使用异构用户各自的语义知识在接收端进行特异化的符号表达。这一思想与以往“对用户负责,对语义特异”的多用户语义网络设计有着显著的区别,也是对现有方案的补充。此外,本文首次从表征学习的角度重新思考了语义通信系统设计中语义可解释性、通用性、安全性等问题,并提供了相应的解决方案。实验验证了本文所提语义网络在异构语义表征准确性与可解释性、对抗语义攻击的安全性、系统可拓展性等方面相较以往语义通信方案的显著优势。本文所提使用语义相似度构建语义通信系统的方案是对早期点对点语义通信如何实现的探索,回答了如何实现语义测度优化的基础问题(语义保真问题),而所提本原语义网络是对未来异构多用户语义网络架构的探索,近一步回答了点对点语义通信如何拓展、语义如何实现统一表征的发展性问题(通用语义表征问题)。所研究的两大问题在目的上各有侧重,整体以发展的脉络承接,在语义通信历史进程的不同时期为学术和工业界提供了相应的解决方案。
电商空调产品的评论数据情感分析
这是一篇关于格力空调,情感倾向性分析,语义网络,LDA主题模型,TF-IDF的论文, 主要内容为在网络上,对大量的评论数据进行情感分析是Web挖掘的最新范畴,受到各个学科的普遍关注。伴随着信息技术的快速成长,人们更加倾向于用网络的方式来购买自己喜欢的东西,中国现在有很多的电商平台,网络购物的盛行为各大电商平台和对应商品的生产厂家带来了机遇,但同时也为各大平台与生产厂家带来了挑战和竞争,所以各个电商如果希望商品销量增长,除了保证正品、提高商品质量和降低商品价格之外,还需要去了解消费者的心声。现在越来越多的人选择在电商平台上购物,很多的电商平台也相应地有了评论系统,用户可以在系统中表达对商品的看法,用户的看法也日渐成为电商平台和生产厂家发展的重要依据。因此对消费者的文本评论数据进行情感分析,可以使对应的生产厂家和电商平台的自身竞争力得到大幅度的提升,可以为相应的生产厂家和电商平台制定新的营销策略。利用计算机帮助生产厂家和电商平台挖掘并处理相关的文本评价信息是本文的重要工作。我们选择京东电商的格力品牌空调的三种产品格力KFR-35GW/(35592)FNhDaA3、格力KFR-72LW/(72596)FNAa-A3、格力KFR-35GW/(35559)FNAd-A3(WIFI),对这三种产品的评论进行挖掘,通过爬虫软件-八爪鱼采集器去抓取2016年7月11日之前的评论数据评论信息。接下来对获取的数据进行基本的数据处理工作,主要有文本去重、机械压缩去词、中文评论分词、去掉英文及英文字符等工作。文本评论数据经过预处理之后,对处理好的文本数据用基于情感词典的方式对文本的情感倾向做判断和处理,从而把文本数据分成积极情绪和负面情绪两大部分;接下来对评论数据进行语义网络分析,构建语义网络,实现数据可视化;紧接着分别对把三种空调产品的正面和负面评论进行基于LDA模型的主题分析,提取三个潜在主题,寻找评论数据中的高频特征词,挖掘商品的特征;最后对空调产品评论数据用tf/idf的方法来提取商品属性,对三种商品的属性做出对比。最后通过上述的分析结果中获取挖掘出文本评论数据中有价值的内容,寻找三种空调中,最具优势和潜力的商品,为京东电商和格力厂商提供建议。
基于用户评论数据的线上大家电产品用户满意度影响因素研究
这是一篇关于线上大家电产品,用户满意度,用户评论数据,情感分类,语义网络的论文, 主要内容为随着互联网技术的快速发展,电商平台也随之大量涌现,线上购物模式的兴起对传统的线下实体购物模式带来了前所未有的冲击,在此背景之下,越来越多的消费者选择通过线上的方式购买家庭常用的大家电产品。大家电产品的线上购买相比于其线下购买,更加的方便快捷,并且拥有更多种类的商品供用户进行选择,产品的价格以及购物成本也更低,但是网上的欺诈问题、物流配送问题以及售后服务问题等也常常被人们所诟病,这些问题都严重影响着用户满意度。因此,对于整个线上大家电市场而言,如何获取以及分析大家电产品影响用户满意度的因素,明确自身的优势,改善自身不足,进而提升线上大家电产品市场的用户满意度,就显得十分重要。本文针对大家电产品用户满意度影响因素的研究,主要做了以下几点工作:(1)对现阶段线上大家电产品用户满意度现状进行了介绍,阐述并分析了线上大家电产品存在的主要问题,给出解决线上大家电产品用户满意度问题的思路;(2)运用情感分类模型对线上大家电产品的评论数据进行情感分类处理,将用户的评论数据分为正面评价和负面评价两部分。提出了结合注意力机制以及神经网络算法的情感分类模型AConv BLSTM,该模型在获取用户评论文本数据局部特征的同时,更能够有效地获取文本上下文之间的关系,具有较高的分类准确率;(3)对情感分类处理得到的正面评价以及负面评价进行语义网络分析,将分词之后凌乱的语句结构进行重新整合,并从整体上展现用户评论数据所表达的内容,获取相关用户满意度的影响因素;(4)运用主题模型对正负面评论数据进行进一步分析,挖掘出评论数据中潜在的主题,分别得到正负面评价数据的用户关注点,进而获取影响家电产品用户满意度的主要因素。(5)对京东平台热水器、洗衣机以及冰箱三种大家电产品进行实证分析,获取并分析得到其用户满意度的影响因素,进而提出合理化的建议。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码工厂 ,原文地址:https://m.bishedaima.com/lunwen/48906.html