融合知识表示的自动问答系统关键技术研究
这是一篇关于自动问答系统,多样化知识表示,深度学习,答案检索,生成模型的论文, 主要内容为近年来随着人工智能和深度学习技术的发展,自动问答系统已经在诸多领域取得了广泛的应用。目前自动问答系统的实现主要有两种技术路线,一是采用检索的方法,包括传统的检索模型以及利用基于深度学习的相似度计算模型检索候选答案文档;二是答案自动生成的方法,该方法利用大量问答语料训练学习得到问题与答案之间的关联模式,自动生成答案序列。在自动问答系统构建过程中,无论是检索还是自动生成的方法都不可避免的面临知识匮乏的问题。首先,如果没有上下文或是相关的知识储备,很难理解问句的含义,这给答案的检索和生成都带来了挑战。另外,由于知识存在形式的多样性,使其在深度语义表示模型中的处理使用方式变得十分困难。针对这些问题,本文对以关键词为代表的特定领域的知识,互联网中广泛大量的相关问答对以及目前广泛研究的知识图谱这三种不同形态的知识信息在问答系统中的融合应用进行了深入广泛的研究,本文研究内容如下:1.为了缓解深度学习模型中对问句表示缺少知识的问题,本文提出了一个带有知识记忆单元的深度学习模型(KM-Bi LSTM),将关键词知识特征加入知识记忆单元,利用其中存储的知识增强问句的表示,使得问句的语义表示更加准确,提高问句与答案之间的相似度度量效果。本文通过在Trec QA和Wiki QA答案选取数据集上的实验验证了该模型在答案选取任务上的有效性。2.针对社区问答检索中单一问题语义表示不充分的问题,本文提出了一个融合外部候选问答对知识的深度语义模型(ECQ-Bi LSTM),来对问句语义表示进行更充分地建模。在该模型中,相关问答对中包含的知识信息将根据相关程度动态地加入到问句表示中。本文通过Trec Live QA竞赛以及Trec QA和Wiki QA上的实验探讨了外部知识信息的获取方法以及问句表示与外部知识信息的有效融合方法。3.为了解决事实类问答答案生成模型中缺少对目标答案生成控制的问题,本文提出了一个融合知识图谱三元组知识信息的答案自动生成模型(KV-Seq2seq)。该模型嵌入了一个key-value结构的三元组知识存储结构,在传统Seq2seq模型的基础上对中间编码状态和知识图谱信息进行了融合,丰富了问句的表示,同时使得答案序列的生成更加准确和富有多样性。综上所述,本文对知识表示在问答系统方向上的应用做了广泛而深入的研究,大量的实验结果表明融合知识表示的问答系统能够更好地提高答案检索和生成的效果,更加准确智能地回答用户的问题。
危化品安全知识自动问答系统应用技术研究
这是一篇关于化工领域,自动问答系统,命名实体识别,相似度匹配的论文, 主要内容为近些年,化工产业作为我国经济支柱型产业,其技术水平和生产能力均取得了大幅度的提升,对于危险化学品的安全监管也变得尤为重要。传统的危化品安全管理方法往往依赖于从大量的规范、手册等途径获取安全技术知识,这种方法效率低下且易出现语义理解偏差。此外,由于危化品种类繁多,相关技术覆盖面广,传统的知识获取方式很难满足人们的需求。基于上述问题,本文提出一种基于知识图谱的危化品安全知识自动问答系统。主要研究工作如下:(1)实体识别:本文提出基于改进图注意力网络的命名实体识别方法。该方法融合多种特征交互逻辑,提出一种整体关系交互图的构建方法,并结合图注意力网络,实现了多特征的自适应嵌入,充分利用了图结构空间建模的优势,提升了多特征交互效率。此外,模型还使用一种具备方向感知的TENER编码器建模文本深层次特征信息,提升了方向位置敏感型特征的捕获能力,进一步确保了模型在限定领域实体识别任务中的性能表现。(2)意图识别:本文提出基于多头自注意力机制Siamese网络的意图识别方法。该方法使用一种共享权重参数的Siamese网络结构将文本序列投射到同一向量空间中进行相似度匹配,不仅实现深层次抽象语义信息的捕获,参数量和计算量的减少也使得模型更加轻量化。此外,本文还在其基础上引入了多头自注意力机制,使用自注意力机制自适应的调整字符语义权重,突出语义关联特征,进而通过多头自注意力计算学习不同类型的信息,从多个角度强化文本内在依赖联系,强化语义交互信息。(3)问答系统开发:基于上述研究和模型分析结论,本文结合专业领域知识图谱和问句解析模型,设计并搭建了一套可实现人机实时交互的基于知识图谱的危化品安全知识自动问答系统。本文构建的危化品安全知识自动问答系统可在一定程度上解决当前危化品安全技术知识查询手段短缺问题,更好的满足公众的知识获取需求,对保障人民生命财产安全、增强公众安全防范意识,强化危化品生产制造过程的标准化、规范化水平有着十分重要的意义。
基于物联网的垃圾分类回收系统的设计与实现
这是一篇关于物联网,垃圾分类回收,奖励机制,自动问答系统,文本分类,卷积神经网络的论文, 主要内容为随着我国经济快速发展以及城市化水平加快,我国城市垃圾产量逐年递增,垃圾围城现象愈发严重。垃圾分类回收是实现垃圾减量化、资源化、无害化的重要途径。目前,我国主要通过在公共场所设置垃圾分类桶进行垃圾分类回收。然而现有的垃圾分类回收设备信息化、智能化水平低下,并且人们对垃圾分类认识度、参与度不高,致使我国的垃圾分类实行至今仍然没有取得良好的效果。针对以上问题,本文基于物联网技术,设计并实现了一个基于物联网的垃圾分类回收系统。该系统由五个部分组成,分别为回收机控制系统、Android大屏系统、用户微信小程序、回收员微信小程序、后台管理系统。回收机控制系统用于回收机的监控以及数据采集,涉及回收机投口和箱门的开闭控制,垃圾重量、容量、温度等传感数据的采集;Android大屏系统用于人机交互以及相关信息展示,主要提供了回收机工作参数设置、垃圾投递业务、垃圾回收业务、广告宣传等功能;用户微信小程序服务于用户,主要提供了附近回收机查找、扫码投递、垃圾投递记录查询、环保金展示等功能;回收员微信小程序服务于回收员,主要提供了扫码回收、回收机状态查询、回收记录查询等功能;后台管理系统主要提供了人员管理、设备管理、数据分析等功能。通过该系统的运作,实现对垃圾分类设备的智能化监控以及相关数据采集,提高了现有垃圾分类回收设备的信息化以及智能化程度,同时本系统引入了垃圾投递奖励机制,进一步提高了用户参与垃圾分类的积极性。同时,针对目前上海市实行的四分类垃圾分类标准存在垃圾所属类别辨别困难的问题,本文对自动问答系统在垃圾分类回收系统中的应用展开研究,提出了基于卷积神经网络(Convolutional Neural Networks,CNN)自动问答系统。通过此问答系统实现对垃圾所属类别问题的回答,进而指导人们正确地分类投递垃圾。本文首先介绍本课题的研究背景和意义以及国内外垃圾分类回收现状;其次简要介绍了系统开发中所涉及到的技术,包括物联网技术、Android技术、微信小程序技术、Spring Boot框架技术、Nginx和Tomcat技术、My SQL数据库技术、Redis数据库技术;然后对垃圾分类回收系统的业务流程、功能性和非功能性需求进行了深入的需求分析;根据系统需求分析,完成了系统总体设计,包括系统架构设计、系统功能设计、数据库设计以及通讯接口设计;根据系统的总体设计,给出了系统各部分主要功能实现过程,包括回收机控制系统软硬件实现、Android大屏系统实现、用户微信小程序实现、回收员微信小程序实现以及后台管理系统实现。最后,通过功能测试和压力测试验证了系统的可用性与稳定性。此外,在基于卷积神经网络的自动问系统应用研究上,我们给出了相关背景及方法介绍、自动问答系统构建过程,并且对所提出的模型进行了实验。为了验证CNN模型的有效性,本文将CNN模型和传统机器学习模型进行了文本分类对比实验,最终结果表明采用CNN模型构建的自动问答系统准确率到达88.6%,高于传统机器学习模型问答准确率,从而验证了所提出方法的有效性。
基于知识图谱的自动问答方法及应用研究
这是一篇关于基于知识图谱问答,自然语言理解,多模态感受野,自动问答系统的论文, 主要内容为随着机器人技术的发展,机器人变得越来越智能和多功能。然而,它们仍然缺乏理解和响应自然语言的能力,这限制了它们在各种应用中的有用性。因此,自动问答技术已成为机器人工程中的一个重要研究方向。面对复杂的自然语言和逐渐增长的互联网信息,目前主流的解决方法有基于关系型数据库、基于模板和基于知识图谱的方法。基于关系型数据库的方法在涉及到多表联合查询时表现不佳,而基于模板的方法需要大量的人工标注构建规则。相较于前两种技术,基于知识图谱的问答具有很好的可拓展性,且不需要人工设置固定的规则灵活性更强。该方法旨在帮助用户通过存储在知识图谱中的事实,回答用户提出的自然语言问题,而不需要了解其数据结构。这是一项充满挑战的任务,一方面,机器人较难正确理解问题的语义;另一方面,目前的方法不能很好的利用知识图谱中的内容。具体来说,由于问题中存在单词的缩写、歧义、语法复杂等情况,尤其是当输入内容包含图片时,模型的注意力往往不能聚焦到正确的内容上面。导致在检索的过程中形成了错误的推理链,从而不能精准的利用知识图谱中的内容,导致问答系统应用困难。本文针对上述问题,使用句法分析和多模态注意力的方法设计了自动问答机器人原型系统,通过实验证明了提出方法的有效性。本文主要工作和创新点如下:(1)针对问句中可能存在的单词缩写和歧义的问题,本文将知识图谱嵌入到与单词特征相同的空间当中,学习到的向量表示可以自然的分别出因缩写和歧义造成的问题。面对语法复杂的情况,本文采用句法分析和图卷积神经网络来建模单词间的远距离依赖关系,更好的帮助机器理解问题的内容。提出的方法在Simple Question数据集上取得了较好的表现。(2)当输入包含图片时,本文设计了多模态的感受野,以问题为指导,将算法的注意力扩展到图片和知识图谱的模态内获得关系向量,使模型的关注点更全面。以问题和图片中的实体以及包含三个模态的关系向量,建立科学的推理链获得最终答案。提出的方法在FVQA和ZS-F-VQA数据集上取得了较好的表现。(3)本文将上述方法应用在实际的问答场景中,用户输入图片和问题,系统可以精准地理解用户的意图,减少冗余结果和无关结果的干扰,给出相应的答案,提高了用户的查询效率和准确性,极大地提升了用户的搜索体验。该算法能够从知识图谱中获取多源知识,并将其以简明易懂的形式呈现给用户,有利于知识的传播和普及,进一步证明了该方法的实用性。
基于知识图谱的自动问答方法及应用研究
这是一篇关于基于知识图谱问答,自然语言理解,多模态感受野,自动问答系统的论文, 主要内容为随着机器人技术的发展,机器人变得越来越智能和多功能。然而,它们仍然缺乏理解和响应自然语言的能力,这限制了它们在各种应用中的有用性。因此,自动问答技术已成为机器人工程中的一个重要研究方向。面对复杂的自然语言和逐渐增长的互联网信息,目前主流的解决方法有基于关系型数据库、基于模板和基于知识图谱的方法。基于关系型数据库的方法在涉及到多表联合查询时表现不佳,而基于模板的方法需要大量的人工标注构建规则。相较于前两种技术,基于知识图谱的问答具有很好的可拓展性,且不需要人工设置固定的规则灵活性更强。该方法旨在帮助用户通过存储在知识图谱中的事实,回答用户提出的自然语言问题,而不需要了解其数据结构。这是一项充满挑战的任务,一方面,机器人较难正确理解问题的语义;另一方面,目前的方法不能很好的利用知识图谱中的内容。具体来说,由于问题中存在单词的缩写、歧义、语法复杂等情况,尤其是当输入内容包含图片时,模型的注意力往往不能聚焦到正确的内容上面。导致在检索的过程中形成了错误的推理链,从而不能精准的利用知识图谱中的内容,导致问答系统应用困难。本文针对上述问题,使用句法分析和多模态注意力的方法设计了自动问答机器人原型系统,通过实验证明了提出方法的有效性。本文主要工作和创新点如下:(1)针对问句中可能存在的单词缩写和歧义的问题,本文将知识图谱嵌入到与单词特征相同的空间当中,学习到的向量表示可以自然的分别出因缩写和歧义造成的问题。面对语法复杂的情况,本文采用句法分析和图卷积神经网络来建模单词间的远距离依赖关系,更好的帮助机器理解问题的内容。提出的方法在Simple Question数据集上取得了较好的表现。(2)当输入包含图片时,本文设计了多模态的感受野,以问题为指导,将算法的注意力扩展到图片和知识图谱的模态内获得关系向量,使模型的关注点更全面。以问题和图片中的实体以及包含三个模态的关系向量,建立科学的推理链获得最终答案。提出的方法在FVQA和ZS-F-VQA数据集上取得了较好的表现。(3)本文将上述方法应用在实际的问答场景中,用户输入图片和问题,系统可以精准地理解用户的意图,减少冗余结果和无关结果的干扰,给出相应的答案,提高了用户的查询效率和准确性,极大地提升了用户的搜索体验。该算法能够从知识图谱中获取多源知识,并将其以简明易懂的形式呈现给用户,有利于知识的传播和普及,进一步证明了该方法的实用性。
基于甲状腺知识图谱的自动问答系统设计与实现
这是一篇关于甲状腺疾病,知识图谱,自动问答系统,SPARQL查询的论文, 主要内容为随着人们生活水平的提高,甲状腺疾病的发生已经并不罕见,而国内甲状腺医疗资源分布不均,造成了大型医院人满为患、医生接诊病人多、病人看病时间长等问题。随着“互联网+”技术以及智慧医疗的迅速发展,甲状腺患者会寻求在线医疗咨询平台如寻医问药网、好大夫在线网等进行甲状腺疾病咨询。但这类平台需要医生在线,通过人工答诊的方式为患者提供咨询服务,导致这类在线咨询平台缺乏自动智能化问诊与答诊的途径,无法为大量的患者提供及时的疾病咨询服务。如何为甲状腺患者提供自动化的在线问答服务,已成为智慧医疗领域广泛关注的课题。甲状腺患者在就诊过程中会产生大量的甲状腺电子病历数据,这些数据为甲状腺诊疗自动问答系统的实现提供了数据来源。为此,本文在上海某三甲医院甲状腺电子病历的基础上,构建了甲状腺知识图谱,并基于甲状腺知识图谱,利用自然语言处理结合知识图谱查询技术,设计并实现一个面向甲状腺诊疗的自动问答系统。本文的研究内容主要包括:1)设计了基于甲状腺知识图谱的自动问答系统总体架构:阐述了系统的总体架构,将整个系统分为甲状腺知识图谱构建子系统和甲状腺诊疗自动问答子系统。甲状腺知识图谱构建子系统负责构建甲状腺诊疗自动问答系统进行查询的知识库,甲状腺诊疗自动问答子系统负责对用户输入的自然语言问句转化为知识图谱查询语句,而后得到问句的答案。根据子系统的各功能以及相互关系设计了整个系统的架构图,并对两个子系统分别进行了概述。2)设计了甲状腺知识图谱构建子系统:首先对甲状腺电子病历数据特点进行了分析,从中提取甲状腺相关术语,通过归纳同类术语,获得甲状腺知识图谱的相关概念,据此设计了甲状腺知识图谱概念模式结构。然后,分析概念模式结构,定义了概念之间的关系,完成甲状腺知识图谱概念模式的设计。随后,从数据库中提取甲状腺相关数据作为实体集,根据设计的概念模式进行实体填充操作。最后将实体以及实体关系以三元组<实体-关系-属性>构成甲状腺知识图谱。3)设计了基于甲状腺知识图谱的自动问答处理流程:甲状腺诊疗自动问答子系统主要由问句预处理模块和答案生成模块组成。在问句预处理模块中,首先利用中文分词算法将用户输入的问句进行分词操作,通过关键词获得问句的类别。其次,针对甲状腺咨询问句语料采用LSTM+CRF算法生成识别模型,利用该模型从问句中获得甲状腺实体。而后,利用LTP-parser工具对问句进行依存句法分析,得到句子中各结构的主客关系,形成问句的三元组形式。最后,将问句三元组中的实体映射到知识图谱的实体上,避免对不存在于知识图谱中的实体进行查询,获得查询的三元组。在答案生成模块中,根据问句类别,将问句预处理模块得到的查询三元组与SPARQL查询模板进行匹配,把自然语言的问题转化为知识图谱查询语言,通过在知识图谱内进行查询,得到问句的答案,再对问句的答案进行针对性的处理,最终反馈给用户。4)实现了基于甲状腺知识图谱的自动问答系统方案:首先对甲状腺知识图谱的构建细节以及构建成果进行展示。其次对自动问答系统中问句预处理模块和答案生成模块的实现过程以及系统成果进行展示。测试结果证明本文的自动问答系统具有较好的可用性。
基于知识图谱的自动问答方法及应用研究
这是一篇关于基于知识图谱问答,自然语言理解,多模态感受野,自动问答系统的论文, 主要内容为随着机器人技术的发展,机器人变得越来越智能和多功能。然而,它们仍然缺乏理解和响应自然语言的能力,这限制了它们在各种应用中的有用性。因此,自动问答技术已成为机器人工程中的一个重要研究方向。面对复杂的自然语言和逐渐增长的互联网信息,目前主流的解决方法有基于关系型数据库、基于模板和基于知识图谱的方法。基于关系型数据库的方法在涉及到多表联合查询时表现不佳,而基于模板的方法需要大量的人工标注构建规则。相较于前两种技术,基于知识图谱的问答具有很好的可拓展性,且不需要人工设置固定的规则灵活性更强。该方法旨在帮助用户通过存储在知识图谱中的事实,回答用户提出的自然语言问题,而不需要了解其数据结构。这是一项充满挑战的任务,一方面,机器人较难正确理解问题的语义;另一方面,目前的方法不能很好的利用知识图谱中的内容。具体来说,由于问题中存在单词的缩写、歧义、语法复杂等情况,尤其是当输入内容包含图片时,模型的注意力往往不能聚焦到正确的内容上面。导致在检索的过程中形成了错误的推理链,从而不能精准的利用知识图谱中的内容,导致问答系统应用困难。本文针对上述问题,使用句法分析和多模态注意力的方法设计了自动问答机器人原型系统,通过实验证明了提出方法的有效性。本文主要工作和创新点如下:(1)针对问句中可能存在的单词缩写和歧义的问题,本文将知识图谱嵌入到与单词特征相同的空间当中,学习到的向量表示可以自然的分别出因缩写和歧义造成的问题。面对语法复杂的情况,本文采用句法分析和图卷积神经网络来建模单词间的远距离依赖关系,更好的帮助机器理解问题的内容。提出的方法在Simple Question数据集上取得了较好的表现。(2)当输入包含图片时,本文设计了多模态的感受野,以问题为指导,将算法的注意力扩展到图片和知识图谱的模态内获得关系向量,使模型的关注点更全面。以问题和图片中的实体以及包含三个模态的关系向量,建立科学的推理链获得最终答案。提出的方法在FVQA和ZS-F-VQA数据集上取得了较好的表现。(3)本文将上述方法应用在实际的问答场景中,用户输入图片和问题,系统可以精准地理解用户的意图,减少冗余结果和无关结果的干扰,给出相应的答案,提高了用户的查询效率和准确性,极大地提升了用户的搜索体验。该算法能够从知识图谱中获取多源知识,并将其以简明易懂的形式呈现给用户,有利于知识的传播和普及,进一步证明了该方法的实用性。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设货栈 ,原文地址:https://m.bishedaima.com/lunwen/48077.html