基于知识图谱的问答系统问句理解方法研究
这是一篇关于知识图谱,问答系统,问句分类,实体链接,关系检测,胶囊网络的论文, 主要内容为从互联网的海量数据中获取信息已经成为人们的基本需要。由于搜索引擎不能直接得到所需的答案,因此本文对基于知识图谱的问答系统进行研究,旨在提出可以理解用户以自然语言提出的问句,并返回一个简洁答案的模型。在知识图谱中,知识以三元组<实体,关系,实体>的方式进行存储,因此基于知识图谱的问答系统主要解决由三元组构成的事实类问题。在问答系统中,准确理解用户问句,需要理解多样化的自然语言表述,这是本文的研究重点。根据问句信息的不同层次,本文将对问句的理解分为宏观和微观两个部分。宏观理解从句子层面进行,微观理解则从实体层面和关系层面来开展。具体工作主要有:1.本文提出一个基于胶囊网络的问句分类模型(Cap-net)。该模型能够结合双向LSTM和注意力机制,再加上胶囊网络,提取问句更多的特征。然后根据需要,将问句按照用户意图或者答案类型进行分类。2.本文提出一个基于语义相似性的实体链接和关系检测模型。该模型使用卷积神经网络,对问句和知识图谱中的实体与关系进行向量化表示。在实体链接任务中,本文提出,将问句中识别出来的实体表述,通过实体-表述映射表,得到候选实体。然后通过本文提出基于语义相似性的实体链接模型,将问句中的实体表述链接到知识图谱的实体上。在关系检测任务中,本文提出了基于层级序列匹配的知识图谱上的关系检测模型。能够将关系分为关系层次和单词层次,更好地获取关系相关信息,来和问句进行相似性匹配。3.为验证模型的有效性,本文分别构建中英文知识图谱,然后分别对上述模型在中英文数据集上进行实验,并与其它算法进行比较,验证本文模型的可行性和有效性,结果表明本文的模型能较好完成文本分类、实体链接和关系检测任务。
基于深度学习的丝绸知识库问答系统关键技术研究及应用
这是一篇关于问答系统,命名实体识别,关系检测,丝绸知识库,迁移学习,对抗学习的论文, 主要内容为丝绸是中华文化的重要组成部分,充分研究和利用丝绸文物资源,对于弘扬传统文化精神,增强民族自信心和影响力有着重要的意义。当前丝绸文物的数字化平台建设已经取得了一定的进展,但是对于深度挖掘丝绸文物资源并且结合当前学术前沿热点仍缺乏相关的研究和应用,无法满足人们日益提升的文化需求。随着信息技术的不断发展,传统的关键字检索服务越来越难以满足人们的需求。问答系统作为一种高级的信息检索方式,使得机器能够理解人类提出的自然语言问题,正逐渐成为人机交互的新形势。另外,知识库的建立和发展,一方面为问答系统提供了丰富的数据资源,另一方面也对问答系统的性能和效果提出了新的要求。当前基于知识库的问答系统存在一些实体识别准确率不高和词汇溢出的问题。针对上述问题,本文分别对命名实体识别任务和关系检测任务进行了深入的研究和探讨,设计并实现了基于丝绸知识库的问答系统。主要工作如下:1)为了提升问答系统的命名实体识别的准确率,针对丝绸领域的实体命名特点,本文首先提出了一种新的实体分类方法和分词方法,然后提出了一种基于BERT+CRF的融合模型。通过迁移学习的方法,利用BERT的预训练数据,同时结合具体的命名实体识别任务,对参数进行微调。最后通过CRF对结果进行参数约束和解码。通过实验进行对比分析,该模型实现了命名实体识别的准确率提高了2.4%。2)为了缓解词汇溢出的问题,提出了基于对抗学习适配器的关系检测模型。首先通过Trans H模型对关系向量进行预训练。然后借鉴对抗学习的思想,训练一个关系适配器,通过生成器和判别器不断对抗训练,学习知识库的关系表示。接着通过BERT进行关系特征进一步提取和强化,得到最终的关系向量表示。通过实验对比分析,对于测试集中出现而训练集中未出现的关系向量表示失效问题得到了很好的解决,很大程度上缓解了词汇溢出的问题。最后通过与基准模型的对比实验表明,本文提出的模型在关系检测准确率上也有了一定的提升。3)基于上述提出的两个模型,基于丝绸知识库建立了一个功能模块较为齐全的知识库问答系统。问答系统采用前后端分离和B/S架构,提供了移动端和网页端两种较为常见的前台界面。将问答系统后端封装成后台服务,对外提供API形式的问答服务,并将该服务集成到现有的丝绸资源平台之上,实现了对丝绸文物资源的智能化利用和深度挖掘。
基于知识图谱的问答系统问句理解方法研究
这是一篇关于知识图谱,问答系统,问句分类,实体链接,关系检测,胶囊网络的论文, 主要内容为从互联网的海量数据中获取信息已经成为人们的基本需要。由于搜索引擎不能直接得到所需的答案,因此本文对基于知识图谱的问答系统进行研究,旨在提出可以理解用户以自然语言提出的问句,并返回一个简洁答案的模型。在知识图谱中,知识以三元组<实体,关系,实体>的方式进行存储,因此基于知识图谱的问答系统主要解决由三元组构成的事实类问题。在问答系统中,准确理解用户问句,需要理解多样化的自然语言表述,这是本文的研究重点。根据问句信息的不同层次,本文将对问句的理解分为宏观和微观两个部分。宏观理解从句子层面进行,微观理解则从实体层面和关系层面来开展。具体工作主要有:1.本文提出一个基于胶囊网络的问句分类模型(Cap-net)。该模型能够结合双向LSTM和注意力机制,再加上胶囊网络,提取问句更多的特征。然后根据需要,将问句按照用户意图或者答案类型进行分类。2.本文提出一个基于语义相似性的实体链接和关系检测模型。该模型使用卷积神经网络,对问句和知识图谱中的实体与关系进行向量化表示。在实体链接任务中,本文提出,将问句中识别出来的实体表述,通过实体-表述映射表,得到候选实体。然后通过本文提出基于语义相似性的实体链接模型,将问句中的实体表述链接到知识图谱的实体上。在关系检测任务中,本文提出了基于层级序列匹配的知识图谱上的关系检测模型。能够将关系分为关系层次和单词层次,更好地获取关系相关信息,来和问句进行相似性匹配。3.为验证模型的有效性,本文分别构建中英文知识图谱,然后分别对上述模型在中英文数据集上进行实验,并与其它算法进行比较,验证本文模型的可行性和有效性,结果表明本文的模型能较好完成文本分类、实体链接和关系检测任务。
基于多粒度语义匹配的知识图谱问答关键技术研究
这是一篇关于知识图谱问答,关系检测,深度双向长短时记忆网络,卷积神经网络,注意力机制的论文, 主要内容为在当前的信息时代,互联网蓬勃发展,各种知识信息爆炸性增长,人们对快速、准确地获取信息的需求促使了自动问答技术的诞生,基于自然语言的知识图谱问答系统(KBQA)正是其中的一个重要分支,它可以自动回答知识图谱中包含事实的自然语言问题,更加精准,快速且答案简洁。近年来,深度学习的方法也在KBQA中得到了广泛应用,但由于现实世界用户提问的问题多样,自然语言复杂且难以处理,现有的KBQA技术仍存在一些不足,如忽略了原始信息,难以区分同名实体等。处理KBQA问题的关键在于实体识别和关系检测两个步骤。关系检测是其中的重要步骤。为了提升关系检测的效果,保留更多更全面的原始信息,提出了一种改进的基于多粒度语义匹配,使用长短时记忆网络和卷积神经网络的关系检测模型,该模型能够利用LSTM和CNN的优势分别获取语义级和单词级的匹配信息,模型左边的部分是基于不同关系粒度和层次的深度双向长短时记忆网络(Bi-LSTMs),用于从语义层面进行建模:首先提取关系的三个层次信息:relation-level、word-level以及与关系相关的主题实体类型,其次使用深度双向长短时记忆网络(BiLSTMs)来学习不同层次的问题表示,第三使用一种注意力机制来同时跟踪实体和关系,最后还运用了一种残差学习方法来完成问题和关系的层次匹配。模型右边则使用了基于三维卷积的卷积神经网络,从单词的角度上进行建模。为了检测这个模型的效果,还构建了一个简单的KBQA系统。实验结果显示,这个方法提高了关系检测的准确率,它帮助本论文中的KBQA系统在单关系(简单问题)和多关系(Web QSP)QA基准测试中都有了更好的表现。
基于深度学习的丝绸知识库问答系统关键技术研究及应用
这是一篇关于问答系统,命名实体识别,关系检测,丝绸知识库,迁移学习,对抗学习的论文, 主要内容为丝绸是中华文化的重要组成部分,充分研究和利用丝绸文物资源,对于弘扬传统文化精神,增强民族自信心和影响力有着重要的意义。当前丝绸文物的数字化平台建设已经取得了一定的进展,但是对于深度挖掘丝绸文物资源并且结合当前学术前沿热点仍缺乏相关的研究和应用,无法满足人们日益提升的文化需求。随着信息技术的不断发展,传统的关键字检索服务越来越难以满足人们的需求。问答系统作为一种高级的信息检索方式,使得机器能够理解人类提出的自然语言问题,正逐渐成为人机交互的新形势。另外,知识库的建立和发展,一方面为问答系统提供了丰富的数据资源,另一方面也对问答系统的性能和效果提出了新的要求。当前基于知识库的问答系统存在一些实体识别准确率不高和词汇溢出的问题。针对上述问题,本文分别对命名实体识别任务和关系检测任务进行了深入的研究和探讨,设计并实现了基于丝绸知识库的问答系统。主要工作如下:1)为了提升问答系统的命名实体识别的准确率,针对丝绸领域的实体命名特点,本文首先提出了一种新的实体分类方法和分词方法,然后提出了一种基于BERT+CRF的融合模型。通过迁移学习的方法,利用BERT的预训练数据,同时结合具体的命名实体识别任务,对参数进行微调。最后通过CRF对结果进行参数约束和解码。通过实验进行对比分析,该模型实现了命名实体识别的准确率提高了2.4%。2)为了缓解词汇溢出的问题,提出了基于对抗学习适配器的关系检测模型。首先通过Trans H模型对关系向量进行预训练。然后借鉴对抗学习的思想,训练一个关系适配器,通过生成器和判别器不断对抗训练,学习知识库的关系表示。接着通过BERT进行关系特征进一步提取和强化,得到最终的关系向量表示。通过实验对比分析,对于测试集中出现而训练集中未出现的关系向量表示失效问题得到了很好的解决,很大程度上缓解了词汇溢出的问题。最后通过与基准模型的对比实验表明,本文提出的模型在关系检测准确率上也有了一定的提升。3)基于上述提出的两个模型,基于丝绸知识库建立了一个功能模块较为齐全的知识库问答系统。问答系统采用前后端分离和B/S架构,提供了移动端和网页端两种较为常见的前台界面。将问答系统后端封装成后台服务,对外提供API形式的问答服务,并将该服务集成到现有的丝绸资源平台之上,实现了对丝绸文物资源的智能化利用和深度挖掘。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈网 ,原文地址:https://m.bishedaima.com/lunwen/55594.html