基于深度学习的命名实体识别算法研究与系统构建
这是一篇关于命名实体识别,机器阅读理解,混合特征表示,先验信息,医疗问答系统的论文, 主要内容为近年来,自然语言处理(Natural Language Process,NLP)的快速发展使得很多下游应用融入到了生活中的方方面面。命名实体识别(Named Entity Recognition,NER)作为自然语言处理领域的重要任务,其识别的性能对很多下游应用如知识图谱、机器翻译、问答系统等都有必不可少的作用。针对NER任务,现有的先进方法中还存在一些改进方向:基于格子的模型在字级别的基础上引入词级别特征,提升了模型识别实体边界的能力,但可以引入更多的混合特征以及外部先验信息进一步提升模型性能;基于机器阅读理解(Machine Reading Comprehension,MRC)的模型为NER任务引入了先验信息,提升了实体识别的性能,但没有考虑到上下文信息以及混合特征在MRC模型中的重要作用。本文从多维度混合特征建模以及MRC方式提升NER性能的角度展开研究,主要研究工作如下:(1)提出了改进的基于格子模型的NER方法,SLBERT。该方法旨在使用MRC的方式,为格子模型引入先验信息,从而提升模型性能。在问题建模阶段,对每个实体构造自然语言问题,并与原始的文本进行拼接,构造的自然语言问题即为引入的先验信息。在特征提取阶段,提取文本的句子特征与字、词特征融合,编码更多维度的特征到特征矩阵中以进行后续的Token分类。通过为模型引入外部先验信息以及为模型融入更多混合特征,提高模型命名实体识别的性能。(2)提出了一种新型的基于MRC的NER方法,GFMRC。该方法使用丰富的样本信息以及混合特征增强MRC模型以提升模型性能。在预处理阶段,对初始的MRC数据集形式的样本拼接上N-gram信息,即为每条样本加上上下文。在特征提取阶段,基于MRC编码层得到的特征,为每个Token分别使用CNN提取全局特征,使用LSTM提取局部特征,并融合三种特征。并且,在Token分类阶段,提出使用多任务的方式过滤负样本,进一步降低模型误判的可能。通过为MRC引入上下文以及混合特征的方式,提高模型实体识别的性能。(3)基于上述提出的算法,构建一个医疗智能问答系统,主要功能模块有智能问答、用户评价、问题管理以及问题统计。该系统能够智能分析用户输入的问题,并查询知识图谱,自动化返回问题对应的答案。同时系统提供用户反馈的端口,接收用户对于智能回答的评价。并且系统实现了量化统计的功能,可以统计智能回答质量不高的问答类型,进而可以针对性得提升系统性能。在该系统的智能问答模块中,使用本文提出的命名实体识别算法进行实体识别,通过更准确得识别命名实体,进一步提升了模型理解用户问题的能力,从实践的角度证明了本文提出算法的实用性。
基于知识图谱的医疗问答系统设计与实现
这是一篇关于知识图谱,属性链接,医疗问答系统的论文, 主要内容为现今人们对医疗健康的关注度持续增长,许多人会更加倾向于通过互联网搜索医疗健康相关的知识信息。通常情况下,人们在搜索疾病健康等相关内容的时候,搜索引擎所返回的结果太多且没有真正理解用户的意图,而医疗类网站往往又过于专业繁杂,普通用户需要耗费大量时间和精力去筛选寻找所需信息,无法快速准确的得到真正关心的信息。因此,为了能够处理上述问题,本文设计并开发实现了基于知识图谱的医疗问答系统。论文中的主要工作首先是构建了一个医疗知识图谱,通过对互联网上医疗类网站中的知识进行获取,采用基于规则词典的方法进行医疗类实体及其之间关系属性的提取,通过Neo4j数据库对医疗知识进行组织和存储,包含了与疾病、症状、饮食等相关的多类实体及关系属性,最后组织构建了一个医疗知识图谱。其次是结合构建的医疗知识图谱,以其作为知识基础,对医疗问答系统算法进行设计实现,使用了实体识别以及基于长短期记忆(LSTM)网络结构的属性链接算法来计算问题意图和相关关系属性之间的对应程度,实验结果表明准确率达到了 87.3%,同时结合医疗知识图谱搜索,可应用于问答模块流程当中。最后基于上述构建的医疗知识图谱以及相关算法,本文开发实现了基于知识图谱的医疗问答系统,包含用户医疗问答服务以及医疗知识图谱可视化应用等模块。目前面向大众的即时医疗问答系统十分少见,因此本文所构建的系统能够为大众提供便捷的医疗问答服务从而缓解上述困境,具有重要应用价值。其次现今在中文领域的医疗健康类知识图谱实属罕见,因此本文所构建的医疗知识图谱,可以作为智能问答或者搜索等应用的知识基础,且方便扩展和迁移,具有广泛的应用前景。
基于知识图谱的医疗问答系统设计与实现
这是一篇关于知识图谱,属性链接,医疗问答系统的论文, 主要内容为现今人们对医疗健康的关注度持续增长,许多人会更加倾向于通过互联网搜索医疗健康相关的知识信息。通常情况下,人们在搜索疾病健康等相关内容的时候,搜索引擎所返回的结果太多且没有真正理解用户的意图,而医疗类网站往往又过于专业繁杂,普通用户需要耗费大量时间和精力去筛选寻找所需信息,无法快速准确的得到真正关心的信息。因此,为了能够处理上述问题,本文设计并开发实现了基于知识图谱的医疗问答系统。论文中的主要工作首先是构建了一个医疗知识图谱,通过对互联网上医疗类网站中的知识进行获取,采用基于规则词典的方法进行医疗类实体及其之间关系属性的提取,通过Neo4j数据库对医疗知识进行组织和存储,包含了与疾病、症状、饮食等相关的多类实体及关系属性,最后组织构建了一个医疗知识图谱。其次是结合构建的医疗知识图谱,以其作为知识基础,对医疗问答系统算法进行设计实现,使用了实体识别以及基于长短期记忆(LSTM)网络结构的属性链接算法来计算问题意图和相关关系属性之间的对应程度,实验结果表明准确率达到了 87.3%,同时结合医疗知识图谱搜索,可应用于问答模块流程当中。最后基于上述构建的医疗知识图谱以及相关算法,本文开发实现了基于知识图谱的医疗问答系统,包含用户医疗问答服务以及医疗知识图谱可视化应用等模块。目前面向大众的即时医疗问答系统十分少见,因此本文所构建的系统能够为大众提供便捷的医疗问答服务从而缓解上述困境,具有重要应用价值。其次现今在中文领域的医疗健康类知识图谱实属罕见,因此本文所构建的医疗知识图谱,可以作为智能问答或者搜索等应用的知识基础,且方便扩展和迁移,具有广泛的应用前景。
基于自然语言处理的智能医疗问答系统
这是一篇关于医疗问答系统,预训练语言模型,命名实体识别,孪生网络,知识图谱的论文, 主要内容为近年来,由于互联网的快速发展,网络中的内容与信息呈爆炸式增长,非专业人员想要从搜索引擎获取有效医疗信息的难度进一步加大。同时,由于我国的医疗建设水平无法跟上患者的就医需求,医患矛盾的现象始终得不到根本的解决,所以问诊难的问题普遍存在。随着大数据和人工智能时代的到来,人们获取各类信息的方式开始变得更加敏捷和高效,加快实现医学领域的信息化是一个迫切且具有重要意义的问题。为了方便患者在需要就医时能及时地问诊,并且获取到专业且人性化的回答,本文设计并实现了一个医疗领域的检索式问答系统。本文利用自然语言处理技术,主要聚焦于构建一个结合预训练语言模型和实体匹配的检索式问答系统。本文的主要工作包括:(1)本文提出一种基于预训练语言模型和孪生网络结构的文本语义匹配模型FusionLM。此模型在BERT等预训练语言模型的基础上引入孪生网络结构,通过融合问题答案对中的多种语义相似度特征,可以学到问题答案对中更深层次的匹配信息。本文在公开数据集上对FusionLM进行实验,模型的效果达到了答案选择任务中的先进水平,从而可以更好地辅助完成问答系统中的答案选择模块。(2)本文提出一种基于实体匹配的答案选择增强算法。本文在传统的检索式问答系统架构中引入实体匹配评分,将命名实体识别和知识图谱作为实体评分的模块,并加入到检索式问答系统中,作为辅助选择最佳答案的评分依据。本文通过在公开数据集上对此算法进行实验,实验发现加入了实体匹配模块的文本匹配模型能够在答案选择任务上有效提高答案选择的准确率。(3)本文构建了智能医疗问答系统并开发出相应线上平台。本文通过收集大规模的医疗问答帖,将上述两种算法进行实践,在检索式问答系统架构的基础上,设计出了一种结合多种信息的评分机制,并构建出了完整的医疗问答系统。本文通过对问答系统进行人工测评,证实了其回答的有效性和准确性。本文基于问答系统架构开发了实时在线的智能医疗问答系统平台,以供病人和医生对医疗问题进行查询。
基于知识图谱的医疗问答系统设计与实现
这是一篇关于知识图谱,属性链接,医疗问答系统的论文, 主要内容为现今人们对医疗健康的关注度持续增长,许多人会更加倾向于通过互联网搜索医疗健康相关的知识信息。通常情况下,人们在搜索疾病健康等相关内容的时候,搜索引擎所返回的结果太多且没有真正理解用户的意图,而医疗类网站往往又过于专业繁杂,普通用户需要耗费大量时间和精力去筛选寻找所需信息,无法快速准确的得到真正关心的信息。因此,为了能够处理上述问题,本文设计并开发实现了基于知识图谱的医疗问答系统。论文中的主要工作首先是构建了一个医疗知识图谱,通过对互联网上医疗类网站中的知识进行获取,采用基于规则词典的方法进行医疗类实体及其之间关系属性的提取,通过Neo4j数据库对医疗知识进行组织和存储,包含了与疾病、症状、饮食等相关的多类实体及关系属性,最后组织构建了一个医疗知识图谱。其次是结合构建的医疗知识图谱,以其作为知识基础,对医疗问答系统算法进行设计实现,使用了实体识别以及基于长短期记忆(LSTM)网络结构的属性链接算法来计算问题意图和相关关系属性之间的对应程度,实验结果表明准确率达到了 87.3%,同时结合医疗知识图谱搜索,可应用于问答模块流程当中。最后基于上述构建的医疗知识图谱以及相关算法,本文开发实现了基于知识图谱的医疗问答系统,包含用户医疗问答服务以及医疗知识图谱可视化应用等模块。目前面向大众的即时医疗问答系统十分少见,因此本文所构建的系统能够为大众提供便捷的医疗问答服务从而缓解上述困境,具有重要应用价值。其次现今在中文领域的医疗健康类知识图谱实属罕见,因此本文所构建的医疗知识图谱,可以作为智能问答或者搜索等应用的知识基础,且方便扩展和迁移,具有广泛的应用前景。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计客栈 ,原文地址:https://m.bishedaima.com/lunwen/56235.html