基于医疗知识图谱的智能导诊系统研究与实现
这是一篇关于医疗知识图谱,实体识别,意图分类,实体链指,槽位填充的论文, 主要内容为随着医疗数据的急速增长,传统的搜索引擎已经不能够满足人们检索医疗信息的需求,当人们使用搜索引擎进行检索时,返回的往往是一些网页链接,这些信息通常杂乱无章,需要人为去筛选。此外,医学知识的复杂多样以及用户医疗知识的匮乏都使得检索变得非常困难。问答系统的诞生给问题的解决带来了契机。将问答系统应用于医疗咨询领域形成医疗导诊系统,可以快速了解用户意图,为用户提供高质量的导诊服务。传统的导诊系统都是基于规则模板的方式去解析用户问题,面对日益增长的信息,需要大量的人力物力去构建模板库以及关键词库,受限于模板库以及关键词库的大小,此类方法对于用户问题的解析能力往往较差,查询效率不高。针对上述情况,本文利用医疗知识图谱来研究与实现智能导诊系统,通过此系统为用户提供诸如疾病查询、科室查询、鉴别诊断等医疗导诊服务,利用深度学习技术对用户问题进行智能化的解析,极大提高了问题解答的能力。本文主要包含以下几个方面的工作:1.构建一种基于医疗知识图谱的智能导诊系统模型。该模型由医疗知识图谱模块、用户交互模块、问题理解模块、问题解答模块、测试模块共五个模块构成。2.给出医疗知识图谱的构建方法。使用爬虫技术从医疗网站上爬取信息,并将其保存到数据库中,接着根据医疗知识图谱的概念层设计,将爬取的医疗数据以“实体-关系-实体”或“实体-属性-属性值”的三元组的形式存储到图数据库中,从而实现医疗知识图谱的构建。3.给出医疗问题智能理解方法。用户问题的理解包含医疗实体识别和意图分类两个任务。在医疗实体识别任务中,使用BERT-IDCNN-Attention-CRF算法去识别用户问题中是否包含疾病、症状、治疗方式等实体。在意图分类任务中,使用BERT+Bi LSTM+Multi Head-Attention算法来判断用户是否想要进行疾病查询、科室查询、鉴别诊断等医疗服务。本文通过这两个任务实现了对用户问题的智能化解析。通过对比实验可以看出本文使用的医疗实体识别算法相较于经典算法BERT-Bi LSTM-CRF,在查准率、召回率、F1值上分别提高了0.51%、2.08%、1.29%。使用的意图分类算法与经典算法BERT-Text CNN相比,在查准率、召回率、F1值上分别提高了0.21%、3.08%、1.86%。同时,本文还对问题理解的准确率进行了实验,将本文给出的两个算法作用于同一个问题上时,能够同时抽取正确实体和正确意图的准确率为89%,进一步表明了本文所给的医疗问题智能理解方法的有效性。4.给出医疗问题解答导诊方法。首先通过Sentencetransformers库函数将识别出的实体映射到医疗知识图谱对应的实体上,根据回复策略、链指后的实体以及用户意图生成对应的Cypher语句去知识图谱中进行答案的查询,最后将匹配的最佳结果通过网页形式反馈给用户。5.实现并运行测试智能导诊系统。首先对系统的各个功能进行了编码实现,然后对整个导诊系统进行了运行测试。运行测试结果表明,在共270个医疗相关问题上,本系统在疾病查询、科室查询、鉴别诊断等9个方面都可以做出很好的回答。通过对本文构建的医疗知识图谱智能导诊系统进行的测试以及系统的整体运行情况可以看出,一方面通过本文给出的问题理解方法提高了对用户问题理解的准确率,另一方面在问题解答时,使用实体链指、槽位填充、知识图谱查询技术的确能够得到高效、准确的导诊答案。因此,本文构建的医疗知识图谱智能导诊系统能够很好地帮助用户进行科室查询、自我诊察等导诊服务,减轻了医院医生的工作量,方便了用户的就诊。
基于医疗知识图谱的智能导诊系统研究与实现
这是一篇关于医疗知识图谱,实体识别,意图分类,实体链指,槽位填充的论文, 主要内容为随着医疗数据的急速增长,传统的搜索引擎已经不能够满足人们检索医疗信息的需求,当人们使用搜索引擎进行检索时,返回的往往是一些网页链接,这些信息通常杂乱无章,需要人为去筛选。此外,医学知识的复杂多样以及用户医疗知识的匮乏都使得检索变得非常困难。问答系统的诞生给问题的解决带来了契机。将问答系统应用于医疗咨询领域形成医疗导诊系统,可以快速了解用户意图,为用户提供高质量的导诊服务。传统的导诊系统都是基于规则模板的方式去解析用户问题,面对日益增长的信息,需要大量的人力物力去构建模板库以及关键词库,受限于模板库以及关键词库的大小,此类方法对于用户问题的解析能力往往较差,查询效率不高。针对上述情况,本文利用医疗知识图谱来研究与实现智能导诊系统,通过此系统为用户提供诸如疾病查询、科室查询、鉴别诊断等医疗导诊服务,利用深度学习技术对用户问题进行智能化的解析,极大提高了问题解答的能力。本文主要包含以下几个方面的工作:1.构建一种基于医疗知识图谱的智能导诊系统模型。该模型由医疗知识图谱模块、用户交互模块、问题理解模块、问题解答模块、测试模块共五个模块构成。2.给出医疗知识图谱的构建方法。使用爬虫技术从医疗网站上爬取信息,并将其保存到数据库中,接着根据医疗知识图谱的概念层设计,将爬取的医疗数据以“实体-关系-实体”或“实体-属性-属性值”的三元组的形式存储到图数据库中,从而实现医疗知识图谱的构建。3.给出医疗问题智能理解方法。用户问题的理解包含医疗实体识别和意图分类两个任务。在医疗实体识别任务中,使用BERT-IDCNN-Attention-CRF算法去识别用户问题中是否包含疾病、症状、治疗方式等实体。在意图分类任务中,使用BERT+Bi LSTM+Multi Head-Attention算法来判断用户是否想要进行疾病查询、科室查询、鉴别诊断等医疗服务。本文通过这两个任务实现了对用户问题的智能化解析。通过对比实验可以看出本文使用的医疗实体识别算法相较于经典算法BERT-Bi LSTM-CRF,在查准率、召回率、F1值上分别提高了0.51%、2.08%、1.29%。使用的意图分类算法与经典算法BERT-Text CNN相比,在查准率、召回率、F1值上分别提高了0.21%、3.08%、1.86%。同时,本文还对问题理解的准确率进行了实验,将本文给出的两个算法作用于同一个问题上时,能够同时抽取正确实体和正确意图的准确率为89%,进一步表明了本文所给的医疗问题智能理解方法的有效性。4.给出医疗问题解答导诊方法。首先通过Sentencetransformers库函数将识别出的实体映射到医疗知识图谱对应的实体上,根据回复策略、链指后的实体以及用户意图生成对应的Cypher语句去知识图谱中进行答案的查询,最后将匹配的最佳结果通过网页形式反馈给用户。5.实现并运行测试智能导诊系统。首先对系统的各个功能进行了编码实现,然后对整个导诊系统进行了运行测试。运行测试结果表明,在共270个医疗相关问题上,本系统在疾病查询、科室查询、鉴别诊断等9个方面都可以做出很好的回答。通过对本文构建的医疗知识图谱智能导诊系统进行的测试以及系统的整体运行情况可以看出,一方面通过本文给出的问题理解方法提高了对用户问题理解的准确率,另一方面在问题解答时,使用实体链指、槽位填充、知识图谱查询技术的确能够得到高效、准确的导诊答案。因此,本文构建的医疗知识图谱智能导诊系统能够很好地帮助用户进行科室查询、自我诊察等导诊服务,减轻了医院医生的工作量,方便了用户的就诊。
基于医疗疾病知识图谱的自动问答技术研究
这是一篇关于知识图谱,实体识别,意图分类,问答系统的论文, 主要内容为知识图谱以三元组的形式存储数据,将互联网中错综复杂的数据结构化,相较于传统数据库,包含更多语义信息。基于知识图谱的自动问答,通过对用户输入问句的智能语义解析,反馈用户需要的问题答案,更加符合用户需求。特别在医疗领域,不再反馈简单排序的问答结果,用户不需要对返回结果进行辨别和筛选,降低用户获取信息成本,提高网络信息的利用率。本文研究并实现了基于医疗疾病知识图谱的问答系统,搭建神经网络模型解析用户输入问题,将其转换成知识库对应的查询语言,在已建立的医疗疾病知识图谱中检索出相应的答案,并将答案嵌套入回复模板中返还给用户。本文的核心研究内容主要有以下几个方面:(1)构建医疗疾病知识图谱。基于自动问答这一应用目的,设计并构建了医疗疾病本体,并通过知识抽取获取不同垂直网站医疗数据,接着应用实体属性相似度加权求和得到实体相似度,进行知识融合。最后将医疗知识存储到Neo4j中,完成医疗知识图谱的构建。(2)基于医疗疾病知识图谱的自动问答算法设计与实现。采用语义解析的方法实现问答系统,对于用户输入问句的解析主要分为实体识别和意图分类两部分。对于实体识别,在原始的Bi LSTM-CRF模型的基础上,构建了多任务字-词Bi LSTM-CRF医疗实体识别模型,F1值相较于其它几种实体识别模型均有提高。对于意图分类,针对构建好的训练语料的特征,设计了Bert-Text CNN模型,利用Bert模型将句子向量化,Text CNN层通过卷积核高效的提取特征向量,最后,经过全连接层,通过激活函数得到最终的分类结果,与其它几种基准模型相比,分类效果提升。(3)基于医疗疾病知识图谱的自动问答系统设计与实现。问答系统分为数据层、逻辑层、交互层三个部分构建完成。用户通过Web端进入咨询页面输入问题,后端接收用户输入,通过算法模块解析并返还用户相应答案,实现人机交互,并支持后续知识库的更新。最终实现的问答系统对事实类问答有良好的应用效果,支持医疗相关问题的检索查询。本文通过对医疗开源数据的融合,以Web端作为交互平台,实现了基于医疗疾病知识图谱的问答系统,帮助患者查询相关疾病信息,具有一定的应用价值。
面向对话系统意图识别任务的数据增强系统设计与实现
这是一篇关于数据增强,对话系统,意图分类,生成模型的论文, 主要内容为智能对话系统是通过自然语言理解、对话管理、自然语言生成等深度学习技术,使机器理解人类语言并与人类进行有效沟通,进而根据对人类语言中的意图进行理解并执行相应任务或做出回答的系统。目前,智能对话系统的自然语言理解模型大多数基于有监督的分类模型来进行意图识别,需要使用标注大量的文本数据进行训练对话模型。但现实情况往往由于缺乏足够数据,无法使自然语言理解模型覆盖全部的样本情况,导致意图识别效果较低,模型泛化能力较差。数据增强(Data Augmentation,DA)可以在少量数据资源的情况下,通过规则匹配或模型生成的方式,实现对数据的扩充,从而提高意图识别准确率。所以,本文通过研究基于语法依赖解析树相似子结构数据增强方法和融合Mix up的生成式模型数据增强方法,设计一个有较好扩展能力且具有数据增强功能的智能对话系统。其内容包括:(1)提出一种基于语法依赖解析树相似子结构的数据增强方法。现有的基于规则的数据增强方法,忽略了样本数据之间的相似信息,不能很好地捕捉文本数据之间的相同语义信息。因此本文提出了基于语法依赖解析树相似子结构的数据增强方法,以解决少量数据资源下意图识别率不高的问题。本文通过语句生成的语法依赖解析树,在多个语句之间搜索相似子结构,根据存在相似子结构的两个语句是否属于同一类别进行同义替换或随机交换数据增强策略。对比实验结果表明,该方法在测试数据规模较小的情况下,意图识别的准确率提升幅度更大,最多可以提升8%以上。实验证明,相同子结构语义替换能够比同类方法更好地提升对话模型的意图识别能力。(2)提出了一种基于Mix up生成式序列模型的数据增强方法。在基于现有生成式模型数据增强技术的基础上,将Mix up混合插值应用在Uni LM生成式模型的隐藏层上,增强了泛化能力,提高了意图识别的准确率。通过与传统的EDA数据增强方法和基于聚合关系的上下文数据增强方法进行对比实验,结果表明该数据增强方法在意图识别任务上的准确率较上述方法平均提高了5%。实验证明本文所述方法要优于其他方法。(3)搭建了一个具有数据增强功能的智能对话系统。基于本文提出的数据增强方法,使用机器学习框架,采用Web QA数据集和人工制定数据集,尝试搭建具有数据增强功能的智能对话系统。通过对比实验,在意图数据量较小的情况下,意图命中率只有50%,经过本文提出的两种数据增强方法,意图识别命中率达到59%左右,相比于其他方法提高了大约9%。实验证明,本文的数据增强方法对于智能对话系统的提升是显而易见的。
基于数据挖掘的医疗分析系统研究
这是一篇关于知识图谱,命名实体识别,意图分类,疾病预测的论文, 主要内容为随着社会的发展,人们的生活水平显著提高,对医疗健康越来越重视。同时,国家根据时代背景提出了智慧医疗政策。为了解决当今社会医疗资源分布不均,部分地区的人们就医困难等问题,本文以数据挖掘为基础,研究并实现了在线医疗分析平台,具备精简的前端用户交互界面。论文的主要工作包括:(1)构建一定规模的中文医学知识图谱。本文从开源知识图谱、在线医疗健康网站和少部分医学文献中提取疾病数据源,并对其进行融合得到最终的数据源,存入图形数据库中。在系统运行中定时读取待更新的疾病数据文件,自动扩充知识图谱规模。(2)创建用于模型训练的中文医疗问句。本文以图谱实体为基础,套用自定义的模板和数据增强策略生成大量问句,并结合从在线医疗健康网站获得的问答对得到大量中文医疗问句。将医疗问句打上标签得到命名实体识别数据集和意图分类数据集。意图分类数据集在各类别下均匀分布。(3)设计医疗分析系统的后台数据分析算法。本文使用语句分析算法和疾病预测算法结合的后台数据分析架构。在语句分析中,BERT模型作为嵌入层,训练BERT-LSTM-CRF和BERT-CNN模型分别作为命名实体识别和意图分类模型。实验证明在自建的数据集和公开数据集上,使用BERT为嵌入层的方式与其他主流模型对比,准确率最高。在疾病预测中,用融合模型来分析疾病特征,与其他模型对比准确率最高。(4)本文搭建了一套基于数据挖掘的在线医疗分析平台,数据库中有12337条疾病信息,包含常见的疾病。在实际场景下进行测试,本系统的召回率和准确率分别达到94.1%和75.3%,查询的响应时间均低于1s,基本满足用户获取医疗信息的需求。
基于数据挖掘的医疗分析系统研究
这是一篇关于知识图谱,命名实体识别,意图分类,疾病预测的论文, 主要内容为随着社会的发展,人们的生活水平显著提高,对医疗健康越来越重视。同时,国家根据时代背景提出了智慧医疗政策。为了解决当今社会医疗资源分布不均,部分地区的人们就医困难等问题,本文以数据挖掘为基础,研究并实现了在线医疗分析平台,具备精简的前端用户交互界面。论文的主要工作包括:(1)构建一定规模的中文医学知识图谱。本文从开源知识图谱、在线医疗健康网站和少部分医学文献中提取疾病数据源,并对其进行融合得到最终的数据源,存入图形数据库中。在系统运行中定时读取待更新的疾病数据文件,自动扩充知识图谱规模。(2)创建用于模型训练的中文医疗问句。本文以图谱实体为基础,套用自定义的模板和数据增强策略生成大量问句,并结合从在线医疗健康网站获得的问答对得到大量中文医疗问句。将医疗问句打上标签得到命名实体识别数据集和意图分类数据集。意图分类数据集在各类别下均匀分布。(3)设计医疗分析系统的后台数据分析算法。本文使用语句分析算法和疾病预测算法结合的后台数据分析架构。在语句分析中,BERT模型作为嵌入层,训练BERT-LSTM-CRF和BERT-CNN模型分别作为命名实体识别和意图分类模型。实验证明在自建的数据集和公开数据集上,使用BERT为嵌入层的方式与其他主流模型对比,准确率最高。在疾病预测中,用融合模型来分析疾病特征,与其他模型对比准确率最高。(4)本文搭建了一套基于数据挖掘的在线医疗分析平台,数据库中有12337条疾病信息,包含常见的疾病。在实际场景下进行测试,本系统的召回率和准确率分别达到94.1%和75.3%,查询的响应时间均低于1s,基本满足用户获取医疗信息的需求。
基于信息抽取的英文问句意图分类
这是一篇关于信息抽取,实体提取,关系提取,意图分类,LSTM,KNN的论文, 主要内容为近年来随着AI技术的发展,问答系统技术也逐渐走向了成熟。问答系统可通过信息抽取技术来准确的理解分析自然语言问题,并返回较为准确的问题答案。根据答案的来源不同,问答系统可分为生成式问答系统和检索式问答系统。其中根据信息提供方式的不同,检索式问答系统又可分为基于搜索引擎的web信息检索与基于知识库的信息检索。随着开放知识库以及知识图谱技术的发展,知识库的检索式问答系统被广泛关注。基于知识库的问答系统主要解决由三元组(实体,关系,实体)构成的事实类问题。在信息抽取阶段,通过抽取问句中的三元组成分来理解问句。实体,关系作为我们三元组的重要组成单元,准确的抽取问句中的相关实体和关系不仅有利于更好的理解分析问句同时能够提供更加准确的问句意图领域类别。本文主要研究方向为通过抽取问句中的实体和关系信息,分析实体和关系与问句中其它关键词的潜在含义,实现问句的意图分类。本文的主要研究内容包括以下部分:实体和关系抽取的模型。本文提出了一个新的实体和关系抽取模型,该模型将整个实体和关系的抽取任务化分为两个子任务:实体和关系关键词抽取、关系映射。在实体和关系关键词抽取任务中,设计了一个新的序列标注模式和一个端到端的实体和关系关键词抽取的序列标注模型(BI-LSTM-LSTM)。在关系映射任务中,借助知识库wikidata中的信息,提取关系特征得到特征向量,并构建了特征匹配函数得到关系与关系关键词映射。问句意图分类。利用问句中的实体和关系信息构建了问句意图分类模型。根据问句中实体和关系的抽取结果将问句分成两部分:已提取出完整三元组关系的问句,未提取出完整三元组关系的问句。对于前者本文给出了基于答案实体类别路径树的问句意图分类方法。对于后者本文建立了基于KNN算法的问句意图分类算法,通过提取句子级别的特征构建句子级别的特征向量来衡量问句间的距离。为了验证上述两个模型的有效性,在Webquestion,Graph Question等相关数据集上进行了实验与分析。实验结果表明本文提出实体和关系抽取模型,同等条件下,分别在实体抽取、关系抽取、以及实体和关系综合抽取任务中都获得了高于其它模型的F1值。在问句意图分类任务方面,实验分析得出本文模型能够较好的完成英文问句意图分类任务。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设导航 ,原文地址:https://m.bishedaima.com/lunwen/46328.html