医学知识图谱构建方法研究及在疾病诊断中的应用
这是一篇关于医学知识图谱,医学实体关系抽取,知识推理,远程监督,疾病诊断的论文, 主要内容为随着医学数据量的增加,从疾病、药物、治疗、基因等医学实体中发现新知识,挖掘医学数据之间隐含的知识来辅助疾病诊断意义重大。知识图谱技术成为知识问答和领域知识发现的重要技术支撑。结合医学领域知识构建医学知识图谱,是未来智能医疗发展的推动力。然而,目前医学领域知识图谱构建存在可解释性差、效率低的问题。因此,根据医学数据的特殊性和复杂性,提高医学知识图谱的表示能力和推理能力,满足实际医学应用需求,是目前值得研究的问题。本文主要针对构建医学知识图谱时,知识自动抽取困难、语义推理能力差的问题,研究了医学知识抽取、医学知识推理方法以及在疾病诊断中的应用:1、针对文档级别医学实体关系存在多示例、远程监督在医学关系标记中存在噪音的问题,提出了一种基于强化学习的远程监督医学关系抽取模型,使用强化学习方法对远程监督进行改进。针对长短期记忆网络模型提取规则可解释性差的问题,加入触发词和位置嵌入,改进损失函数,提取出可解释性强的规则。实验结果表明,所提出的模型克服了规则可解释性差和噪音问题,达到了67.6%的F值,与基线方法相比F值提高了1.2%。2、针对现有的医学知识推理模型需要进行大量矩阵运算且复杂度较高的问题,提出了一种改进的多路径知识推理模型。考虑到医学数据的特殊性,将三元组关系与路径特征相结合,对知识图谱的知识结构进行扩展。针对知识推理存在召回率低的问题,以逻辑推理路径作为约束条件,从潜在的路径特征学习实体和关系的表示,对知识图谱进行补全。实验结果显示,MRR值达到了65.6%和60.3%,较其他经典模型提高了5.2%和4.9%。3、在医学实体关系抽取和知识推理的基础上,构建了基于马尔可夫逻辑网络的疾病诊断模型,并应用到疾病诊断系统中。针对医学知识图谱知识量大、现有的多元线性回归方法在疾病诊断中存在扩展不足的问题,将玻尔兹曼机引入马尔可夫势函数中,改变势函数的表示形式,通过玻尔兹曼机推导条件概率计算患病概率。实验结果显示,DCG值达到66%,各项性能高于其他四种疾病诊断方法。
基于文本的医学知识图谱构建方法与实现
这是一篇关于医学知识图谱,知识抽取,命名实体识别,关系分类的论文, 主要内容为医学知识图谱是人工智能技术在医学领域的研究热点之一。人们健康意识的空前提高使得当前使用因特网进行医学知识普及的趋势逐年升高。与之相对的是,当前互联网上的医学知识信息普遍存在着质量不佳的问题。随着知识图谱在医学领域的应用,使得医学知识在一般人群中普及成为可能。医学知识图谱在为人们提供直观、准确的医学知识的同时,也在一定程度上缓解了我国优质医疗资源紧缺的局面。本文提出了一种基于文本的医学知识图谱构建方法与实现。能够从海量的医学文献中,根据本文提出的流程,构建出知识图谱。在知识抽取这一重要环节,先对医学文献进行命名实体识别,在此基础上,通过基于规则的方法,提取出包含候选三元组的句子集合,然后进行关系抽取,提取出三元组。在命名实体识别和关系抽取任务中,本文分别构建了基于transformer结构的FB_T_CRF模型和FBO_T_ATT模型。在阿里天池的中文糖尿病数据集上,F1分值分别达到了较高的86.59和88.26,这充分说明了本文提出的模型具有较强的预测能力。本文实现了一种基于文本的医学知识图谱系统,能够从海量医学文献中提取出医学知识,并提供知识的可视化查询。本文展示了系统的设计过程,包括角色设计、服务器部署和web程序设计,以及系统在运行过程中业务流程的部分截图,证明了该系统具有很高的实用价值,并分析了当前系统的不足之处和之后改进方向。
基于自然语言理解的医学知识图谱构建与疾病辅助诊断系统
这是一篇关于医学知识图谱,命名实体识别,关系抽取,疾病诊断,云平台的论文, 主要内容为人口结构老龄化已成为制约我国社会现代化发展的主要问题。伴随而来的是人民日益增长的医疗需求和医疗资源供给不足的矛盾,以及医疗资源分布相对不平衡的矛盾,这些矛盾在新冠疫情期间更为尖锐和突出,医学辅助机器人应运而生。目前亟需以医学辅助机器人为硬件载体,便携式体检设备作为硬件支撑的疾病辅助诊断系统。所以本文以医学知识图谱为知识基础,构建了可处理便携式体检设备数据的疾病辅助诊断系统,可应用于医疗辅助诊断机器人与移动端。主要包括以下5个内容:(1)针对目前中文医学文本中中文词边界模糊、分词不准确而导致的传统深度学习方法难以获取词汇语义信息的问题,提出了一种融合嵌入字词特征的中文医疗命名实体识别模型。首先,针对词向量缺失边界特征的问题,将词向量与词性、词边界特征拼接融合,结合注意力机制来表征字符间依赖特征,获得增强词汇向量;其次,将通过BERT模型获得的字符向量与增强词汇向量拼接融合作为嵌入。在此基础上,利用Bi LSTM模型提取语料深层语义信息特征,最后通过CRF模型进行序列解码获取命名实体。该模型在未使用外部医学词典的情况下在命名实体识别任务获得了较好的结果。(2)针对目前医学实体关系分类方法忽略实体类型信息、实体边界信息与语句上下文信息的问题,提出了一种基于注意力机制的中文医疗关系抽取方法。首先,针对关系抽取模型缺失实体类型特征与边界特征的问题,通过引入语句跨句上下文特征,在实体对所在语句插入实体类型标签。其次,针对实体对所在语句语义不丰富的问题,引入语句跨句上下文特征。在此基础上,通过BERT预训练模型获得蕴含丰富语义的字符表示,同时引入词汇位置信息,然后通过Bi LSTM模型提取语料深层语义特征,通过注意力机制对字符特征加权求和来生成句子级别的注意力信息。最后将注意力信息通过Softmax对句子进行分类,得到最高概率标签,即为关系分类结果。该模型在关系抽取任务种取得了较高的有效性。(3)针对医学知识图谱构建过程中存在的医学语料匮乏和知识图谱本体库不完整等问题,本文结合从医学网站上爬取的医学文本特点,以及医学诊断需求,构建了健全的医学本体库,并通过计算机算法自动提取实体与关系,构建了由结构性医学知识组成的中文医学知识图谱。针对传统医学知识图谱缺乏医学经验性知识的问题,本文设计并构建医学知识图谱标注平台,通过医师标注对知识图谱进行错误检测与知识补全,补充了医学知识图谱的经验性知识。(4)针对传统深度学习诊断算法需求数据集大,诊断疾病少的问题,本文提出了基于医学知识图谱的疾病诊断模型,利用医学专家经验性知识对疾病与症状关系进行量化,对便携式体检设备数据,结合病患个性化信息与症状进行逻辑推理,最终获得诊断结果。该诊断算法可用于8878个疾病的诊断,算法在专业医师验证下获得了最高91.30%的诊断准确率。(5)从知识图谱与算法实际应用出发,提出了基于云平台的疾病辅助诊断系统。从软硬件交互的角度,提出了基于蓝牙4.0和医学规则的便携式体检硬件数据采集和处理方法。从软件设计的角度,设计了移动终端软件和网页终端软件,以及通过云平台储存和处理的医学知识图谱和疾病诊断算法。部署在云平台的医学知识库与诊断模型,用于患者疾病自查与医生辅助诊断。从云平台设计的角度,提出了基于负载均衡的云平台框架,具有更快的数据处理速度和更高的鲁棒性。该系统最终可以辅助医生与病人进行疾病的诊断,提供相应医学知识。
医学知识图谱构建方法研究及在疾病诊断中的应用
这是一篇关于医学知识图谱,医学实体关系抽取,知识推理,远程监督,疾病诊断的论文, 主要内容为随着医学数据量的增加,从疾病、药物、治疗、基因等医学实体中发现新知识,挖掘医学数据之间隐含的知识来辅助疾病诊断意义重大。知识图谱技术成为知识问答和领域知识发现的重要技术支撑。结合医学领域知识构建医学知识图谱,是未来智能医疗发展的推动力。然而,目前医学领域知识图谱构建存在可解释性差、效率低的问题。因此,根据医学数据的特殊性和复杂性,提高医学知识图谱的表示能力和推理能力,满足实际医学应用需求,是目前值得研究的问题。本文主要针对构建医学知识图谱时,知识自动抽取困难、语义推理能力差的问题,研究了医学知识抽取、医学知识推理方法以及在疾病诊断中的应用:1、针对文档级别医学实体关系存在多示例、远程监督在医学关系标记中存在噪音的问题,提出了一种基于强化学习的远程监督医学关系抽取模型,使用强化学习方法对远程监督进行改进。针对长短期记忆网络模型提取规则可解释性差的问题,加入触发词和位置嵌入,改进损失函数,提取出可解释性强的规则。实验结果表明,所提出的模型克服了规则可解释性差和噪音问题,达到了67.6%的F值,与基线方法相比F值提高了1.2%。2、针对现有的医学知识推理模型需要进行大量矩阵运算且复杂度较高的问题,提出了一种改进的多路径知识推理模型。考虑到医学数据的特殊性,将三元组关系与路径特征相结合,对知识图谱的知识结构进行扩展。针对知识推理存在召回率低的问题,以逻辑推理路径作为约束条件,从潜在的路径特征学习实体和关系的表示,对知识图谱进行补全。实验结果显示,MRR值达到了65.6%和60.3%,较其他经典模型提高了5.2%和4.9%。3、在医学实体关系抽取和知识推理的基础上,构建了基于马尔可夫逻辑网络的疾病诊断模型,并应用到疾病诊断系统中。针对医学知识图谱知识量大、现有的多元线性回归方法在疾病诊断中存在扩展不足的问题,将玻尔兹曼机引入马尔可夫势函数中,改变势函数的表示形式,通过玻尔兹曼机推导条件概率计算患病概率。实验结果显示,DCG值达到66%,各项性能高于其他四种疾病诊断方法。
基于K-BERT的临床电子病历解析技术研究
这是一篇关于命名实体识别,电子病历,K-BERT,医学知识图谱,电子病历解析管理系统的论文, 主要内容为医院在医疗信息化发展的过程中积累了大量的电子病历数据,是进一步综合利用的大数据来源。现在大多数电子病历是非结构化文本,计算机无法直接识别分析,严重影响处理效率。如何解析电子病历中的有效数据信息成为研究的热点问题。本文主要做了以下两个方面的研究。(1)命名实体识别是文本处理的基础步骤,目前研究中使用的预训练模型均是在开放领域的通用文本上训练而来,对于电子病历这种专业性强的领域文本缺乏背景知识,导致实体识别效果较差。针对预训练模型缺乏医学领域知识的问题,本文设计了一种基于K-BERT结合医学知识图谱三元组数据集的临床电子病历命名实体识别算法。该模型在电子病历输入时,结合知识图谱的三元组数据信息,将原始临床电子病历语句转换为医学知识树。同时在训练过程中利用可见矩阵将每个字符的可见区域进行限制,从而解决不相干词汇之间存在的相互干扰问题。本文研究中,采用了主流的BIO三点标注的方式,在复杂的原始电子病历文本中构建完成了主诉、辅助检查、体格检查三个中文电子病历语料库。在此真实的临床电子病历语料库基础之上来验证模型的可行性。实验结果显示,本文使用的基于KBERT模型结合医学知识图谱三元组数据集的方法在主诉、辅助检查、体格检查三个语料库中精确率分别达到了97.99%、97.31%和96.99%。与未结合知识图谱的算法相比,分别高出了0.66%、1.02%和1.07%。说明本文使用的算法在真实数据集上是可行的。同时本文还与经典传统算法Bi LSTM+CRF和Bert+Bi LSTM+CRF进行对比,精确率也高于这两个算法。也证明了本文采用的基于K-BERT结合医学知识图谱的方法在临床电子病历命名实体识别领域上具有很好的效果。(2)本文构建了一个临床电子病历解析管理系统。系统针对电子病历数据解析和可视化展示的应用需求,设计了原始电子病历命名实体识别、用户管理、疾病相关因素分析和实体标注的功能。系统同时提供筛选功能和用户数据库管理功能。本文将电子病历中的有用数据进行筛选,设计了一个供医生使用的电子病历解析管理系统。
面向中文文本的医学知识获取、表示与推理
这是一篇关于中文电子病历,医学知识网络,马尔科夫网,信息抽取,医学知识图谱的论文, 主要内容为面向文本的知识获取、表示与推理属于自然语言处理、知识表示和知识推理的交叉课题,主要研究利用自动化方法从文本中抽取三元组信息、将信息加工成为知识图谱、并利用已有知识发现新知识等问题。这些问题用于模拟智能系统从外部获取信息、生成知识结构、以及利用知识进行推理的能力,是智能体不可缺少的能力,是整个人工智能的核心。经过二十余年的发展,面向文本的知识获取、表示与推理系统在开放域中获取了一定的成功,出现了bootstrapping、远程监督(distant supervision)等一些经典的知识抽取方法;YAGO、NELL等一些大型知识库;以及Path-Ranking、Trans X等一些知识推理方法。近年来,基于深度学习的方法为知识获取和推理注入了新的活力,被证明在多数情况下可以有效提高这些算法的性能。在限定域中,开放域的通用方法与领域特点相结合,往往可以在扩展知识深度的同时,避免开放域的一些难以解决的问题,如实体消歧等。限定域知识在医疗、法律、生物等专业领域、娱乐、饮食、商务等生活领域都发挥着重要的作用。本文关注于医疗领域,研究面向中文电子病历和半结构化医学文本的医学知识获取、表示与推理的关键技术。主要包含以下三个方面:(1)面向中文电子病历的医学知识获取与表示。针对医学实体关系自动抽取精度不高的问题,本文提出医学知识网络(medical knowledge network,MKN)作为电子病历医学知识表示方法。MKN是一个仅包含医学实体,不包含医学实体关系的网络。该网络以医学实体为节点,以实体在一份电子病历中的共现关系为边。虽然以共现为关系的三元组往往不能被视为医学知识,但相比于随机网络,MKN确实显示出了一定的知识复杂性,可以在其之上构建相应的知识推理系统。(2)面向半结构化医学文本的医学知识获取与表示。电子病历作为一种单一知识源,无法覆盖临床所需的全部的医疗知识。为了从其他来源进行知识挖掘,本文提出了一套医学知识图谱构建方案,包括实体识别、实体关系抽取等知识获取模块,以及知识描述、存储、归一、校验等知识加工模块。该方案可以从半结构化医学文本中抽取三元组信息,并自动整合为一个医学知识图谱。(3)基于马尔科夫随机场的临床决策推理。面向MKN以共现关系加以组织的特点,本文提出基于马尔科夫随机场的医学知识推理框架,针对疾病诊断、检查推荐、治疗方案推荐三大临床决策问题,结合图特征、边特征、分布式表示的节点特征等构建了6种势函数,设计3种评价指标对推理系统性能进行评估。真实电子病历上的实验表明该方法可以有效从MKN中过滤出医学知识。医学知识图谱可以为MKN推理提供节点归一和解释性功能。综上所述,本文面向两大类医学文本知识源,研究了在此之上的医学知识获取、表示与推理的关键技术。在真实的电子病历和医学文本数据上测试有效,取得了初步的研究成果。我们希望这些成果能够进一步应用到更广泛的医学文本数据和医学知识推理任务上,以进一步推动自然语言处理和知识表示与推理在医学领域的研究和发展。
基于K-BERT的临床电子病历解析技术研究
这是一篇关于命名实体识别,电子病历,K-BERT,医学知识图谱,电子病历解析管理系统的论文, 主要内容为医院在医疗信息化发展的过程中积累了大量的电子病历数据,是进一步综合利用的大数据来源。现在大多数电子病历是非结构化文本,计算机无法直接识别分析,严重影响处理效率。如何解析电子病历中的有效数据信息成为研究的热点问题。本文主要做了以下两个方面的研究。(1)命名实体识别是文本处理的基础步骤,目前研究中使用的预训练模型均是在开放领域的通用文本上训练而来,对于电子病历这种专业性强的领域文本缺乏背景知识,导致实体识别效果较差。针对预训练模型缺乏医学领域知识的问题,本文设计了一种基于K-BERT结合医学知识图谱三元组数据集的临床电子病历命名实体识别算法。该模型在电子病历输入时,结合知识图谱的三元组数据信息,将原始临床电子病历语句转换为医学知识树。同时在训练过程中利用可见矩阵将每个字符的可见区域进行限制,从而解决不相干词汇之间存在的相互干扰问题。本文研究中,采用了主流的BIO三点标注的方式,在复杂的原始电子病历文本中构建完成了主诉、辅助检查、体格检查三个中文电子病历语料库。在此真实的临床电子病历语料库基础之上来验证模型的可行性。实验结果显示,本文使用的基于KBERT模型结合医学知识图谱三元组数据集的方法在主诉、辅助检查、体格检查三个语料库中精确率分别达到了97.99%、97.31%和96.99%。与未结合知识图谱的算法相比,分别高出了0.66%、1.02%和1.07%。说明本文使用的算法在真实数据集上是可行的。同时本文还与经典传统算法Bi LSTM+CRF和Bert+Bi LSTM+CRF进行对比,精确率也高于这两个算法。也证明了本文采用的基于K-BERT结合医学知识图谱的方法在临床电子病历命名实体识别领域上具有很好的效果。(2)本文构建了一个临床电子病历解析管理系统。系统针对电子病历数据解析和可视化展示的应用需求,设计了原始电子病历命名实体识别、用户管理、疾病相关因素分析和实体标注的功能。系统同时提供筛选功能和用户数据库管理功能。本文将电子病历中的有用数据进行筛选,设计了一个供医生使用的电子病历解析管理系统。
基于临床医学知识图谱的常见病诊断辅助系统
这是一篇关于医学知识图谱,临床决策支持,诊断辅助的论文, 主要内容为诊断辅助系统的设计与开发近年来一直为各大诊疗服务提供商所重视,相关产品被广泛应用于各种临床场景,对缓解我国医疗资源紧缺的问题有着重要意义。而基于知识图谱的诊断辅助系统开发更是该领域中的研究热点之一,依靠知识图谱的灵活的存储特性,使得基于图谱开发的系统在拓展性、反应速度方面远超一般系统。本文首先对知识图谱和临床决策辅助系统的研究背景和意义进行了详细介绍,同时对相关领域的国内外研究现状作了分析,接着本文基于网络数据和诊疗指南,通过自动抽取和手工标注结合的形式,建立了高质量的临床医学知识图谱,并基于图谱设计了症状特征抽取算法、症状分类算法以及疾病检索算法,实验结果也证明了这些算法具备良好的性能,所得结果也得到了专家认可,最终,基于图谱和上述算法,本文设计并开发了基于知识图谱的常见病诊断辅助系统。本文的主要工作包括以下几个方面:首先,论文设计了应用级医学知识图谱的构建流程。我们结合常见病的描述需求和诊断需要,以生物信息学领域的主流本体模型为蓝本,构建了包含症状实验室检查、药物等共计7类实体的医学本体。而后根据本体,在高质量的医学知识源中进行数据抽取,通过采用网络数据爬取和手工标注结合的半自动抽取技术,使得构建工作流程可控、质量可靠。其次,论文设计了基于主诉症状和现病史的疾病检索算法。我们参考专业医务人员在诊断过程中对疾病形成认识的过程,设计了症状分类算法和基于症状特征的疾病检索算法,利用计算机技术从海量病例中获得“临床经验”,使得为医务人员在门诊场景下提供实时、准确的疾病推荐成为可能。与目前已有的同功能算法相比,本文提出的疾病检索算法能提供与之相当甚至更优的疾病推荐结果,同时,由于本文算法完全根据医学规则设计,可解释性方面也有明显优势。最后,论文设计并实现了常见病诊断辅助系统。通过实地调研社区临床工作需求,设计并实现了常见病诊断辅助系统。该系统主要面向临床经验相对不足的社区医生,能够在症状采集阶段对当前症状的所有相关疾病进行预览,便于用户在后续的鉴别诊断环节中合理地制定工作流程。系统操作方法贴近我国医院目前常用的HIS系统形式,能够在不改变医务人员固有工作习惯的前提下,简洁有效地为使用者提供诊断辅助。通过合作医院的试用,也证明了该系统具备良好的辅助效果。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈网 ,原文地址:https://m.bishedaima.com/lunwen/49250.html