基于知识图谱的阻生智齿拔除手术路线研究
这是一篇关于阻生智齿,自然语言处理,命名实体识别,医学知识图谱,推荐算法的论文, 主要内容为随着人们生活水平的提高,维护口腔健康越来越得到人们的重视,其中阻生智齿、尤其是下颌阻生智齿的发病率很高,术后并发症多。对于手术细节,如切口大小、切口角度等没有系统的理论依据,细节依然凭借医生经验或根据术中现实来具体制定。同时知识图谱的关系表达能力强,可以处理复杂多样的关联分析。因此,本课题利用知识图谱的优势,将知识图谱技术应用到阻生智齿拔除手术方案推荐中。论文主要研究成果如下:(1)针对经典BiLSTM模型对局部空间特征提取不足的问题,本文提出了基于卷积神经网络构建的模型imConvNet,将其与BiLSTM模型结合,取得了优于单一模型的效果。在对于训练语料较少的问题上,本文采用BERT预训练中文模型,命名实体识别的效果得到大幅提升。最后我们构建了BERT-imConvNetBiLSTM-CRF模型,通过在Yidu-S4K数据集上训练测试、设计对比试验,可以看出我们设计的模型性能优于其它模型,在中文医学命名实体识别任务中取得了不错的效果。(2)针对口腔医学领域,尤其是阻生智齿方面没有相关研究数据,本文根据从贵阳市口腔医院获取的207份临床病历及CBCT影像学数据,整理出了阻生智齿领域的原始语料;同时使用Doccano标注工具,进行了实体标注,构建出阻生智齿数据集。之后利用知识图谱相关知识,构建出阻生智齿知识图谱。(3)选择基于用户的协同过滤算法,形成了对阻生智齿拔除手术方案的推荐路径。并选用Qt图形用户界面开发框架,基于用户需求,进行了图形用户界面设计,最终完成了对手术方案推荐路径的研究。
基于文本的医学知识图谱构建方法与实现
这是一篇关于医学知识图谱,知识抽取,命名实体识别,关系分类的论文, 主要内容为医学知识图谱是人工智能技术在医学领域的研究热点之一。人们健康意识的空前提高使得当前使用因特网进行医学知识普及的趋势逐年升高。与之相对的是,当前互联网上的医学知识信息普遍存在着质量不佳的问题。随着知识图谱在医学领域的应用,使得医学知识在一般人群中普及成为可能。医学知识图谱在为人们提供直观、准确的医学知识的同时,也在一定程度上缓解了我国优质医疗资源紧缺的局面。本文提出了一种基于文本的医学知识图谱构建方法与实现。能够从海量的医学文献中,根据本文提出的流程,构建出知识图谱。在知识抽取这一重要环节,先对医学文献进行命名实体识别,在此基础上,通过基于规则的方法,提取出包含候选三元组的句子集合,然后进行关系抽取,提取出三元组。在命名实体识别和关系抽取任务中,本文分别构建了基于transformer结构的FB_T_CRF模型和FBO_T_ATT模型。在阿里天池的中文糖尿病数据集上,F1分值分别达到了较高的86.59和88.26,这充分说明了本文提出的模型具有较强的预测能力。本文实现了一种基于文本的医学知识图谱系统,能够从海量医学文献中提取出医学知识,并提供知识的可视化查询。本文展示了系统的设计过程,包括角色设计、服务器部署和web程序设计,以及系统在运行过程中业务流程的部分截图,证明了该系统具有很高的实用价值,并分析了当前系统的不足之处和之后改进方向。
基于医学知识图谱的在线健康社区分面检索研究
这是一篇关于在线健康社区,医学知识图谱,分面检索,在线健康信息的论文, 主要内容为随着《“健康中国2030”规划纲要》的推进、互联网通信技术的发展与民众健康意识的提升,在线健康社区得到了广泛关注。由于在线健康社区的便利、高效、易获取等优势,成为了公众获取健康信息、提升健康素养甚至是寻医问诊的重要渠道。然而,当前线健康社区的管理服务中仍存在诸如资源组织语义化程度不高、集成维度较低、服务方式单一等方面的问题,严重制约着其健康信息的利用效率。一方面,在线健康信息的规模庞大,且多以非结构化的方式呈现,用户难从检索结果中筛选出感兴趣的健康内容;另一方面,由于医学知识本身存在的复杂性导致用户难以理解,其健康需求存在较大的不确定性,检索广度与灵活性均受到限制,不利于实现健康信息的检索扩展。以何种方式实现在线健康社区信息资源的合理组织,如何为用户提供动态化、精准化的优质服务,均成为其管理服务工作中亟待解决的重点与难点问题。基于此,本文在充分梳理国内外在线健康社区信息组织与服务相关研究的基础上,提出借助知识图谱实现在线健康社区分面检索的技术路径,通过优化在线健康社区导航效果以提升其资源利用率。研究工作主要包括3个方面:首先,在分析并归纳在线健康社区用户需求主题基础上,以结构化数据、半结构化数据以及非结构化数据为来源,对当前已有的医学知识图谱进行选择性利用,从知识抽取、知识融合、知识图谱存储3个环节构建面向在线健康社区的医学知识图谱。其次,构建基于医学知识图谱的在线健康社区分面检索模型,借助医学知识图谱在揭示实体及实体关系方面的巨大优势,将其应用于指导在线健康社区分面体系构建、分面与焦点排序方案制定、分面展示控制策略实施的全过程。最后,以“宫颈炎”为具体应用背景、以39健康网妇科板块为数据来源开展实证研究,构建基于医学知识图谱的在线健康社区分面检索原型系统并予以实现,以期验证所提出的在线健康社区分面检索模型的科学性、合理性与高效性。本文所构建的面向在线健康社区的医学知识图谱,以及基于医学知识图谱所实现的在线健康社区分面检索模型,旨在优化在线健康社区的信息组织方式与信息导航效果,减轻用户的认知负担,使其快速、精准的定位所需健康信息,从而进一步提升用户体验。
基于深度学习和知识图谱的医疗文本应用研究
这是一篇关于命名实体识别,医学知识图谱,深度学习,知识交互,注意力机制的论文, 主要内容为在医工融合的大势所趋下,将人工智能技术应用于解决医疗领域相关问题成为了热门的研究方向。本文重点关注医疗文本的实际应用场景,希望通过自然语言处理技术解决行业痛点,帮助医疗领域实现信息化、数字化、智能化。本文主要完成了以下工作:(1)医疗文本命名实体识别。选择了分词与字典的模型、条件随机场模型、双向长短时记忆网络结合条件随机场的模型(Bi-LSTM-CRF)依次展开研究。对采用的开源电子病历数据集进行了预处理、频次统计分析和可视化展示。通过实验对比发现,基于字符的Word2vec的Bi-LSTM-CRF模型表现最优,查准率为80%、召回率为80%。该模型方法将用于后续构建医学知识图谱和医疗导诊分类的应用研究。(2)构建医学知识图谱。选择了专业医药信息网站作为数据源,通过数据清洗、实体识别等方法处理后得到共计得到22 040个医学知识实体、137 732条实体关系。使用了Neo4j图数据库构建医学知识图谱,并通过查询语句对部分医学实体样例进行了可视化展示。(3)医疗导诊分类研究。提出了知识交互的注意力网络(Knowledge Interactive Attention Network,KIAN)医疗导诊模型用于患者主诉短文本的分类。该模型引入了外部专业医学知识实体,并利用注意力机制判断知识实体对短文本的重要性和关联性。本文采用了基于自注意力机制的循环神经网络KIAN-LSTM模型和基于卷积神经网络的KIAN-CNN模型在共计24类的患者主诉短文本数据集中进行了实验和分析。另外,选择了其它5种主流的文本分类方法作为对比。结果发现,本文提出的知识交互的注意力网络(KIAN)医疗导诊模型综合表现最优,其分类精度都要高于其它方法约1~2个百分点。KIAN-LSTM以字符或词语为输入时,精度分别达到了80.65%和82.65%,宏F1分别达到了78.59%和79.66%。KIAN-CNN以字符或词语为输入时,精度分别达到了84.6%和85.1%,宏F1分别达到了82.45%和82.71%。
医学知识图谱构建方法研究及在疾病诊断中的应用
这是一篇关于医学知识图谱,医学实体关系抽取,知识推理,远程监督,疾病诊断的论文, 主要内容为随着医学数据量的增加,从疾病、药物、治疗、基因等医学实体中发现新知识,挖掘医学数据之间隐含的知识来辅助疾病诊断意义重大。知识图谱技术成为知识问答和领域知识发现的重要技术支撑。结合医学领域知识构建医学知识图谱,是未来智能医疗发展的推动力。然而,目前医学领域知识图谱构建存在可解释性差、效率低的问题。因此,根据医学数据的特殊性和复杂性,提高医学知识图谱的表示能力和推理能力,满足实际医学应用需求,是目前值得研究的问题。本文主要针对构建医学知识图谱时,知识自动抽取困难、语义推理能力差的问题,研究了医学知识抽取、医学知识推理方法以及在疾病诊断中的应用:1、针对文档级别医学实体关系存在多示例、远程监督在医学关系标记中存在噪音的问题,提出了一种基于强化学习的远程监督医学关系抽取模型,使用强化学习方法对远程监督进行改进。针对长短期记忆网络模型提取规则可解释性差的问题,加入触发词和位置嵌入,改进损失函数,提取出可解释性强的规则。实验结果表明,所提出的模型克服了规则可解释性差和噪音问题,达到了67.6%的F值,与基线方法相比F值提高了1.2%。2、针对现有的医学知识推理模型需要进行大量矩阵运算且复杂度较高的问题,提出了一种改进的多路径知识推理模型。考虑到医学数据的特殊性,将三元组关系与路径特征相结合,对知识图谱的知识结构进行扩展。针对知识推理存在召回率低的问题,以逻辑推理路径作为约束条件,从潜在的路径特征学习实体和关系的表示,对知识图谱进行补全。实验结果显示,MRR值达到了65.6%和60.3%,较其他经典模型提高了5.2%和4.9%。3、在医学实体关系抽取和知识推理的基础上,构建了基于马尔可夫逻辑网络的疾病诊断模型,并应用到疾病诊断系统中。针对医学知识图谱知识量大、现有的多元线性回归方法在疾病诊断中存在扩展不足的问题,将玻尔兹曼机引入马尔可夫势函数中,改变势函数的表示形式,通过玻尔兹曼机推导条件概率计算患病概率。实验结果显示,DCG值达到66%,各项性能高于其他四种疾病诊断方法。
基于自然语言理解的医学知识图谱构建与疾病辅助诊断系统
这是一篇关于医学知识图谱,命名实体识别,关系抽取,疾病诊断,云平台的论文, 主要内容为人口结构老龄化已成为制约我国社会现代化发展的主要问题。伴随而来的是人民日益增长的医疗需求和医疗资源供给不足的矛盾,以及医疗资源分布相对不平衡的矛盾,这些矛盾在新冠疫情期间更为尖锐和突出,医学辅助机器人应运而生。目前亟需以医学辅助机器人为硬件载体,便携式体检设备作为硬件支撑的疾病辅助诊断系统。所以本文以医学知识图谱为知识基础,构建了可处理便携式体检设备数据的疾病辅助诊断系统,可应用于医疗辅助诊断机器人与移动端。主要包括以下5个内容:(1)针对目前中文医学文本中中文词边界模糊、分词不准确而导致的传统深度学习方法难以获取词汇语义信息的问题,提出了一种融合嵌入字词特征的中文医疗命名实体识别模型。首先,针对词向量缺失边界特征的问题,将词向量与词性、词边界特征拼接融合,结合注意力机制来表征字符间依赖特征,获得增强词汇向量;其次,将通过BERT模型获得的字符向量与增强词汇向量拼接融合作为嵌入。在此基础上,利用Bi LSTM模型提取语料深层语义信息特征,最后通过CRF模型进行序列解码获取命名实体。该模型在未使用外部医学词典的情况下在命名实体识别任务获得了较好的结果。(2)针对目前医学实体关系分类方法忽略实体类型信息、实体边界信息与语句上下文信息的问题,提出了一种基于注意力机制的中文医疗关系抽取方法。首先,针对关系抽取模型缺失实体类型特征与边界特征的问题,通过引入语句跨句上下文特征,在实体对所在语句插入实体类型标签。其次,针对实体对所在语句语义不丰富的问题,引入语句跨句上下文特征。在此基础上,通过BERT预训练模型获得蕴含丰富语义的字符表示,同时引入词汇位置信息,然后通过Bi LSTM模型提取语料深层语义特征,通过注意力机制对字符特征加权求和来生成句子级别的注意力信息。最后将注意力信息通过Softmax对句子进行分类,得到最高概率标签,即为关系分类结果。该模型在关系抽取任务种取得了较高的有效性。(3)针对医学知识图谱构建过程中存在的医学语料匮乏和知识图谱本体库不完整等问题,本文结合从医学网站上爬取的医学文本特点,以及医学诊断需求,构建了健全的医学本体库,并通过计算机算法自动提取实体与关系,构建了由结构性医学知识组成的中文医学知识图谱。针对传统医学知识图谱缺乏医学经验性知识的问题,本文设计并构建医学知识图谱标注平台,通过医师标注对知识图谱进行错误检测与知识补全,补充了医学知识图谱的经验性知识。(4)针对传统深度学习诊断算法需求数据集大,诊断疾病少的问题,本文提出了基于医学知识图谱的疾病诊断模型,利用医学专家经验性知识对疾病与症状关系进行量化,对便携式体检设备数据,结合病患个性化信息与症状进行逻辑推理,最终获得诊断结果。该诊断算法可用于8878个疾病的诊断,算法在专业医师验证下获得了最高91.30%的诊断准确率。(5)从知识图谱与算法实际应用出发,提出了基于云平台的疾病辅助诊断系统。从软硬件交互的角度,提出了基于蓝牙4.0和医学规则的便携式体检硬件数据采集和处理方法。从软件设计的角度,设计了移动终端软件和网页终端软件,以及通过云平台储存和处理的医学知识图谱和疾病诊断算法。部署在云平台的医学知识库与诊断模型,用于患者疾病自查与医生辅助诊断。从云平台设计的角度,提出了基于负载均衡的云平台框架,具有更快的数据处理速度和更高的鲁棒性。该系统最终可以辅助医生与病人进行疾病的诊断,提供相应医学知识。
基于电子病历的癫痫医学知识图谱构建的研究
这是一篇关于电子病历,医学知识图谱,癫痫,实体识别,关系抽取的论文, 主要内容为自2015年起,每年二月的第二个星期一是世界癫痫日。在中国,据最新流行病学显示,癫痫病已成为仅次于头痛病的第二大神经科常见病。随着医院信息系统的推广,生物高通量技术的持续猛进,人工智能与医学相结合已是大势所趋。如何有效地组织和利用癫痫患者的电子病历,快速且准确地从这些海量文本资料中获取有效信息并发现新知识,将极大推动医学研究进步和取得重大突破。本研究将癫痫电子病历与知识图谱相结合,对知识图谱构建过程中的命名实体识别和关系抽取进行了研究,并基于Neo4j实现癫痫医学知识图谱构建与可视化展示,主要工作如下:1.提出CNN-Bi LSTM-CRF模型对癫痫患者的电子病历进行命名实体识别。本研究详细分析了癫痫电子病历的结构和语言特点,将命名实体识别作为序列标注的一种,构建了癫痫电子病历语料库。在BiLSTM-CRF基准模型的基础上,引入CNN对文本向量化的句子矩阵进行局部特征提取,捕捉到多个连续词之间的特征,在同一类特征中共享权重,在训练过程中学到抽象的空间特征。通过对比实验,结果表明本研究提出的模型在命名实体识别上优于其他基准模型。2.提出BiGRU-ATT模型对癫痫患者的电子病历中的医学实体进行关系抽取。本研究对癫痫电子病历中的医学实体关系进行分析,并在借鉴已有研究的基础上,定义其中的7种医学关系,构建了关系抽取语料库。在BiGRU模型基础上,引入自注意力机制关注分类任务中关键的语义信息,通过每个字与序列中每个字的计算,挖掘字词之间潜在的联系,提升模型分类能力。对比实验结果表明,本研究提出的模型在关系抽取任务中能取得更好的效果。3.实现了癫痫医学知识图谱的构建和可视化展示。本研究将识别出的5种医学实体和7种医学关系生成结构化的文件,导入Neo4j图数据库,利用图数据库强大的存储、检索和处理能力,实现了知识图谱的数据可视化。本研究针对癫痫患者的电子病历进行了综合分析,并以此作为数据源,进行医学实体识别和关系抽取,实现了基于Neo4j癫痫医学知识图谱的可视化。
医学知识图谱构建中的实体关系联合抽取算法研究
这是一篇关于关系抽取,医学知识图谱,序列标注,全监督学习,小样本学习的论文, 主要内容为在当前大数据时代背景下,医学领域中各种医学信息相关的文本数据呈爆炸式增长,而这些文本数据的多源异质和组织结构松散问题影响了医学信息的挖掘利用。针对这一现状,将结构化信息从医疗文本中抽取出来,以此构建存储和管理结构化医学知识的高质量医学领域知识图谱,是充分利用互联网医疗数据、挖掘医学信息的有效方法。医学关系抽取是医学知识图谱构建过程中的一项重要任务,旨在提取非结构化文本中的医学实体和实体间的关系。医学关系抽取任务得到的关系三元组是医学知识图谱数据层的重要组成成分。目前,现有的医学关系抽取框架都是基于医学文本的词法句法特点对通用领域的关系抽取方法进行微调。然而,当前性能优异的基于序列标注的关系联合抽取方法仍然面临着三元组重叠或训练效率低下的问题,且医学领域中人工标注的训练数据缺乏问题也使得全监督的通用领域关系抽取方法难以得到有效应用。针对上述两个挑战,本文研究在医学场景下的关系抽取方法,设计全监督和小样本条件下的基于序列标注的联合抽取方案,并实现一个医学知识图谱的半自动构建系统,主要内容和贡献如下:1)在全监督条件下构建了一个基于双向树型标注的医学关系联合抽取模型。首先,基于医疗文本中蕴含的树状关系结构特点,提出对重叠三元组样本的细粒度划分方法;其次,采用双向树型标注策略对不同类型样本进行处理,并将三元组信息转化为序列标注;最后,提出一个融合了医学文本词法句法特点的联合编码模型,用于双向树型标注序列的分类预测。2)在小样本条件下构建了一个基于序列标注的关系联合抽取框架,并提出了两个模型。首先,提出基于序列标注的小样本关系抽取任务的定义;其次,将基于度量的小样本方法用于基于序列标注的关系抽取模型,提出由BERT编码器、自适应编码器和度量矩阵计算三个部分组成的小样本关系联合抽取框架;最后,将本文提出的双向树型标注策略和现有的握手标注策略应用于小样本联合抽取框架,实现两个小样本关系抽取模型,并设计近似加速策略提高训练推理效率。3)进行了充分的实验和分析,验证了本文所提出框架和模型的有效性。其一,本文选用了2个医学领域数据集和3个通用领域数据集为基于双向树型标注的医学关系联合抽取模型设计一系列对比试验。在整体实验结果上看,所提出的模型在医学领域数据集上取得了2.1%~2.5%的总体指标提升,且训练效率高于其他性能接近的基准模型。其二,本文采用NYT数据集为基于序列标注的关系联合抽取框架构建了2个小样本任务,并设计一系列对比试验。在整体结果上看,所提出的框架和模型取得了9.2%~23%的总体指标提升。此外,本文设计的消融实验和案例分析进一步证明了本文模型的有效性。4)将本文所提出的模型作为关系三元组抽取模块,开发了一个医学知识图谱半自动化构建系统。在本文提出的关系抽取框架和模型基础上,添加数据标注平台界面和相关功能,以及图数据库展示界面和相关功能,开发医学知识图谱半自动构建系统。该系统提供了关系抽取模型迭代训练、三元组抽取、标注数据修改和知识图谱可视化管理等功能。
基于文本的医学知识图谱构建方法与实现
这是一篇关于医学知识图谱,知识抽取,命名实体识别,关系分类的论文, 主要内容为医学知识图谱是人工智能技术在医学领域的研究热点之一。人们健康意识的空前提高使得当前使用因特网进行医学知识普及的趋势逐年升高。与之相对的是,当前互联网上的医学知识信息普遍存在着质量不佳的问题。随着知识图谱在医学领域的应用,使得医学知识在一般人群中普及成为可能。医学知识图谱在为人们提供直观、准确的医学知识的同时,也在一定程度上缓解了我国优质医疗资源紧缺的局面。本文提出了一种基于文本的医学知识图谱构建方法与实现。能够从海量的医学文献中,根据本文提出的流程,构建出知识图谱。在知识抽取这一重要环节,先对医学文献进行命名实体识别,在此基础上,通过基于规则的方法,提取出包含候选三元组的句子集合,然后进行关系抽取,提取出三元组。在命名实体识别和关系抽取任务中,本文分别构建了基于transformer结构的FB_T_CRF模型和FBO_T_ATT模型。在阿里天池的中文糖尿病数据集上,F1分值分别达到了较高的86.59和88.26,这充分说明了本文提出的模型具有较强的预测能力。本文实现了一种基于文本的医学知识图谱系统,能够从海量医学文献中提取出医学知识,并提供知识的可视化查询。本文展示了系统的设计过程,包括角色设计、服务器部署和web程序设计,以及系统在运行过程中业务流程的部分截图,证明了该系统具有很高的实用价值,并分析了当前系统的不足之处和之后改进方向。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈 ,原文地址:https://m.bishedaima.com/lunwen/56250.html