基于数据挖掘的医疗分析系统研究
这是一篇关于知识图谱,命名实体识别,意图分类,疾病预测的论文, 主要内容为随着社会的发展,人们的生活水平显著提高,对医疗健康越来越重视。同时,国家根据时代背景提出了智慧医疗政策。为了解决当今社会医疗资源分布不均,部分地区的人们就医困难等问题,本文以数据挖掘为基础,研究并实现了在线医疗分析平台,具备精简的前端用户交互界面。论文的主要工作包括:(1)构建一定规模的中文医学知识图谱。本文从开源知识图谱、在线医疗健康网站和少部分医学文献中提取疾病数据源,并对其进行融合得到最终的数据源,存入图形数据库中。在系统运行中定时读取待更新的疾病数据文件,自动扩充知识图谱规模。(2)创建用于模型训练的中文医疗问句。本文以图谱实体为基础,套用自定义的模板和数据增强策略生成大量问句,并结合从在线医疗健康网站获得的问答对得到大量中文医疗问句。将医疗问句打上标签得到命名实体识别数据集和意图分类数据集。意图分类数据集在各类别下均匀分布。(3)设计医疗分析系统的后台数据分析算法。本文使用语句分析算法和疾病预测算法结合的后台数据分析架构。在语句分析中,BERT模型作为嵌入层,训练BERT-LSTM-CRF和BERT-CNN模型分别作为命名实体识别和意图分类模型。实验证明在自建的数据集和公开数据集上,使用BERT为嵌入层的方式与其他主流模型对比,准确率最高。在疾病预测中,用融合模型来分析疾病特征,与其他模型对比准确率最高。(4)本文搭建了一套基于数据挖掘的在线医疗分析平台,数据库中有12337条疾病信息,包含常见的疾病。在实际场景下进行测试,本系统的召回率和准确率分别达到94.1%和75.3%,查询的响应时间均低于1s,基本满足用户获取医疗信息的需求。
基于数据挖掘的医疗分析系统研究
这是一篇关于知识图谱,命名实体识别,意图分类,疾病预测的论文, 主要内容为随着社会的发展,人们的生活水平显著提高,对医疗健康越来越重视。同时,国家根据时代背景提出了智慧医疗政策。为了解决当今社会医疗资源分布不均,部分地区的人们就医困难等问题,本文以数据挖掘为基础,研究并实现了在线医疗分析平台,具备精简的前端用户交互界面。论文的主要工作包括:(1)构建一定规模的中文医学知识图谱。本文从开源知识图谱、在线医疗健康网站和少部分医学文献中提取疾病数据源,并对其进行融合得到最终的数据源,存入图形数据库中。在系统运行中定时读取待更新的疾病数据文件,自动扩充知识图谱规模。(2)创建用于模型训练的中文医疗问句。本文以图谱实体为基础,套用自定义的模板和数据增强策略生成大量问句,并结合从在线医疗健康网站获得的问答对得到大量中文医疗问句。将医疗问句打上标签得到命名实体识别数据集和意图分类数据集。意图分类数据集在各类别下均匀分布。(3)设计医疗分析系统的后台数据分析算法。本文使用语句分析算法和疾病预测算法结合的后台数据分析架构。在语句分析中,BERT模型作为嵌入层,训练BERT-LSTM-CRF和BERT-CNN模型分别作为命名实体识别和意图分类模型。实验证明在自建的数据集和公开数据集上,使用BERT为嵌入层的方式与其他主流模型对比,准确率最高。在疾病预测中,用融合模型来分析疾病特征,与其他模型对比准确率最高。(4)本文搭建了一套基于数据挖掘的在线医疗分析平台,数据库中有12337条疾病信息,包含常见的疾病。在实际场景下进行测试,本系统的召回率和准确率分别达到94.1%和75.3%,查询的响应时间均低于1s,基本满足用户获取医疗信息的需求。
基于深度学习的ERCP术后并发症预测
这是一篇关于疾病预测,深度学习,邻域清理规则,CTGAN,TabNet的论文, 主要内容为经内镜逆行胰胆管造影术(Endoscopic Retrograde Cholangiopancreatography,ERCP)是诊断和治疗胆胰管疾病的重要手段,有着优异的治疗效果。ERCP手术尽管被认为是安全的,但是仍然存在着很高的并发症风险。并发症的发生和很多因素有关,一般凭借着医生的经验进行预防和诊治,容易出现误诊或者过度治疗的情况。同时,样本中发病率往往比较低,健康人群占大多数,存在着数据集不平衡的现象,使用机器学习分类模型难以识别出患病人群。因此解决数据不平衡的情况,区分出少数类样本成为了疾病预测中的首要问题。本文的研究对象是ERCP手术患者病例,数据来源于湖北省人民医院消化内科患者病历,病历中包含有患者的有关信息和手术操作记录。主要任务是根据已有的数据信息对进行了ERCP手术的患者术后并发症发生情况进行预测,构建出一个临床预测模型。针对并发症数据集不平衡的问题,本文提出了一种基于领域清理规则(Neighborhood Cleaning Rule,NCL)和CTGAN(Covnditional Tabular GAN,CTGAN)的混合采样算法。对经过预处理的患者数据集,使用NCL-CTGAN算法,清洗多数类样本的同时,对数据集中少数类样本进行扩充,得到一个患病人数和健康人数相同的数据集。在得到的均衡数据集的基础上,使用Tab Net算法并添加高危风险因素特征构建预测模型。实验表明NCL-CTGAN算法对数据集采样后提升预测模型分类性能的效果要优于其他传统的数据采样算法,在所生成的均衡数据集上构建分类模型,有助于提高模型对少数类样本的识别能力。然后将高危风险特征与原始特征进行拼接,使用Tab Net模型预测术后并发症,相比较于其他常用的分类模型有着更优异的预测结果,深度学习模型能够学习到深层次的特征,AUC和F1有所提升,且召回率较高。这说明模型能够预测出患并发症的人群,有实际的临床应用价值。另外与不添加高危风险特征的模型进行对比和对模型特征重要性的分析,结果表明融入高危风险特征对于术后并发症的预测有所帮助。
基于电子病历的知识图谱构建与疾病预测研究
这是一篇关于深度学习,知识图谱,实体关系,疾病预测,电子病历的论文, 主要内容为医院每天都会接收大量病人,随之产生的是海量的电子病历(Electronic Medical Record,EMR)。电子病历通常包含半结构化或者非结构化的图像和文本,是一种非常宝贵的、值得挖掘和利用的资源。随着人工智能技术的发展,智慧医疗已经成为当前医学领域中的重要研究内容,医疗信息成功完成了由纸质病历到电子病历的转变,基于电子病历的研究也得到了快速发展。电子病历在数字化医疗研究中具有重要意义,一方面,电子病历可以作为辅助信息支持医生的临床决策,避免依据经验的判断失误;另一方面还可以帮助构建在线问诊平台,通过处理患者对病情的描述进行疾病预测和对症下药。但是由于电子病历的信息繁杂多样且专业术语较多,包含许多非结构化文本信息,人们想从中获取所需的信息具有一定难度,并且电子病历中的非结构化文本信息不便于存储,使其不能得到充分地利用。知识图谱作为一种语义网络技术,将真实世界中各种事物之间的联系转换为实体和关系描述,它的提出为结构化存储和充分利用电子病历提供了一种优秀的解决方案。由于现有研究对电子病历的利用大多数只抽取命名实体或者分别抽取实体和关系,割裂了实体和关系之间的联系,并且抽取准确率还有提升空间。预训练模型对于提高自然语言处理下游任务的准确率方面具有较好表现,因此本文针对中文电子病历提出一种基于预训练模型的实体关系联合抽取方法。此外,目前基于电子病历的研究通常过于侧重信息抽取,而忽略了实用成果和实际临床应用,所以本文在实体关系抽取的基础上进行了知识图谱构建和疾病预测的应用研究。本文通过分析电子病历的结构及语言特点,提出一种基于预训练模型的实体关系联合抽取方法,结合BIO标注法+类别+关系进行实体关系联合标注,基于现有的深度学习方法进行研究,提取出相关信息,并组成三元组导入Neo4j图数据库中,构建以疾病为中心的知识图谱,清晰地表示出疾病和症状之间的关系,进一步优化医生的工作。同时,基于构建的知识图谱计算疾病与症状之间的影响因子,有助于辅助预测疾病和构建在线问诊平台。实验表明,基于电子病历的知识图谱的研究有助于医学知识的抽取,并且对于智慧医疗的发展具有一定的辅助意义。
基于数据挖掘的医疗分析系统研究
这是一篇关于知识图谱,命名实体识别,意图分类,疾病预测的论文, 主要内容为随着社会的发展,人们的生活水平显著提高,对医疗健康越来越重视。同时,国家根据时代背景提出了智慧医疗政策。为了解决当今社会医疗资源分布不均,部分地区的人们就医困难等问题,本文以数据挖掘为基础,研究并实现了在线医疗分析平台,具备精简的前端用户交互界面。论文的主要工作包括:(1)构建一定规模的中文医学知识图谱。本文从开源知识图谱、在线医疗健康网站和少部分医学文献中提取疾病数据源,并对其进行融合得到最终的数据源,存入图形数据库中。在系统运行中定时读取待更新的疾病数据文件,自动扩充知识图谱规模。(2)创建用于模型训练的中文医疗问句。本文以图谱实体为基础,套用自定义的模板和数据增强策略生成大量问句,并结合从在线医疗健康网站获得的问答对得到大量中文医疗问句。将医疗问句打上标签得到命名实体识别数据集和意图分类数据集。意图分类数据集在各类别下均匀分布。(3)设计医疗分析系统的后台数据分析算法。本文使用语句分析算法和疾病预测算法结合的后台数据分析架构。在语句分析中,BERT模型作为嵌入层,训练BERT-LSTM-CRF和BERT-CNN模型分别作为命名实体识别和意图分类模型。实验证明在自建的数据集和公开数据集上,使用BERT为嵌入层的方式与其他主流模型对比,准确率最高。在疾病预测中,用融合模型来分析疾病特征,与其他模型对比准确率最高。(4)本文搭建了一套基于数据挖掘的在线医疗分析平台,数据库中有12337条疾病信息,包含常见的疾病。在实际场景下进行测试,本系统的召回率和准确率分别达到94.1%和75.3%,查询的响应时间均低于1s,基本满足用户获取医疗信息的需求。
智慧健康系统关键技术研究
这是一篇关于特征选择,疾病预测,模型融合的论文, 主要内容为随着经济水平的提高和健康管理意识的增强,使得人们对疾病的治疗和预防提出了更高的要求。而伴随医疗产业体系的快速发展,发展数字化医疗健康服务体系成为了必然趋势。在此背景下,本文通过机器学习方法建立慢性疾病预测模型,以此构建一个以疾病预防为中心的健康服务平台,通过该平台实现对用户健康数据的收集、管理和监控,提供基于个人健康数据的闭环式数据服务。具体工作内容如下:(1)实际医疗数据的组成较为复杂、数据维度较为庞大,因此本文针对医疗健康数据维度过高导致模型识别准确率不高的问题,提出一种融合URelief-F和遗传算法的混合式特征选择算法。该算法首先从Relief-F算法的R样本选取、邻居样本选取和样本权重三个方面进行优化,提出一种改进的Relief-F(URelief-F)算法。随后,结合遗传算法选择最优特征子集,通过URelief-F计算出的特征权值优化遗传算法的初始种群,一方面解决了URelief-F特征选择算法存在的特征冗余和阈值选取问题,另一方面也提高了遗传算法的收敛速度。通过实验表明,本文提出的混合式特征选择算法在6个医疗数据集中均取得了较好的效果。(2)针对原有Stacking模型中基学习器之间存在冗余以及融合基学习器时未考虑不同分类器之间性能差异的问题,从分类器多样性和融合方式上对Stacking模型进行优化。首先,利用分类准确率、差异性矩阵和密度峰值聚类算法选择准确率较高且差异性较大的分类器作为Stacking模型的基学习器,随后借鉴Ada Boost算法为每个子分类器赋予不同权值的方法对元学习器的融合方式进行优化,提高表现较好的模型在元学习器中的权重。通过实验表明,本文提出的预测算法在准确率、精确率等指标上明显优于其它算法。(3)实现了基于服务设计和Stacking预测模型的智慧健康服务平台。从服务设计角度出发,将平台划分为健康信息管理子模块、疾病风险评估子模块、健康风险干预和计划跟踪子模块,并以此构建基于个人健康数据的闭环式管理服务平台,为用户提供个性化的健康指导服务。最后,采用Spring Cloud Alibaba技术实现基于微服务思想构建的智慧健康服务平台。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计客栈 ,原文地址:https://m.bishedaima.com/lunwen/46784.html