基于深度学习的心律失常多标签诊断算法研究
这是一篇关于心电图,心律失常,深度学习,多标签的论文, 主要内容为临床上,心电图是检测心律失常及其他心脏疾病的最常用的方法。大多数心律失常都可以通过10秒长度的静息十二导联心电图(常规心电图)得到诊断。常规心电图报告中可能包含一种或者多种心律失常,因此采用计算机辅助诊断常规心电图实际是一个多标签多分类的数学问题。本文提出一种适用于常规心电图诊断的深度学习模型,考虑到不同结论之间错综复杂的逻辑关系,本文还提出了一种标签修正算法,最后在Web端完成心律失常多标签诊断算法部署,实现了远程心律失常多标签快速诊断。本文的主要工作内容包括:(1)针对常规神经网络模型在心电信号场景中长距离特征依赖关系建模困难的问题,改进了原本应用在二维图像领域的Vision Transformer(Vi T)模型,将其与Goog Le Net结合,完成了Vi T模型在基于常规心电图的心律失常多标签分类场景中的应用。首先,使用预训练的Goog Le Net提取心电信号特征,然后采用Transformer Encoder构建特征全局关系,最后采用全连接层完成多标签分类,并在20409条心电数据组成的测试集上进行测试。实验结果表明,算法平均F1值达到了0.8623,平均准确率为97.68%,诊断标签完全正确的比例为83.14%,相比于Vi T模型和其他常规CNN网络,该算法在参数量和准确率上具有优势,为心律失常多标签分类任务提供了一种有效的分类模型。(2)考虑到不同心律失常之间的错综复杂的逻辑关系,本文提出了一种标签修正方法。依据不同类型的心律失常疾病的特性,将单个多标签分类问题拆解成一个多分类问题和多个多标签问题,并借鉴多任务学习的方法共享了模型已完成训练的基础权重。同时,采用正则项对于强负相关的标签在损失函数中增加额外的约束。实验结果表明,Goog Le Net-Vi T模型在使用该标签修正方法预测出相互矛盾的心律失常疾病诊断结论从171下降到3条,而Res Net34、VGG16和Efficient Net-b3等结构上差异较大的模型在使用本方法后分别从849、1615和605条下降至0条,证明了该标签修正算法的鲁棒性。该标签修正方法将心律失常疾病之间的复杂关系引入了心律失常多标签诊断算法设计中,有利于算法在真实环境中的应用。(3)针对算法应用问题,开发了心律失常远程多标签诊断的原型系统,在Web端部署了所提的心律失常多标签诊断算法。在用户完成病人信息和XML格式的心电数据上传后,算法端通过计算该心电数据的峰值系数、极值率比和短时能量判断该数据是否为噪声数据,随后计算并降维该心电数据的特征以判断是否包含未知心律失常疾病,同时使用Goog Le Net-Vi T模型进行诊断,最后输出诊断结果。此外,使用Flask和My SQL实现了对于诊断结果的管理,并通过Echarts完成了心电信号和诊断结果可视化。结果表明,该原型系统对于单条心电信号的诊断耗时为0.08秒,为心律失常远程诊断任务提供了一种可行的思路。
基于LDA模型的图书馆文献分类系统设计与开发
这是一篇关于多标签,LDA,主题模型,Labeled-LDA,Prior-LDA,文献分类的论文, 主要内容为多标签分类是机器学习领域的重要研究课题之一,多标签分类算法主要分为判别类算法和生成类算法两大类,在生成类算法中,主题模型是现今分类性能最高的算法之一。本文基于Prior-LDA模型、Dependency-LDA进行研究和实验分析,提出了改进的FP-LDA(Frequency Prior-LDA)模型和再改进的 Super-LDA 模型。LDA模型因能抽取潜在主题而被广泛应用于文本分类中。针对传统LDA模型不能引入标签信息的问题,科研人员提出了 Labeled-LDA模型,将标签与分类一一映射,实现了标签文本建模。但是,Labeled-LDA没有考虑标签出现频率,影响了分类性能。针对这一问题,科研人员又提出了 Prior-LDA模型,使训练文本从标签出现频率的分布中采样标签项,加入了标签频率的考量。但该模型存在两个问题:(1)标签分布的狄利克雷先验分布生成依赖于有限次数的采样,这种设定增加了算法的随机性,影响了分类性能;(2)该采样过程增加了算法的时间复杂度。本文在Prior-LDA模型的基础上进行改进,直接使用标签出现频率作为标签分布的先验权重,提出了 FP-LDA模型,有效解决了 Prior-LDA模型标签分布先验生成过程的随机性较高和时间复杂度较高的问题。标签相关性是影响多标签分类性能的一个重要信息,但Labeled-LDA、Prior-LDA和FP-LDA都没有考虑此信息。因此,在FP-LDA模型基础上,进一步考虑标签相关性,本文参考Dependency-LDA模型的结构,又提出了改进的Super-LDA模型。Super-LDA模型在标签层和词项层之间引入了一个主题层,每个标签对应少量的私有主题,通过主题的共现关系表达标签间的相关性。实验结果表明,FP-LDA模型和Super-LDA模型提升了多标签分类的性能。其中,Super-LDA模型的提升效果更为明显。最后,本文基于LDA模型开发设计了的图书馆文献分类系统,对图书馆文献分类系统提出了总体设计思路,安排了整体架构,详细设计了各个环节的处理流程,实现了文本的分词、去除停用词等预处理过程,实现了特征选择、特征权重评分的运算,实现了文本训练、文本分类等功能。将理论研究应用于项目实践。其中,针对语料数据的偏斜问题,本文为每一个数据量偏少的类别单独训练模型,用该类所得模型去生成数据,来补充原始训练数据集。
基于深度学习的心律失常多标签诊断算法研究
这是一篇关于心电图,心律失常,深度学习,多标签的论文, 主要内容为临床上,心电图是检测心律失常及其他心脏疾病的最常用的方法。大多数心律失常都可以通过10秒长度的静息十二导联心电图(常规心电图)得到诊断。常规心电图报告中可能包含一种或者多种心律失常,因此采用计算机辅助诊断常规心电图实际是一个多标签多分类的数学问题。本文提出一种适用于常规心电图诊断的深度学习模型,考虑到不同结论之间错综复杂的逻辑关系,本文还提出了一种标签修正算法,最后在Web端完成心律失常多标签诊断算法部署,实现了远程心律失常多标签快速诊断。本文的主要工作内容包括:(1)针对常规神经网络模型在心电信号场景中长距离特征依赖关系建模困难的问题,改进了原本应用在二维图像领域的Vision Transformer(Vi T)模型,将其与Goog Le Net结合,完成了Vi T模型在基于常规心电图的心律失常多标签分类场景中的应用。首先,使用预训练的Goog Le Net提取心电信号特征,然后采用Transformer Encoder构建特征全局关系,最后采用全连接层完成多标签分类,并在20409条心电数据组成的测试集上进行测试。实验结果表明,算法平均F1值达到了0.8623,平均准确率为97.68%,诊断标签完全正确的比例为83.14%,相比于Vi T模型和其他常规CNN网络,该算法在参数量和准确率上具有优势,为心律失常多标签分类任务提供了一种有效的分类模型。(2)考虑到不同心律失常之间的错综复杂的逻辑关系,本文提出了一种标签修正方法。依据不同类型的心律失常疾病的特性,将单个多标签分类问题拆解成一个多分类问题和多个多标签问题,并借鉴多任务学习的方法共享了模型已完成训练的基础权重。同时,采用正则项对于强负相关的标签在损失函数中增加额外的约束。实验结果表明,Goog Le Net-Vi T模型在使用该标签修正方法预测出相互矛盾的心律失常疾病诊断结论从171下降到3条,而Res Net34、VGG16和Efficient Net-b3等结构上差异较大的模型在使用本方法后分别从849、1615和605条下降至0条,证明了该标签修正算法的鲁棒性。该标签修正方法将心律失常疾病之间的复杂关系引入了心律失常多标签诊断算法设计中,有利于算法在真实环境中的应用。(3)针对算法应用问题,开发了心律失常远程多标签诊断的原型系统,在Web端部署了所提的心律失常多标签诊断算法。在用户完成病人信息和XML格式的心电数据上传后,算法端通过计算该心电数据的峰值系数、极值率比和短时能量判断该数据是否为噪声数据,随后计算并降维该心电数据的特征以判断是否包含未知心律失常疾病,同时使用Goog Le Net-Vi T模型进行诊断,最后输出诊断结果。此外,使用Flask和My SQL实现了对于诊断结果的管理,并通过Echarts完成了心电信号和诊断结果可视化。结果表明,该原型系统对于单条心电信号的诊断耗时为0.08秒,为心律失常远程诊断任务提供了一种可行的思路。
基于3DCNN的病态脊柱CT图像识别
这是一篇关于三维卷积神经网络,残差网络,空间金字塔池化层,多标签的论文, 主要内容为骨质疏松症是由于多种原因导致的骨密度和骨质量下降,骨微结构破坏,造成骨脆性增加,从而容易发生骨折的全身性骨病。该病症近些年来在以百万的数目逐年增加。医学上用来诊断该病症的辅助手段一般为CT、MRI等医学影像技术,这类技术通常会从不同角度对识别对象进行多方位断层切片成像,因此具有三维空间结构信息。而目前大多数的医学图像分析都局限在二维的检测方式,一定程度上摒弃了空间信息,极有可能出现判断的偏差。本文使用深度卷积神经网络,对病态脊柱CT影像进行处理,主要实现了基于多通道二维残差卷积网络的图像识别和三维残差卷积网络图像识别,并构建了多标签三维识别网络架构。本文的主要工作包括:1、完成病态CT脊柱数据集的构建。本文以Ver Se2019数据集为原始数据集,对数据集中的原始文件(NIFTI文件)进行图像信息的抽取,并进行归一化和精简处理,最终获得40×256×256的图像集合,并通过对图像旋转90度、180度、270度,扩充了源数据的数目,并解决了影像信息不平衡的问题。2、提出一种三维残差卷积神经网络架构,用于提取图像特征和识别病态脊柱。本模型以Res Net50残差网络为基础网络架构,辅以“softmax”分类器+多分类交叉熵损失函数的架构共同搭建而成。该模型充分利用CT影像的三维特征,最大限度地挖掘CT图像的多维信息特征,将识别对象的多方位空间信息极大程度整合起来,从而能够更高效、更准确地协助医生对病灶进行诊断。实验结果证明,使用多通道二维残差卷积网络的准确率为77.83%,而使用三维残差卷积网络的准确率达到82.35%,比二维残差卷积网络高了4.52%,证明了三维残差卷积网络的可行性和有效性。3、提出一个基于空间金字塔池化层的残差网络,并结合focal loss损失函数构建识别模型,用于同时识别CT多标签多分类的功能。以Res Net18残差网络为基础架构,构建了3种网络模型:(1)Res Net18+BCE(“sigmoid”分类器+二分类交叉熵损失函数);(2)Res Net18+SPP(空间金字塔池化层)+BCE;(3)Res Net18+SPP+focal loss损失函数。以上面三种模型分别搭建多标签识别架构,探寻不同架构在多标签分类中的优势及不同。实验结果为:模型1准确率为72.35%,模型2准确率为76.96%,模型3准确率为83.15%,因此证明模型3的可操作性。模型3通过使用空间金字塔池化层实现对医学图像特征的多特征提取,提高识别目标图像的准确率;损失函数focal loss的调用则是改善了正负样本极度不平衡的问题,从而使训练模型能更具有适用性和多样性,更准确地将目标CT影像分门别类。
基于深度学习的多标签抗菌肽预测研究
这是一篇关于抗菌肽预测,多标签,深度学习,蛋白质语言模型,图神经网络的论文, 主要内容为随着抗生素的滥用,细菌耐药性问题日趋严重,寻求其替代药物迫在眉睫。而具有低耐药性、天然存在于动植物体内的抗菌肽或许是可行的方案。早期研究中使用传统实验方法鉴定抗菌肽效率低下且成本高昂,因此准确预测抗菌肽的多种活性对于提高活性鉴定效率、新型药物研发等具有重要意义。随着深度学习技术的发展,现有研究在抗菌肽预测任务中取得了重要进步,但仍存在不足,亟须更有效的方法预测抗菌肽的不同活性。鉴于此,本文将蛋白质语言模型与图神经网络应用到多标签抗菌肽预测任务中,进而提升预测性能。具体地,本文的主要工作如下:(1)针对抗菌肽具有多活性的特点以及基于理化性质的序列表征不足的问题,将抗菌肽预测建模为多标签学习任务,提出了基于蛋白质语言模型的多标签抗菌肽预测方法。首先通过输入模块将抗菌肽序列数据标记化后送入蛋白质语言模型,得到序列数据的全局特征嵌入。其次基于Text CNN使用不同的卷积大小以捕获序列特征的局部信息。为每个标签加权以解决标签数量不平衡问题,引入聚焦损失函数加强对少样本标签的学习。最后通过实验验证了该方法的有效性。(2)针对目前抗菌肽预测仅使用序列特征的不足,提出了结合序列与结构信息的多标签抗菌肽预测方法。通过序列比对的方式从蛋白质结构数据库PDB中获取对应抗菌肽结构数据集,根据蛋白质结构特性抽取结构中的标量与矢量特征,并将其与来自蛋白质语言模型的序列特征拼接后输入到图神经网络训练,用实验验证了在多标签抗菌肽预测任务中加入结构信息的有效性。(3)基于Spring Boot和Flask框架设计并实现了多标签抗菌肽预测平台,使用全部序列数据在预设的超参数下训练了基于蛋白质语言模型的多标签抗菌肽预测模型,用来提供平台的预测服务。使用Flask部署预测服务作为接口,基于Spring Boot构建网站后台,通过Http Servlet实现系统间的调用。该平台实现了对抗菌肽不同活性的快速预测。本文提出的基于蛋白质语言模型的多标签抗菌肽预测方法和结合序列与结构信息的多标签抗菌肽预测方法,旨在对于给定氨基酸序列快速预测其生物活性,以提高候选抗菌肽的筛选效率,从而进一步推动抗菌肽研发的进展。
基于3DCNN的病态脊柱CT图像识别
这是一篇关于三维卷积神经网络,残差网络,空间金字塔池化层,多标签的论文, 主要内容为骨质疏松症是由于多种原因导致的骨密度和骨质量下降,骨微结构破坏,造成骨脆性增加,从而容易发生骨折的全身性骨病。该病症近些年来在以百万的数目逐年增加。医学上用来诊断该病症的辅助手段一般为CT、MRI等医学影像技术,这类技术通常会从不同角度对识别对象进行多方位断层切片成像,因此具有三维空间结构信息。而目前大多数的医学图像分析都局限在二维的检测方式,一定程度上摒弃了空间信息,极有可能出现判断的偏差。本文使用深度卷积神经网络,对病态脊柱CT影像进行处理,主要实现了基于多通道二维残差卷积网络的图像识别和三维残差卷积网络图像识别,并构建了多标签三维识别网络架构。本文的主要工作包括:1、完成病态CT脊柱数据集的构建。本文以Ver Se2019数据集为原始数据集,对数据集中的原始文件(NIFTI文件)进行图像信息的抽取,并进行归一化和精简处理,最终获得40×256×256的图像集合,并通过对图像旋转90度、180度、270度,扩充了源数据的数目,并解决了影像信息不平衡的问题。2、提出一种三维残差卷积神经网络架构,用于提取图像特征和识别病态脊柱。本模型以Res Net50残差网络为基础网络架构,辅以“softmax”分类器+多分类交叉熵损失函数的架构共同搭建而成。该模型充分利用CT影像的三维特征,最大限度地挖掘CT图像的多维信息特征,将识别对象的多方位空间信息极大程度整合起来,从而能够更高效、更准确地协助医生对病灶进行诊断。实验结果证明,使用多通道二维残差卷积网络的准确率为77.83%,而使用三维残差卷积网络的准确率达到82.35%,比二维残差卷积网络高了4.52%,证明了三维残差卷积网络的可行性和有效性。3、提出一个基于空间金字塔池化层的残差网络,并结合focal loss损失函数构建识别模型,用于同时识别CT多标签多分类的功能。以Res Net18残差网络为基础架构,构建了3种网络模型:(1)Res Net18+BCE(“sigmoid”分类器+二分类交叉熵损失函数);(2)Res Net18+SPP(空间金字塔池化层)+BCE;(3)Res Net18+SPP+focal loss损失函数。以上面三种模型分别搭建多标签识别架构,探寻不同架构在多标签分类中的优势及不同。实验结果为:模型1准确率为72.35%,模型2准确率为76.96%,模型3准确率为83.15%,因此证明模型3的可操作性。模型3通过使用空间金字塔池化层实现对医学图像特征的多特征提取,提高识别目标图像的准确率;损失函数focal loss的调用则是改善了正负样本极度不平衡的问题,从而使训练模型能更具有适用性和多样性,更准确地将目标CT影像分门别类。
基于深度神经网络的人脸属性识别算法研究
这是一篇关于人脸属性识别,多标签,多任务,生成式对抗网络,自监督学习的论文, 主要内容为近年来,人脸属性识别已经成为计算机视觉和模式识别领域的研究热点之一。人脸属性识别任务可以定义为:给定一张人脸图像,对其中的性别、微笑、魅力等属性做出判断。人脸属性识别在图像检索、人脸识别、微表情识别、图像生成和推荐系统等领域都有很广泛的应用。然而,现实应用中,人脸姿态、光照强度等干扰因素都会严重降低人脸属性识别的准确率。传统的人脸属性识别算法需要人工设计属性特征进行识别,而基于深度学习的算法通过网络自动学习,可以在单个网络框架下训练多个属性特征,不仅属性表征性能更强,而且节省了大量时间。因此,研究基于深度学习的人脸属性识别算法富有理论价值和现实意义。本文的主要工作具体如下:(1)我们提出了一种基于深度多任务多标签卷积神经网络的人脸属性识别算法(DMM-CNN)。DMM-CNN联合训练两个相关的人脸任务(人脸特征点检测和人脸属性识别)来提高属性识别性能。针对不同属性有不同学习难度的问题,我们将人脸属性划分为两组:客观属性和主观属性,并设计了不同的子网络来分别提取两组属性的特征。在训练过程中,我们提出了一种新颖的动态权重策略来更新训练过程中每个属性的权重。此外,我们还提出了一种自适应阈值策略来有效缓解人脸属性数据集中出现的不平衡问题带来的影响。DMM-CNN算法在CelebA和LFWA数据集上分别达到了 91.70%和86.56%的准确率,超过了一些主流的人脸属性识别算法。(2)我们提出了一种基于生成式对抗网络和自监督学习的人脸属性识别算法(GAN-SSL)。该算法首先使用人脸属性合成网络生成目标属性标签的人脸图像来增强人脸属性样本。然后,我们训练一个能识别旋转类型的自监督网络。该网络可以在人脸图像没有属性标签的情况下进行自监督学习,得到一个初始模型。最后,我们调整自监督网络为人脸属性识别网络,并使用生成的标签数据和真实数据微调该网络。在CelebA,LFWA和UMDUED数据集上使用1/10的数据训练时,所提算法相对提高2.42%,3.17%和5.77%的平均准确率。GAN-SSL算法能有效缓解人脸属性识别算法中标签数据不足的问题,显著提高在小样本数据集上的人脸属性识别正确率。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码小屋 ,原文地址:https://m.bishedaima.com/lunwen/54431.html