基于全局特征的混合矿物SEM图像分割研究
这是一篇关于混合矿物图像,语义分割,深度学习,密集连接,自注意力机制,生成对抗网络的论文, 主要内容为混合矿物的组分成分检测在选矿、微波冶金工业中具有重要意义。通过对混合矿物SEM图像中的各矿物组分进行分割,可以获取矿物类别、晶粒尺寸、夹杂物含量、分布等不同物理信息,进而为后续矿物加工、热处理过程提供样品的结构、介电性能等重要参数。然而,面对混合矿物图像中非同类矿物粘连、小目标矿物语义特征较弱等复杂情况,当前图像分割方法易出现较多的矿物误检、漏检问题。因此,本文以提升矿物图像分割精度为主要目标,结合“全局特征”的思想,基于深度学习的方法开展对U-Net模型的结构设计研究,论文的主要研究内容如下:(1)针对目前基于深度学习的矿物图像分割方法存在的模型大小与分割精度难以平衡的问题,提出一种基于改进密集特征映射的混合矿物分割方法。首先根据深度可分离卷积与SE注意力机制的特性,设计出轻量级的卷积单元,然后基于密集连接大规模特征融合的特性构建主干网络,并运用于U-Net编码器以提升特征提取能力。实验表明,该方法以较低的模型参数实现了高精度的矿物分割任务,相较于基础U-Net模型,其分割指标MIo U、Recall、Precision分别提高了2.17%、0.74%、1.73%。(2)针对卷积运算难以获取全局特征关系,且易造成小目标特征遗失的问题,提出一种结合全局特征建模和特征还原的混合矿物分割方法。首先通过引入窗口自注意力机制构建全局特征依赖关系,提高模型对不同矿物的判别能力;然后结合卷积运算的归纳偏置特性,增强模型的拟合能力;最后改进U-Net的跳跃连接,通过特征相消以及通道、空间域的特征增强补偿因下采样操作遗失的小目标特征。实验表明,该模型的MIo U、Recall、Precision分别为0.9455、0.9668、0.9765,并能够有效解决矿物误检、漏检问题。(3)针对构建自注意力机制所需参数过多、不易部署的问题,提出一种基于Mobile ViT和生成对抗的混合矿物分割方法。首先在U-Net的跳跃连接中运用自注意力机制,以编码器中更完整的特征关系指导解码器输出特征的表达;然后再对参与相关性计算的特征图进行特征甄选,通过降低输入矩阵的大小来减少自注意力机制的参数量;最后基于生成对抗网络进行模型训练,根据分割结果与真实标签的误差对分割模型进行优化。实验表明,该方法的MIo U、Recall、Precision分别为0.9385、0.9648、0.9705,以少量的参数增加为代价使分割模型构建了完整的全局特征关系。
基于分割网络的SAR图像道路提取方法研究
这是一篇关于SAR图像道路提取,密集连接,注意力机制,密集空洞金字塔的论文, 主要内容为SAR图像中道路分割通过对道路特征的提取和路面元素的判别,能够实现不同复杂背景条件下不同尺度道路目标的精确检测,在战场监测、目标定位和跟踪、地图更新、地理数据库建设等军事和民用领域中,发挥着重大的作用。传统方法利用边缘检测或区域分割等方法提取道路,人工干预多,效率和性能不高。基于完全卷积神经网络(FCN)的各种方法(如U-Net)具有优秀的特征提取能力和准确的分割效果,在道路提取中发挥着越来越重要的作用。然而,与光学遥感图像相比,SAR数据集往往包含多种分辨率图像,道路特征和受到的干扰都不相同;另一方面,道路提取面临多尺度问题,需要结合不同感受野,否则提取到的特征容易产生疏漏。因此,目前的方法难以取得令人满意的结果。针对不同分辨率SAR图像数据中道路目标分割精度不高的问题,本文提出了基于密集连接和Unet的多特征级联Unet(Multi Feature Cascade-Unet,MFC-Unet)方法。通过结合U-Net和密集连接,该方法加强了特征图的传输和提取,以更有效地重复使用特征,对道路的多特征进行了级联融合。此外,考虑到道路区域的比例较小,本文引入混合注意力模块来引导网络更加关注道路目标本身。实验结果表明,与现有先进的方法相比,该方法在不同分辨率SAR道路提取方面都具有优势,特别是针对中低分辨率SAR图像,提取道路的完整度和准确度都有大幅提升。针对SAR图像中多尺度道路难以同时精确分割的问题,本文提出了基于空洞卷积的密集空洞金字塔网络(Dense Dilated Pyramid Unet,DDP-Unet)方法。该方法在MFC-Unet的基础上,采用空洞卷积替换密集连接中的普通卷积,能够使网络从不同层面上扩充出密集的感受野,进而提取到丰富的细节信息和多尺度信息,在不增大网络参数开销的同时,既保留了图像的空间特征,又减少信息损耗。试验结果表明,该方法能够更准确地提取SAR图像道路,特别是对具有多尺度道路的图像,避免了对细小道路的忽视。
基于U-Net网络的肺结节图像分割算法研究
这是一篇关于肺结节分割,U-Net,全卷积神经网络,卷积神经网络,密集连接的论文, 主要内容为在全球范围内,肺癌已成为恶性肿瘤中致死率最高的癌症。肺结节作为肺癌的早期表现形式,及时发现并加以治疗,对保证患者健康甚至延长患者寿命具有重要意义。相较于自然场景图像,肺结节在医疗影像中具有目标小、种类多、尺寸不一、与周围非结节的肺部组织易产生混淆等特点,给肺结节的精准分割带来了极大的困难。为解决现有肺结节分割算法性能不佳的问题,本文研究了基于U-Net网络的肺结节图像分割算法。输入图像特征的提取是分割至关重要的一步,直接关系到分割结果的好坏。由于肺结节图像复杂的影像学特点,导致网络提取肺结节特征十分困难。因此,本文提出了一种基于密集连接的2D U-Net网络的肺结节图像分割方法。首先在原始2D U-Net网络的编码器与解码器结构中引入密集连接结构,在不增加网络深度的前提下,增加网络各层级之间的联系,加强特征的传播和复用。然后考虑到网络训练速度的问题,为网络增加批量归一化层,改变输入数据的分布规律,加快网络的训练速度,提高网络的稳定性和泛化能力。最后通过实验表明,所提出的基于密集连接的2D U-Net网络分割性能良好,在以LUNA 16为基础的合成数据集上Dice达到90.1%的结果。考虑到2D U-Net只处理单张CT切片,忽略了连续CT切片中的空间相关信息,并且为了进一步降低假阳性结节的检出概率,本文提出了基于密集连接的3D U-Net网络的肺结节图像分割方法。首先将密集连接思想应用到3D U-Net网络,保留原有的编码器与解码器结构,设计了密集连接的编码器用于对输入图像特征的提取。其次考虑到网络复杂性的问题,设计了简化的解码器结构。随后提出混合损失函数,用于网络的训练。除此之外,还将基于密集连接的3D U-Net网络应用于肺实质提取中,加快了传统图像处理方法对肺实质提取的速度。最后通过实验表明,所提出的基于密集连接的3D U-Net网络分割性能优异,在以LUNA 16为基础的合成数据集上Dice达到92.5%的结果,对粘连型以及小结节的分割也表现突出。
基于卷积神经网络的人体姿态估计研究
这是一篇关于人体姿态估计,特征融合,注意力,密集连接,线性变换,轻量化,遮挡的论文, 主要内容为人体姿态估计是计算机视觉中一项重要的研究任务,目标是定位并识别图像中的人体关键点,并根据人体各部位间的关系按顺序连接成相应的人体姿态,是动作识别、人体跟踪和人机交互等任务的基础,伴随人工智能技术的迅猛发展,其被广泛应用于许多实际场景中。但就实际应用情况来看,人体姿态估计当前仍存在诸多问题与挑战,如估计精度不高、网络参数量大、运算复杂度高、对遮挡和困难关键点检测误差较大等。为解决上述问题,本文基于卷积神经网络对人体姿态估计展开研究,主要研究成果如下:(1)提出改进特征融合和注意力的人体姿态估计方法。以高分辨率网络为基础进行改进,通过全局上下文模块和深度可分离卷积重新设计瓶颈块,增强模型上下文建模能力;采用空间和通道自注意力相结合设计基础模块,有效减少特征提取过程中的信息损失;结合多分辨率特征优化网络特征融合方式,提取更精细的特征信息。实验结果表明,改进的模型能有效提升原网络的预测精度,在COCO验证集上的平均预测精度提升了3.2%。(2)提出融入密集连接的轻量化网络。借鉴线性变换的方式,运用Ghost卷积重新设计瓶颈块与基础模块,并在基础模块中创新性地设计密集连接方式和密集单元,在此基础上进一步增强网络特征融合时提取特征的力度,最终保障网络有用足够的检测精度并大幅降低网络复杂度,在COCO验证集上的实验结果表明,与高分辨率网络相比,改进后的网络参数量降低71.5%,运算复杂度降低35.2%,同时AP还提升0.6%。(3)针对难以检测遮挡的问题,基于上述研究提出一种轻量密集级联金字塔网络,先在原网络输入前使用高效人体检测算法,准确识别被遮挡人体以降低干扰;再运用注意力特征融合改进基础模块的残差结构,增强模型提取遮挡特征的能力;在网络输出后采用Global Net与Refine Net对特征信息二次融合与推断,增强检测被遮挡关键点的能力。经过实验测试,在MPII数据集上平均精度达91.2%,在3DOH50K数据集上不同遮挡比例的检测精度均优于主流方法。
基于分割网络的SAR图像道路提取方法研究
这是一篇关于SAR图像道路提取,密集连接,注意力机制,密集空洞金字塔的论文, 主要内容为SAR图像中道路分割通过对道路特征的提取和路面元素的判别,能够实现不同复杂背景条件下不同尺度道路目标的精确检测,在战场监测、目标定位和跟踪、地图更新、地理数据库建设等军事和民用领域中,发挥着重大的作用。传统方法利用边缘检测或区域分割等方法提取道路,人工干预多,效率和性能不高。基于完全卷积神经网络(FCN)的各种方法(如U-Net)具有优秀的特征提取能力和准确的分割效果,在道路提取中发挥着越来越重要的作用。然而,与光学遥感图像相比,SAR数据集往往包含多种分辨率图像,道路特征和受到的干扰都不相同;另一方面,道路提取面临多尺度问题,需要结合不同感受野,否则提取到的特征容易产生疏漏。因此,目前的方法难以取得令人满意的结果。针对不同分辨率SAR图像数据中道路目标分割精度不高的问题,本文提出了基于密集连接和Unet的多特征级联Unet(Multi Feature Cascade-Unet,MFC-Unet)方法。通过结合U-Net和密集连接,该方法加强了特征图的传输和提取,以更有效地重复使用特征,对道路的多特征进行了级联融合。此外,考虑到道路区域的比例较小,本文引入混合注意力模块来引导网络更加关注道路目标本身。实验结果表明,与现有先进的方法相比,该方法在不同分辨率SAR道路提取方面都具有优势,特别是针对中低分辨率SAR图像,提取道路的完整度和准确度都有大幅提升。针对SAR图像中多尺度道路难以同时精确分割的问题,本文提出了基于空洞卷积的密集空洞金字塔网络(Dense Dilated Pyramid Unet,DDP-Unet)方法。该方法在MFC-Unet的基础上,采用空洞卷积替换密集连接中的普通卷积,能够使网络从不同层面上扩充出密集的感受野,进而提取到丰富的细节信息和多尺度信息,在不增大网络参数开销的同时,既保留了图像的空间特征,又减少信息损耗。试验结果表明,该方法能够更准确地提取SAR图像道路,特别是对具有多尺度道路的图像,避免了对细小道路的忽视。
文本图像超分辨率重建方法研究与应用
这是一篇关于超分辨率,文本图像,密集连接,注意力机制,内容损失函数的论文, 主要内容为超分辨率是指根据低分辨率图像已有的图像信息恢复图像细节及信息的过程。因为文本有丰富的含义及广泛的应用,因此有了特意针对文本图像进行恢复的超分辨率网络及方法,即文本图像超分辨率。然而,过去的文本图像超分辨率方法往往是针对经过人为处理后的低分辨率图像数据集进行恢复,对从自然界用相机获取的实际低分辨率图像效果不尽如人意。因此,最近几年,用于做超分辨率的真实文本图像数据集Text Zoom被提出了。随着Text Zoom数据集的提出,一个针对该数据集的超分辨率网络框架TSRN也被提出了,相比于对人工下采样低分辨率图像有良好恢复效果的超分辨率网络,TSRN对真实世界文本图像数据集Text Zoom的恢复效果达到了最优。但纵观其结构,依然有很多改进可以加入其中。因此参照过去的优良超分辨率网络的结构及文本图像的特征,本文对TSRN框架做出了诸多改动,并在Text Zoom数据集上验证其效果。主要研究内容如下:(1)基于使网络内信息更多地流通在网络中、重视多信息通道及重视图像的多方向上下文信息的想法,对TSRN框架加入了密集连接、通道注意力及并行结构方面的改进。本文将改进后的模型应用至Text Zoom数据集的超分辨率重建任务,实验结果显示在各个难度的图像恢复任务上改进模型的表现均普遍优于未改进模型,证明在添加各项结构方面的改进后模型效果更强。(2)基于使网络更重视文本内容及文本边界的想法,对TSRN框架加入了特征损失函数,同时提升了梯度损失函数的比例。本文将改进后的模型应用至Text Zoom数据集的超分辨率重建任务,实验结果显示在各个难度的图像恢复任务上改进模型的表现普遍优于未改进模型,证明在添加各项有关损失函数的改进后模型效果更强。(3)通过将经过以上改进后的文本图像超分辨率框架与前后端开发知识相结合,构建了一个可用于文本图像超分辨率功能的网页应用微服务,提供功能主要包括图像裁切、超分辨率、数据管理三部分。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码港湾 ,原文地址:https://m.bishedaima.com/lunwen/48596.html