基于RDB-YOLOv5的遥感图像多目标检测研究
这是一篇关于遥感图像,目标检测,旋转框,注意力机制,特征融合的论文, 主要内容为遥感图像的检测技术常用于地质探测、海洋监测、城乡规划等实际场景中。遥感图像存在分辨率高、背景信息复杂、目标尺寸小且方向任意等特点,这些特点成为检测时的难题。随着计算机性能不断提高和深度学习的广泛应用,使用卷积神经网络可提升图像目标检测性能,对高质量遥感图像检测研究具有重要研究意义。因此,本文从深度学习目标检测方向出发,针对上述问题提出基于RDB-YOLOv5的遥感图像目标检测算法。具体工作内容如下:(1)针对遥感图像目标方向任意、水平边界框检测产生重叠和漏检的问题,提出了基于旋转边界框的目标检测方法。首先,在检测任务中引入目标的角度信息,同时结合经典旋转框表示法和环形平滑标签的思想,设计一种改进旋转目标表示法。其次,对原始网络YOLOv5中的模块进行适应性改进,在数据加载器、预测模块以及损失计算中引入角度信息,并采用旋转边框回归准确率来计算倾斜非极大值抑制。最后,构建引入旋转边界框(Rotate bounding box)的R-YOLOv5网络模型。(2)针对遥感图像背景信息及高分辨率导致的噪声干扰、小尺度目标检测精度不高问题,提出了基于注意力机制的多尺度目标检测方法。首先,在骨干网络中添加双注意力机制(Dual attention mechanism)强化目标提取的边界特征。在通道上采用高效通道注意力机制,在空间上采用空间注意力机制并用空洞卷积进行改进,提升注意力机制的提取效果。其次,借鉴双向特征融合网络(Bi FPN)的思想,在特征融合网络加入新的浅层特征和深层特征信息传递路径,强化浅层中目标的位置信息。最后,在预测网络添加针对小像素目标的检测头,提高小目标的检测精度。(3)在公开数据集DOTA中进行多组对比实验和消融实验,与其它SOTA算法进行对比,并利用Flask+VUE对RDB-YOLOv5算法在Web端进行部署。实验结果表明,R-YOLOv5网络模型能有效提升目标检测精度,同时在复杂场景中能有效解决水平框检测带来的重叠以及漏检问题。RDB-YOLOv5算法相比YOLOv5算法在遥感图像多目标检测任务中均值平均精度提升了4.6%,有效解决了背景信息及高分辨率导致的噪声干扰、小尺度目标检测精度不高问题,最终实现对RDB-YOLOv5算法检测结果的可视化展示。
面向大场景弱特征的遥感目标检测算法研究
这是一篇关于遥感图像,特征融合,上下文协调,特征选择,混合感受野的论文, 主要内容为对于遥感图像中的特定目标进行快速高精度检测,在国防安全和民生建设领域有重要研究意义和实用价值。目前,基于卷积神经网络的深度学习在目标检测、分割和跟踪等领域中被广泛使用,并且表现出卓越的性能。与此同时,遥感空间技术的迅速发展,也使得遥感图像的数量和质量在不断提高,这为探索遥感目标检测技术提供了有利的支撑。近年来,基于卷积神经网络的遥感目标检测方法取得了显著的成效,但是由于遥感图像的场景视野大,目标所处环境复杂且在图像中表现不明显,现有的算法依旧存在大量的虚检以及小目标漏检问题。此外,在资源有限的设备上部署遥感目标检测时,模型是否轻量高效性也是算法是否能够落地实用的关键。因此,本文基于深度学习的经典目标检测结构进行设计,针对遥感图像的视野场景大、目标特征弱、以及目标尺度和姿态变化大等特点展开研究。本文的主要工作总结如下:(1)针对遥感图像背景信息复杂、类间相似度高、目标尺度变化大和分布不均匀的问题,本文提出了基于关键信息增强的遥感目标检测算法(A Key Information-Enhanced Network for Remote Sensing Object Detection,KIENet)。KIENet在YOLOX框架的基础上引入两个重要的组件,包括多尺度特征融合模块和高效激活检测头。其中,多尺度特征融合模块用来捕获丰富的特征信息,探索不同尺度图像的内在结构信息。高效激活检测头将分类任务和回归任务进行解耦,通过关键特征增强模块分别自适应地捕获所需要的鉴别性特征。最后,在DIOR和RSOD数据集上的一系列实验表明,KIENet在两个公开数据集上的m AP相比其他主流算法依次提高1.3~25.3%和2~11.5%。(2)针对遥感图像分辨率较高,小目标信息损失严重,检测精度低的问题,本文提出了基于自适应相邻上下层协调网络的遥感目标检测算法(Adaptive Adjacent Context Negotiation Network for Remote Sensing Object Detection,A2CN-Net)。首先,基于快速傅立叶变换原理设计复合快速傅里叶卷积模块,将其加入到主干网络的多个阶段以捕获目标在频谱上的上下文信息,从而增强小目标的特征表示。其次,基于自注意力理论知识,提出全局上下文信息增强模块,以获得丰富的空间上下文信息。此外,为了充分利用相邻特征层之间的特征相关性,设计自适应相邻上下层协调网络来捕获更具鉴别性的特征,该网络由局部分支和相邻分支组成,局部分支自适应地突出特征信息,相邻分支在相邻层引入全局信息来增强特征表示,弥补目标信息损失。最后,在DIOR和DOTA-v1.0数据集上的实验结果表明,A2CN-Net将检测精度依次提高1.2~25.2%和1.9~13.47%。(3)针对遥感图像背景复杂、目标密集、目标尺度变化大以及分布不均匀等诸多困难导致的网络模型参数量大、网络结构复杂的问题,本文提出了基于自适应特征选择金字塔网络的高效遥感目标检测算法(An Adaptive Feature Selection Pyramid Network for Efficient Object Detection in Remote Sensing Images,AFSPNet)。首先,重构具有视觉注意机制的非对称卷积以降低复杂度并增强特征表示能力。然后,设计自适应特征选择结构来提取具有判别力的特征信息,通过引入可变形卷积来对物体的形状进行自适应建模,以获得更强的几何特征表示。同时,设计混合感受野模块减少跨不同通道和空间位置的信息损失,通过混合具有不同感受视野的空洞卷积层来增加模型感受视野。最后,在DIOR和RSOD数据集上的实验结果表明,AFSPNet仅使用20.9 M的参数量下每秒可以检测62.5张图片,且检测精度分别达到67.1%和93.2%。
基于改进U-Net的近红外遥感图像水体分割方法研究
这是一篇关于遥感图像,近红外波段,水体分割,U-Net,注意力机制,多任务的论文, 主要内容为水体是地球上的人类以及各类生物赖以生存的资源,对水体进行快速有效的识别以及分割是掌握水体资源空间的分布情况的重要方式。运用遥感技术对于水体信息的获取,具有快速、实时、丰富、精准等重要特性。近红外波段中的水体对光的吸收能力较强,所以在图像中呈现出的灰度值与其他地物的差距较大,利用该波段信息可以清晰的反映水陆间的边界情况。相对于传统分割方法,深度学习技术能够提取更加深层且抽象的信息。所以本文提出基于深度学习的近红外图像水体分割方法,对U-Net图像分割方法进行改进,以提升水体分割的精度。论文具体的内容以及解决的问题如下:(1)U-Net作为经典的分割模型,模型结构相对简单,在跳跃连接的过程中,不同重要程度的信息分配的计算资源是相同的,导致在特征提取的时候没有侧重点。传播的过程中没有考虑到可能会出现的网络退化的问题,存在优化的空间。本文提出一种融合注意力机制以及残差模块的U-Net模型。在跳跃连接的过程中加入SAM空间注意力以及注意力门,自适应的分配跳跃连接的信息权重。在卷积过程中加入残差连接,优化了传播过程中的网络退化的问题。通过消融实验的定量分析以及分割图像可视化分析,证明三类模块的引入相比于原始U-Net模型在近红外的水体分割任务上具备更优秀的性能,Io U提升了3.76%。(2)融合注意力机制的U-Net模型在近红外图像的水体检测上取得了较好的精度与检测效果,但仍然存在一些的阴影部分的错检问题,小目标的漏检问题以及梯度消失问题。针对以上情况,本文提出一种多任务辅助的方式来解决以及优化对应问题:通过RGB识别任务优化阴影检测问题;通过小目标识别任务优化小目标的漏检测问题,通过深度监督任务优化模型中梯度消失问题。通过消融实验以及对比实验分析,证明了三类辅助任务的引入对模型的检测效果有着积极的作用,Io U提升了3.64%。与图像分割的经典模型比较,本文的模型综合表现最优,比其余模型中表现最好的U-Net++在Io U上高出1.04%。
基于卷积神经网络的遥感图像语义分割研究
这是一篇关于遥感图像,语义分割,全尺度跳层连接,全局特征,局部特征的论文, 主要内容为随着我国遥感技术的快速发展,遥感卫星的探测能力日益提升,传统的遥感图像分割方法无法满足精准实时地对遥感图像关键信息进行自动提取的要求。近年来,由于深度学习技术在计算机视觉领域的广泛应用,自然图像的语义分割方法取得了较大的进展。由于遥感图像中目标物体较多、背景信息复杂,将现有的自然图像语义分割方法直接应用于遥感图像中无法取得较好的结果。因此,本文针对遥感图像的特点,结合自然图像语义分割方法对遥感图像语义分割模型进行研究。主要的研究工作具体如下:(1)针对遥感图像中多个目标聚集导致边缘混淆,小尺度物体分割不明显,以及语义分割过程中对全局信息获取不足的问题,提出了一种基于混合注意力与全尺度跳层连接网络的遥感图像语义分割算法DU-net。该算法以U-net3+作为基础网络,采用全尺度跳层连接网络作为特征提取网络,摒弃了原算法中的深度监督,建立特征与注意力机制之间的关联,最终实现语义分割的过程。实验结果表明:DU-net算法在不同指标下较经典算法都有明显提升,同时提高了图像边缘分割质量,改善了算法对小尺度目标的分割的准确度。(2)针对当前多数遥感图像语义分割模型存在训练速度慢,网络层数多,参数量大等问题,提出了一种基于全局特征与局部特征交互的轻量级遥感图像语义分割算法EFLG-Net。该算法以EfficientNetB0作为特征提取网络,引入全局特征路径,建立全局特征与局部特征之间的联系,改进了原算法中的卷积模块MBConv,提出新模块FU-MBConv,并优化网络结构和参数,再经过反卷积操作与全局特征路径建立联系,最后实现语义分割的过程。实验结果表明:EFLG-Net算法在模型参数大小、训练速度、模型精度上都有了明显的提升。
基于改进U-Net的近红外遥感图像水体分割方法研究
这是一篇关于遥感图像,近红外波段,水体分割,U-Net,注意力机制,多任务的论文, 主要内容为水体是地球上的人类以及各类生物赖以生存的资源,对水体进行快速有效的识别以及分割是掌握水体资源空间的分布情况的重要方式。运用遥感技术对于水体信息的获取,具有快速、实时、丰富、精准等重要特性。近红外波段中的水体对光的吸收能力较强,所以在图像中呈现出的灰度值与其他地物的差距较大,利用该波段信息可以清晰的反映水陆间的边界情况。相对于传统分割方法,深度学习技术能够提取更加深层且抽象的信息。所以本文提出基于深度学习的近红外图像水体分割方法,对U-Net图像分割方法进行改进,以提升水体分割的精度。论文具体的内容以及解决的问题如下:(1)U-Net作为经典的分割模型,模型结构相对简单,在跳跃连接的过程中,不同重要程度的信息分配的计算资源是相同的,导致在特征提取的时候没有侧重点。传播的过程中没有考虑到可能会出现的网络退化的问题,存在优化的空间。本文提出一种融合注意力机制以及残差模块的U-Net模型。在跳跃连接的过程中加入SAM空间注意力以及注意力门,自适应的分配跳跃连接的信息权重。在卷积过程中加入残差连接,优化了传播过程中的网络退化的问题。通过消融实验的定量分析以及分割图像可视化分析,证明三类模块的引入相比于原始U-Net模型在近红外的水体分割任务上具备更优秀的性能,Io U提升了3.76%。(2)融合注意力机制的U-Net模型在近红外图像的水体检测上取得了较好的精度与检测效果,但仍然存在一些的阴影部分的错检问题,小目标的漏检问题以及梯度消失问题。针对以上情况,本文提出一种多任务辅助的方式来解决以及优化对应问题:通过RGB识别任务优化阴影检测问题;通过小目标识别任务优化小目标的漏检测问题,通过深度监督任务优化模型中梯度消失问题。通过消融实验以及对比实验分析,证明了三类辅助任务的引入对模型的检测效果有着积极的作用,Io U提升了3.64%。与图像分割的经典模型比较,本文的模型综合表现最优,比其余模型中表现最好的U-Net++在Io U上高出1.04%。
基于深度学习的遥感图像不定向目标检测算法的研究
这是一篇关于目标检测,特征金字塔网络,自适应特征融合,注意力机制,遥感图像的论文, 主要内容为近年来,遥感技术取得了突破性的发展,获取了大量高分辨率的遥感图像。目前,在遥感图像目标检测任务中使用深度学习技术取得了巨大进步,并在不同场景中被广泛地应用。使用基于卷积神经网络为代表的深度学习模型可以有效解放人力,将特征提取交于卷积算法完成,极大提高网络对于不同数据的鲁棒性。本文根据深度学习领域中遥感图像目标检测所面临的问题为导向,通过对现有检测算法进行归纳和总结,提出了基于anchor-free的遥感图像不定向目标检测基线网络,该网络的检测方法是基于像素级的检测,因此避免了部署anchor boxes导致计算消耗大等问题。针对遥感图像目标尺度变化大,目标方向不定等难点,结合自适空间特征融合与聚合路径特征金字塔网络的性能优势,提出了聚合路径自适应特征金字塔目标检测网络,分别以Mobile Net-V2、Res Ne Xt-50和Res Ne Xt-101做骨干网络进行测试。针对遥感图像背景复杂,目标尺度变化大,样本不足等难点,本文提出一种基于改进非局部注意力机制的骨干网络NLARes Ne Xt,并与改进上采样操作的FPN构建新的主干网络,改进的注意力机制使用分组卷积来降低网络的计算量。本文在DOTA数据集和HRSC2016数据集上进行了综合实验。通过对实验数据的分析,本文所设计的方法有较高的准确率,验证了本文所提出的网络的有效性和可行性。
基于二值神经网络的遥感图像分类与检测方法研究
这是一篇关于遥感图像,图像分类,目标检测,二值神经网络的论文, 主要内容为随着遥感技术的快速发展,遥感图像分类和目标检测任务在城市规划、环境监测、林业农业保护等领域有着重要的研究价值。传统的基于手工特征构建的遥感图像分类与检测模型识别效果不理想,具有明显的局限性。近年来,深度学习的兴起大力推动了遥感图像分类与检测任务的进一步发展,越来越多的深度学习模型被应用在遥感图像处理领域。然而这些复杂的深度卷积神经网络模型具有大量的权重参数,导致其占用存储空间大,消耗计算资源多,难以满足实时性的应用需求。因此需要对网络模型进行压缩以获得轻量化模型,提高计算效率。现有的模型压缩方法主要分为轻量化结构设计、知识蒸馏、模型剪枝以及网络量化等。其中网络量化方法更加有助于深度神经网络模型部署在边缘设备上,因此本文采用网络量化中最具潜力的二值神经网络来实现模型的轻量化设计,通过将传统的卷积操作替换为位运算大幅减少了模型计算量,有效平衡了模型性能与计算成本,对人工智能的应用扩展具有重要意义。本文的主要研究内容如下:(1)针对遥感图像分类模型计算资源与功耗需求大的问题,本文提出了一种基于改进Mobile Net V1的二值神经网络分类模型CABNN(Channel Attention Binary Neural Network)。该方法首先对Mobile Net V1模型进行修改并二值量化,通过引入具有可学习系数的激活函数以及利用近似Sign函数进行反向传播过程中的梯度计算,保留了更多网络中的信息,减少了量化误差。然后本文引入了轻量化的通道注意力机制,通过对不同的通道重新赋予不同的权重以强化重要信息,弱化非重要的信息,提升网络捕获关键信息的能力。为了验证该模型的有效性,本文在四个公开的遥感图像分类数据集上进行了大量实验,实验结果表明本文所提出的模型在计算资源有限的情况下具有更好的综合性能。(2)针对遥感图像目标检测比分类任务更加关注局部特征,常规的网络二值化方法很难直接应用于目标检测任务的问题,本文提出了一种基于信息瓶颈理论的二值神经网络目标检测模型Bi SSD(Binary SSD)。该方法首先在目标检测任务中引入信息瓶颈理论,通过限制高层特征图的信息量,最大化特征图与目标检测之间的互信息来消除冗余信息,减少误报情况。其次对原始的SSD模型进行二值量化,对于检测头部分仍保留实值,以便进行精确检测。然后引入坐标注意力机制,通过在通道注意力中嵌入位置信息,有效增强了特征表达能力,有助于网络能够更加准确的对目标进行定位和识别。为了验证该模型的有效性,本文在两个公开的遥感图像目标检测数据集上进行了实验,实验结果证明本文所提出的模型可以更好地在模型检测精度与计算成本之间取得平衡。
基于深度学习的遥感图像语义分割系统的设计
这是一篇关于遥感图像,深度学习,卷积神经网络,区域注意力机制,多尺度分组融合模块的论文, 主要内容为遥感图像的语义分割是一项非常有应用价值的计算机视觉任务,它的主要目的是给输入图像的每个像素进行分类。由于现实生活对遥感信息有更高的需求,使计算机视觉领域中高分辨率遥感图像语义分割的研究日益活跃,其广泛应用于国土资源监测、道路提取和土地划分等领域。近几年,深度学习在遥感图像语义分割领域中的应用获得了巨大的成功,使其解析遥感图像信息和提取底物特征的速度更快,也在很大程度上提高了处理遥感图像相关任务的准确性。然而,遥感图像成像复杂、信息冗余、类型多样等特性使其在应用过程中面临着很大的挑战。此外,语义分割在遥感领域的应用也面临着与其他应用领域相同的问题,譬如输入图像中目标物体之间巨大的尺度差异和牺牲低层位置信息导致精度下降等问题。因此,解决诸如此类的问题成为了很多研究者聚焦的热点。本文主要以深度学习语义分割算法在遥感图像上的应用为主,并在此基础上设计了遥感图像语义分割系统来对遥感图像语义分割的应用进行了深入的研究。主要的工作如下:(1)在语义分割过程中,深度卷积神经网络的信道容量的增大会带来丰富的特征信息,但是,空间容量也相应地会被压缩,这使得预测结果存在地物细节分割不准确的情况。针对此问题,本文提出了一种基于区域注意力机制的语义分割网络,用于划分高分辨率遥感图像的目标地物。本文提出的基于区域注意力机制网络遵循语义分段的编码-解码体系结构,并包括以下三种提高分割精度的策略:增强的GCN模块用于捕获遥感图像的语义特征;多尺度分组融合模块通过以不同采样密度来捕获不同上下文信息;区域注意力模块为特征图的不同区域中的高价值信息分配较大的权重。本文在Potsdam数据集和佳格数据集上对提出的遥感图像语义分割网络进行了验证。实验结果表明,采用这些优化策略的模型结果优于基础编码-解码网络。其中,在Potsdam数据集上F1得分、平均交并比和像素精度分别增加10.81%,19.11%和11.36%,在佳格数据集上分别增加了29.26%,27.64%和13.57%。(2)为了验证本文提出的语义分割网络模型的实用性以及有效性,加强遥感图像处理和深度学习应用之间的技术交互,本文创建了一个基于flask架构的遥感图像语义分割系统,该系统充分嵌入了深度学习算法,并在此基础上结合B/S框架和数据库的技术优势,进一步对本文提出的算法模型进行了实用性验证。通过分析系统的需求,设计了用户管理、数据集管理、语义分割网络管理、参数模型管理的相关模块。并在此基础上,对系统的数据层和API接口处理层两方面进行了实现。最后通过模拟一般用户需求设计了各模块功能的测试用例,并采用了黑盒测试的方法对系统进行了测试,测试结果表明该系统能满足一般用户需求,具有节约学习和研究的成本、操作简单、技术复杂度低、高度模块化的特点。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设工厂 ,原文地址:https://m.bishedaima.com/lunwen/47449.html