9个研究背景和意义示例,教你写计算机小目标论文

今天分享的是关于小目标的9篇计算机毕业论文范文, 如果你的论文涉及到小目标等主题,本文能够帮助到你 基于深度学习的小目标检测算法研究及集装箱铅封识别应用 这是一篇关于深度学习

今天分享的是关于小目标的9篇计算机毕业论文范文, 如果你的论文涉及到小目标等主题,本文能够帮助到你

基于深度学习的小目标检测算法研究及集装箱铅封识别应用

这是一篇关于深度学习,小目标,CenterNet,高分辨率图像,铅封检测的论文, 主要内容为近年来基于深度学习的目标检测算法日新月异,然而常规目标检测网络主要关注尺度较大的目标,对于小目标检测的关注较少,因此小目标检测精度通常低于大尺度目标,再加上小目标本身存在可用信息少、特征不显著等固有问题,导致小目标检测成为目标检测领域中的难点问题。在现实场景中,小目标检测在无人机目标检测、遥感图像检测、缺陷检测等方面都起到重要的作用,因此提高小目标检测算法的精度和速度至关重要。在集装箱装卸作业过程中,集装箱铅封查验作业环节仍然采用人工检查的方法,存在效率低下、人力成本高、安全风险大等问题。由于铅封尺度极小,特征不明显,因此采用常规的目标检测网络无法实现小目标的自动识别。本文基于深度学习的目标检测网络,对当前的小目标检测算法进行研究,提出自主优化的小目标检测网络,并应用于集装箱铅封检测任务中,实现快速、精准的铅封自动检测。通过实际应用,本文研究的算法达到了实际工程要求,能够代替人工执行铅封查验任务。本文的主要工作以及创新点有:(1)以Center Net目标检测网络为基础,对特征提取网络进行优化和调整。对应用于目标检测的不同拓扑结构的卷积神经网络进行比较,对其中典型结构的Shuffle Net和HRNet两种网络进行研究和对比,选择合适的网络结构;降低网络降采样次数,均衡网络结构参数,提高输出特征图分辨率,提高小目标特征提取能力;设计轻量的多尺度特征融合模块,减少网络推理过程中对小目标特征造成的损失,提高低层特征的利用率;采用深度可分离卷积、Ghost Block等轻量化结构,在检测精度和检测速度之间取得平衡。(2)利用小目标上下文信息以及注意力机制,设计即插即用的小目标特征增强模块。对SSH上下文模块进行改进,通过提取更有效的小目标上下文特征来增强小目标特征显著性;对SE模块、CBAM模块、CA模块这三种注意力模块进行研究和对比,采用合适的注意力模块抑制网络推理过程以及多尺度特征融合过程对小目标引入的背景噪声,增强小目标特征。(3)优化小目标检测网络的检测策略,提高小目标的检测精度。针对小目标检测正负样本不平衡的问题,提出一种宽高比敏感的高斯核标签,提高正样本数量,同时提高检测效果;对目标检测头进行重新设计,实现目标分类和边界框回归两个任务之间的相互影响,采用CIOU作为边界框质量评价指标,提高小目标召回率;利用GFocal Loss(Generalized Focal Loss)进一步提高边界框检测效果,获得更高的小目标检测精度,同时网络也能获得较快的收敛速度,解决了基于关键点检测网络收敛较慢的问题。(4)将改进的小目标检测网络应用于集装箱铅封检测任务。针对铅封检测任务设计了针对性数据增强方法,在较小的计算量下实现小目标数量的扩增,提高检测网络在图像色彩、目标尺度差异、目标位置随机等方面的鲁棒性,从而提高小目标的检测效果;针对高分辨率图像提出了随机中心裁剪以及图像分块两种检测策略,分别满足不同的应用场景,实现高分辨率图像的快速检测。

基于多模态深度学习方法的脑部MRI分割

这是一篇关于多发性硬化症,脑部静脉血管,多模态深度学习算法,语义分割,小目标的论文, 主要内容为大脑是人体中最重要的器官之一,它关系着神经系统是否能够健康工作,影响着人类的高级认知能力。在临床医学中,基于核磁共振影像的分割任务是诊断和分析脑部疾病、辅助手术治疗的关键步骤。以多发性硬化症患者的脑部病灶分割问题为诊断和分析脑部疾病的代表,辅助手术治疗则聚焦在脑部静脉血管分割问题。通常,这两个分割任务结合多个核磁共振影像模态,利用它们之间信息的互补性,提升分割性能。理论上,随着深度学习技术的发展,多模态深度学习算法同样可以用于多发性硬化症脑部病灶和脑部静脉血管的分割中。然而,针对多发性硬化症脑部病灶分割问题,现阶段基于深度学习的多模态融合策略未充分利用脑部多模态核磁共振影像数据间的关联和互补知识,即没有考虑多发性硬化症病灶在不同影像中的分级特性,并且多发性硬化症脑部病灶具有小而多的特点,使得分割难以达到预期效果。在脑部静脉血管分割问题中,现阶段多使用传统多模态融合策略来解决,它们存在计算成本高、耗时长的问题,而应用深度融合策略受限于目前有限的数据量和巨大的人工标注成本。为了解决上述问题,本文做了如下的工作:1.针对多发性硬化症脑部病灶分割的多模态融合策略问题,本文提出了基于全局-局部特征的多发性硬化症多模态融合分割算法LGMS-Net,网络的设计充分考虑核磁共振影像模态间信息的关联性和互补性。编码器部分,LGMS-Net根据多发性硬化症非轧增强病灶在Phase影像中的铁环征表现,提出额外的局部细节特征提取模块,用于获取铁环征病灶的边缘信息。在解码器部分,LGMS-Net提出全局-局部特征层级融合模块,融合FLAIR和Phase模态信息,完成多发性硬化症病灶的分割。实验测试和验证了算法的分割性能和融合策略的有效性,并且通过局部边缘特征的可视化为多发性硬化症的病理分级提供可能性依据。2.针对将多模态深度学习方法引入脑部静脉血管分割任务的阻碍,本文提出基于深度学习即插即用模块的快速多模态脑部静脉血管分割算法。该算法根据传统脑部静脉血管分割方法的工作原理,利用深度展开等技术,设计基于深度学习的即插即用模块,代替传统多模态方法中计算成本高、耗时长的流程。实验结果表明该多模态深度学习算法在分割效率上远远超过传统方法,在分割性能上同样能够达到预期目标。3.为实现本文提出算法的应用价值,本文设计了一个基于Flask框架的脑部核磁共振影像分割系统。该系统包含用户管理模块、数据管理模块和分割算法模块。这些模块将本文提出的两种算法集成到一个前后端分离平台中。脑部核磁共振影像分割系统充分考虑了医疗数据的安全性和医生的日常诊疗需求,提供界面友好型的脑部核磁共振影像分割系统。

基于多模态深度学习方法的脑部MRI分割

这是一篇关于多发性硬化症,脑部静脉血管,多模态深度学习算法,语义分割,小目标的论文, 主要内容为大脑是人体中最重要的器官之一,它关系着神经系统是否能够健康工作,影响着人类的高级认知能力。在临床医学中,基于核磁共振影像的分割任务是诊断和分析脑部疾病、辅助手术治疗的关键步骤。以多发性硬化症患者的脑部病灶分割问题为诊断和分析脑部疾病的代表,辅助手术治疗则聚焦在脑部静脉血管分割问题。通常,这两个分割任务结合多个核磁共振影像模态,利用它们之间信息的互补性,提升分割性能。理论上,随着深度学习技术的发展,多模态深度学习算法同样可以用于多发性硬化症脑部病灶和脑部静脉血管的分割中。然而,针对多发性硬化症脑部病灶分割问题,现阶段基于深度学习的多模态融合策略未充分利用脑部多模态核磁共振影像数据间的关联和互补知识,即没有考虑多发性硬化症病灶在不同影像中的分级特性,并且多发性硬化症脑部病灶具有小而多的特点,使得分割难以达到预期效果。在脑部静脉血管分割问题中,现阶段多使用传统多模态融合策略来解决,它们存在计算成本高、耗时长的问题,而应用深度融合策略受限于目前有限的数据量和巨大的人工标注成本。为了解决上述问题,本文做了如下的工作:1.针对多发性硬化症脑部病灶分割的多模态融合策略问题,本文提出了基于全局-局部特征的多发性硬化症多模态融合分割算法LGMS-Net,网络的设计充分考虑核磁共振影像模态间信息的关联性和互补性。编码器部分,LGMS-Net根据多发性硬化症非轧增强病灶在Phase影像中的铁环征表现,提出额外的局部细节特征提取模块,用于获取铁环征病灶的边缘信息。在解码器部分,LGMS-Net提出全局-局部特征层级融合模块,融合FLAIR和Phase模态信息,完成多发性硬化症病灶的分割。实验测试和验证了算法的分割性能和融合策略的有效性,并且通过局部边缘特征的可视化为多发性硬化症的病理分级提供可能性依据。2.针对将多模态深度学习方法引入脑部静脉血管分割任务的阻碍,本文提出基于深度学习即插即用模块的快速多模态脑部静脉血管分割算法。该算法根据传统脑部静脉血管分割方法的工作原理,利用深度展开等技术,设计基于深度学习的即插即用模块,代替传统多模态方法中计算成本高、耗时长的流程。实验结果表明该多模态深度学习算法在分割效率上远远超过传统方法,在分割性能上同样能够达到预期目标。3.为实现本文提出算法的应用价值,本文设计了一个基于Flask框架的脑部核磁共振影像分割系统。该系统包含用户管理模块、数据管理模块和分割算法模块。这些模块将本文提出的两种算法集成到一个前后端分离平台中。脑部核磁共振影像分割系统充分考虑了医疗数据的安全性和医生的日常诊疗需求,提供界面友好型的脑部核磁共振影像分割系统。

基于多模态深度学习方法的脑部MRI分割

这是一篇关于多发性硬化症,脑部静脉血管,多模态深度学习算法,语义分割,小目标的论文, 主要内容为大脑是人体中最重要的器官之一,它关系着神经系统是否能够健康工作,影响着人类的高级认知能力。在临床医学中,基于核磁共振影像的分割任务是诊断和分析脑部疾病、辅助手术治疗的关键步骤。以多发性硬化症患者的脑部病灶分割问题为诊断和分析脑部疾病的代表,辅助手术治疗则聚焦在脑部静脉血管分割问题。通常,这两个分割任务结合多个核磁共振影像模态,利用它们之间信息的互补性,提升分割性能。理论上,随着深度学习技术的发展,多模态深度学习算法同样可以用于多发性硬化症脑部病灶和脑部静脉血管的分割中。然而,针对多发性硬化症脑部病灶分割问题,现阶段基于深度学习的多模态融合策略未充分利用脑部多模态核磁共振影像数据间的关联和互补知识,即没有考虑多发性硬化症病灶在不同影像中的分级特性,并且多发性硬化症脑部病灶具有小而多的特点,使得分割难以达到预期效果。在脑部静脉血管分割问题中,现阶段多使用传统多模态融合策略来解决,它们存在计算成本高、耗时长的问题,而应用深度融合策略受限于目前有限的数据量和巨大的人工标注成本。为了解决上述问题,本文做了如下的工作:1.针对多发性硬化症脑部病灶分割的多模态融合策略问题,本文提出了基于全局-局部特征的多发性硬化症多模态融合分割算法LGMS-Net,网络的设计充分考虑核磁共振影像模态间信息的关联性和互补性。编码器部分,LGMS-Net根据多发性硬化症非轧增强病灶在Phase影像中的铁环征表现,提出额外的局部细节特征提取模块,用于获取铁环征病灶的边缘信息。在解码器部分,LGMS-Net提出全局-局部特征层级融合模块,融合FLAIR和Phase模态信息,完成多发性硬化症病灶的分割。实验测试和验证了算法的分割性能和融合策略的有效性,并且通过局部边缘特征的可视化为多发性硬化症的病理分级提供可能性依据。2.针对将多模态深度学习方法引入脑部静脉血管分割任务的阻碍,本文提出基于深度学习即插即用模块的快速多模态脑部静脉血管分割算法。该算法根据传统脑部静脉血管分割方法的工作原理,利用深度展开等技术,设计基于深度学习的即插即用模块,代替传统多模态方法中计算成本高、耗时长的流程。实验结果表明该多模态深度学习算法在分割效率上远远超过传统方法,在分割性能上同样能够达到预期目标。3.为实现本文提出算法的应用价值,本文设计了一个基于Flask框架的脑部核磁共振影像分割系统。该系统包含用户管理模块、数据管理模块和分割算法模块。这些模块将本文提出的两种算法集成到一个前后端分离平台中。脑部核磁共振影像分割系统充分考虑了医疗数据的安全性和医生的日常诊疗需求,提供界面友好型的脑部核磁共振影像分割系统。

基于深度学习的番茄虫害监测方法研究与系统设计

这是一篇关于番茄虫害,目标检测,小目标,卷积神经网络,模型重构的论文, 主要内容为番茄是我国的重要经济作物,在果蔬贸易中占据重要的地位,而番茄虫害是影响其品质和产量的重要因素之一。因此,有效的虫情监测有利于提高防控效率、降低防治压力,从而促进番茄增产、提升收益。传统的害虫识别方法存在主观性强、对专家知识依赖程度高、效率低以及应用成本高等问题,难以及时监测虫害爆发现象。针对上述问题,亟需开发一款能够实时、准确、快速的番茄虫害监测系统以提升虫害监测预警效率。本文主要内容如下:(1)番茄虫害图像数据集制作。深度学习模型对数据集有较强的依赖性,而目前有关番茄虫害的数据集较少,难以训练出具有较高检测性能的深度学习模型。因此,本文通过实地拍摄和开源数据集筛选等两种手段共采集了3985张番茄虫害原始图像。为了增强模型的泛化性,本文使用了随机裁剪、颜色畸变、随机旋转以及随机擦除等数据增强手段对原始图像进行扩充,最终构建了拥有18359张图像的番茄虫害数据集(包含了地老虎、红蜘蛛、甜菜夜蛾、跳骚甲虫、蚜虫、粉虱、番茄蠕虫、草地蛾、棉铃虫、粘虫等十类种害虫)。(2)农业虫害目标检测基线模型筛选。本文汇总了单双阶段的检测模型在COCO数据集上的性能表现,并从精度、速度以及部署三方面考虑选择了YOLO v5系列。同时,本文测试了YOLO v5系列在开源农业虫害数据集Pest24上的性能表现,试验结果显示YOLO v5-m的参数量比YOLO v5-l少50%、推理速度快86%,而识别精度只低3.3%。考虑到参数量对模型部署的影响,最终选定YOLO v5-m为本文的基线模型。(3)番茄虫害检测模型S-YOLO v5-m构建。为了解决由于番茄虫害目标小、与背景色相似等原因导致模型对番茄虫害的特征提取能力弱、对目标区域关注程度低以及特征图中背景噪声多等问题,本文引入了SPD-Conv模块、Ghost模块、CBAM注意力机制以及AEM模块构建了S-YOLO v5-m模型。对比消融试验结果,S-YOLO v5-m模型较改进前的YOLO v5-m在m AP上提高了4.73%,参数量降低了31%,单张图片的推理速度提高了1.3ms。由可视化结果可看出S-YOLO v5-m在小目标虫害上的检测上仍具有一定的优势,对小目标关注程度更高、特征信息更丰富。同时,S-YOLO v5-m具有更快的收敛性以及较强的学习能力。此外,本文还对比了几类常见的检测模型,S-YOLO v5-m在综合性能上相对其他模型依然较高。(4)主动式番茄虫害监测系统开发。为了解决部分虫害的迁移性差、被动捕获难度大的问题,本文设计的主动式虫害监测装置可通过滑动模组、云台模块和摄像头来获取一定区域内的任意位置的图像数据,并通过部署了S-YOLO v5-m模型的智能计算平台实现对该区域的虫害监测。在界面设计上,本文基于Py Qt语言开发了可视化界面,包含模型训练、用户自检及智能监测等几部分。用户可根据监测系统生成的数据报表科学治理虫害,实现番茄绿色低碳发展。通过实地试验验证本文开发的监测系统运行良好。

基于多模态深度学习方法的脑部MRI分割

这是一篇关于多发性硬化症,脑部静脉血管,多模态深度学习算法,语义分割,小目标的论文, 主要内容为大脑是人体中最重要的器官之一,它关系着神经系统是否能够健康工作,影响着人类的高级认知能力。在临床医学中,基于核磁共振影像的分割任务是诊断和分析脑部疾病、辅助手术治疗的关键步骤。以多发性硬化症患者的脑部病灶分割问题为诊断和分析脑部疾病的代表,辅助手术治疗则聚焦在脑部静脉血管分割问题。通常,这两个分割任务结合多个核磁共振影像模态,利用它们之间信息的互补性,提升分割性能。理论上,随着深度学习技术的发展,多模态深度学习算法同样可以用于多发性硬化症脑部病灶和脑部静脉血管的分割中。然而,针对多发性硬化症脑部病灶分割问题,现阶段基于深度学习的多模态融合策略未充分利用脑部多模态核磁共振影像数据间的关联和互补知识,即没有考虑多发性硬化症病灶在不同影像中的分级特性,并且多发性硬化症脑部病灶具有小而多的特点,使得分割难以达到预期效果。在脑部静脉血管分割问题中,现阶段多使用传统多模态融合策略来解决,它们存在计算成本高、耗时长的问题,而应用深度融合策略受限于目前有限的数据量和巨大的人工标注成本。为了解决上述问题,本文做了如下的工作:1.针对多发性硬化症脑部病灶分割的多模态融合策略问题,本文提出了基于全局-局部特征的多发性硬化症多模态融合分割算法LGMS-Net,网络的设计充分考虑核磁共振影像模态间信息的关联性和互补性。编码器部分,LGMS-Net根据多发性硬化症非轧增强病灶在Phase影像中的铁环征表现,提出额外的局部细节特征提取模块,用于获取铁环征病灶的边缘信息。在解码器部分,LGMS-Net提出全局-局部特征层级融合模块,融合FLAIR和Phase模态信息,完成多发性硬化症病灶的分割。实验测试和验证了算法的分割性能和融合策略的有效性,并且通过局部边缘特征的可视化为多发性硬化症的病理分级提供可能性依据。2.针对将多模态深度学习方法引入脑部静脉血管分割任务的阻碍,本文提出基于深度学习即插即用模块的快速多模态脑部静脉血管分割算法。该算法根据传统脑部静脉血管分割方法的工作原理,利用深度展开等技术,设计基于深度学习的即插即用模块,代替传统多模态方法中计算成本高、耗时长的流程。实验结果表明该多模态深度学习算法在分割效率上远远超过传统方法,在分割性能上同样能够达到预期目标。3.为实现本文提出算法的应用价值,本文设计了一个基于Flask框架的脑部核磁共振影像分割系统。该系统包含用户管理模块、数据管理模块和分割算法模块。这些模块将本文提出的两种算法集成到一个前后端分离平台中。脑部核磁共振影像分割系统充分考虑了医疗数据的安全性和医生的日常诊疗需求,提供界面友好型的脑部核磁共振影像分割系统。

基于跨阶段局部模型及YOLO深度神经网络的目标检测算法

这是一篇关于跨阶段局部,目标检测,火灾检测,多尺度,小目标的论文, 主要内容为目标检测是计算机视觉中的重要研究方向,已被广泛应用于无人驾驶、安全监控、灾害预警等诸多领域。以深度学习网络为基础的目标检测算法比传统机器学习有明显的优势。然而,由于目标多样、场景复杂、算力要求高等问题,使得目标检测算法的性能仍有待进一步提升。本文主要针对无人机航拍视角下和火灾场景下的目标检测进行研究。以上两个场景下的目标检测均具有一定的挑战性。主要包括:(1)无人机航拍视角下目标检测。背景信息复杂、目标定位难,干扰目标多,目标像素小,特征提取困难。(2)火灾场景下的目标检测。火灾场景下的火焰与烟雾目标边缘模糊、形态变化大,可用公开数据集较少。本文以YOLO(You Look Only Once)模型为基础架构,结合跨阶段局部网络,提出了2种无人机视角下的小目标检测算法以及1种火焰与烟雾目标检测算法,并自制了一个火焰与烟雾目标数据集。本文的研究内容如下:(1)提出基于跨阶段局部网络的小目标检测算法YOLO-CS。YOLO-CS算法旨在提升无人机航拍视角下小目标检测的总体精度。首先,针对SPP模块在微调时是不能继续训练的,且存在大量参数以及特征提取能力一般的问题,YOLO-CS在YOLOv3主干网络中增加一个跨阶段局部网络的空间金字塔池化模块CSP-SPP(Cross Stage Partial Network and Spatial Pyramid Pooling,CSP-SPP),来通过增大感受野,获取复杂的背景特征;其次,YOLO-CS将跨阶段局部网络的思想引入到普通卷积中,增强了网络对特征的融合和提取能力;最后,YOLOCS算法位置函数采用了CIoU(Complete Intersection over Union,CIoU)损失函数,弥补了均方差(Mean Square Error,MSE)损失函数较难评价位置损失的不足。将本章所提的YOLO-CS算法与其他性能优越的算法在UAVDT(Unmanned Aerial Vehicle Detection and Tracking,UAVDT)数据集上进行了性能比较。结果表明,YOLO-CS算法对车辆检测的平均精度(mean average precision,m AP)达到了27.05%,分别比YOLOv3、FRCNN+FPN高3.85%、3.65%。由此可见,与YOLOv3基本架构相比,本章所提出的YOLO-CS算法通过引入跨阶段局部网络能提升简单场景下无人机航拍视角下的小目标检测性能。(2)提出基于跨阶段局部网络的多尺度小目标检测算法YOLO-CM。YOLOCM算法主要用于目标更小、环境更复杂、类别更多、数据集分布不均衡的复杂场景下的无人机小目标检测。首先,YOLO-CM将跨阶段局部空洞空间金字塔池化(Cross Stage Partial-Atrous Spatial Pyramid Pooling,CSP-ASPP)和跨阶段局部2-X(Cross Stage Partial2-X,CSP2-X)两个模块引入YOLOv4,其优势在于能够获得更大的感受野和更多的边缘信息,提升小目标的特征表征能力;其次,YOLO-CM算法采用了基于IOU的k-means聚类方法获取匹配的先验框,代替了YOLOv4中的统计MS COCO数据集的方法,从而克服了数据集不匹配问题;最后,YOLO-CM在YOLOv4的颈部增加了一个第四尺度的检测器,可以提取低维高频信息,这样更有利于小目标的检测。本章在UAVDT、Vis Drone2019(Vision Meets Drone 2019)以及自制的夜间目标检测数据集UAV-LED-G上对YOLO-CM算法进行了性能测试。结果表明,在UAVDT数据集上,YOLO-CM对最具代表性的小汽车检测的m AP值达到了67.00%,比YOLOv4高了2.30%;在Vis Drone2019数据集上,YOLO-CM检测的m AP值达到了39.09%,比YOLOv4和DA-Retina Net分别提高了2.22%和3.16%;在UAV-LED-G数据集上,YOLOCM检测的m AP值达到了89.46%,比YOLOv3、YOLOv4分别提高了3.05%和2.09%。YOLO-CM算法能够满足复杂场景下的无人机小目标检测。(3)提出基于跨阶段局部网络的火焰烟雾目标检测算法YOLOX-CSP,并自制了一个多场景下的火焰与烟雾数据集FireSmokeC。首先,本章针对火焰烟雾具有形态多变、边界模糊等问题,以YOLOX-L为基础架构,提出了融合CSP_ASPP和多尺度检测器的目标检测算法。其次,针对目前火灾场景下的数据集较少的问题,自主构建并标注了多场景下的火焰与烟雾数据集。将YOLOXCSP算法在自制数据集FireSmokeC上进行了性能测试。结果表明,在FireSmokeC数据集上,YOLOX-CSP的检测m AP值达到了88.08%,比YOLOX-L、YOLOv4、YOLOv3分别提高了2.14%、2.48%、9.78%,值得一提的是对火焰的检测m AP值达到了93.97%,比YOLOX-L高了6.26%。由此可见,该算法针对火灾场景下的目标检测具有较高的应用价值。综上所述,本文针对无人机航拍视角下和火灾场景下的目标检测两类问题,以跨阶段局部网络和YOLO网络为基础,提出了基于跨阶段局部网络的无人机视角下的小目标检测算法YOLO-CS、基于跨阶段局部网络的多尺度小目标检测算法YOLO-CM和基于跨阶段局部网络的火焰烟雾目标检测算法YOLOX-CSP,并自制了一个火焰与烟雾目标数据集。本文在两个公开无人机数据集UAVDT和Vis Drone2019,以及两个自制数据集UAV-LED-G和FireSmokeC上进行了大量实验,证明了本文提出的目标检测算法的有效性以及性能的提升能力。因此,本文提出3种算法在无人机目标检测和火灾检测领域有较好的应用价值。

基于深度学习的小目标检测算法研究

这是一篇关于目标检测,小目标,特征融合,特征增强,注意力机制的论文, 主要内容为随着科技的发展,目标检测已经成为计算机视觉领域中一个不可或缺的部分,在人脸识别、工业缺陷检测、无人机航空检测和交通车辆检测等诸多领域中都具有较高的研究和应用价值。目前,基于深度学习技术的目标检测算法已经变得越来越普遍,并且越来越成熟。然而,由于小目标在图像中占比小,可利用特征少等原因,关于小目标检测仍然是一个待解决的难题。为了进一步提升小目标的检测性能,本文开展了基于深度学习的小目标检测算法研究。主要研究内容如下:(1)为了提高YOLOX-S算法在检测小目标物体时的精度,提出了一种基于多尺度特征融合的改进算法,以提高检测精度和准确性。该算法设计了一个多尺度特征融合网络,利用扩张卷积构建感受野增强模块,来捕获更多的小目标特征信息,利用大核注意力方式给特征融合网络的多尺度通道分配权值,根据输入特征的重要程度进行区分,自动忽略噪声响应,提高对小目标物体的关注度。同时为了减少模型计算量,设计Res Net50-vd-dcn替换YOLOX-S原骨干网络CSPDarknet53。在后处理阶段,通过应用Focal Loss损失函数,可以有效地消除正负样本的不均衡,提高对小目标物体的检测率。(2)为了解决小目标物体检测中分辨率较低以及特征信息缺乏的问题,提出了一种并行多分支高分辨率特征提取网络。搭建并行多深度分支网络,利用低深度网络处理高分辨率图,高深度网络处理低分辨率图。多个包含不同分辨率特征图的子网之间并行连接,同时在并行连接的基础上,在中间位置不同分辨率特征图之间不断进行融合,充分结合高分辨和低分辨率特征信息。(3)针对骨干网络对图片进行特征提取时,所提取到的小目标特征信息有限问题,提出一种基于特征图连接流和注意力机制流的特征增强方法。特征图连接流只对卷积层使用特征图的一半权重来抑制卷积增加的参数量,与一般卷积相比,这种方式使得学习量减半。注意力机制流只进行通道平均池化和sigmoid激活函数两个简单的操作,没有额外的学习。通过这种方式构建的特征增强模块,在不增加额外计算量的情况下能够有效提升小目标物体检测精度。综上,本文所提出的方法是有效的。经实验验证,在TT100K数据集上,改进之后的算法相比于原YOLOX-S,小目标检测精度提升了2.8%,小目标召回率提升了4.1%。所提并行多分支高分辨率网络的小目标检测精度比Res Net-101高2.6%,比Hourglass-52高2.1%。在PASCAL VOC数据集上,基于特征增强方法的Retina Net算法的m AP提高了3.2%。实验结果表明,本文提出的方法对小目标检测性能提升有着积极作用。

基于深度学习的小目标检测算法研究及集装箱铅封识别应用

这是一篇关于深度学习,小目标,CenterNet,高分辨率图像,铅封检测的论文, 主要内容为近年来基于深度学习的目标检测算法日新月异,然而常规目标检测网络主要关注尺度较大的目标,对于小目标检测的关注较少,因此小目标检测精度通常低于大尺度目标,再加上小目标本身存在可用信息少、特征不显著等固有问题,导致小目标检测成为目标检测领域中的难点问题。在现实场景中,小目标检测在无人机目标检测、遥感图像检测、缺陷检测等方面都起到重要的作用,因此提高小目标检测算法的精度和速度至关重要。在集装箱装卸作业过程中,集装箱铅封查验作业环节仍然采用人工检查的方法,存在效率低下、人力成本高、安全风险大等问题。由于铅封尺度极小,特征不明显,因此采用常规的目标检测网络无法实现小目标的自动识别。本文基于深度学习的目标检测网络,对当前的小目标检测算法进行研究,提出自主优化的小目标检测网络,并应用于集装箱铅封检测任务中,实现快速、精准的铅封自动检测。通过实际应用,本文研究的算法达到了实际工程要求,能够代替人工执行铅封查验任务。本文的主要工作以及创新点有:(1)以Center Net目标检测网络为基础,对特征提取网络进行优化和调整。对应用于目标检测的不同拓扑结构的卷积神经网络进行比较,对其中典型结构的Shuffle Net和HRNet两种网络进行研究和对比,选择合适的网络结构;降低网络降采样次数,均衡网络结构参数,提高输出特征图分辨率,提高小目标特征提取能力;设计轻量的多尺度特征融合模块,减少网络推理过程中对小目标特征造成的损失,提高低层特征的利用率;采用深度可分离卷积、Ghost Block等轻量化结构,在检测精度和检测速度之间取得平衡。(2)利用小目标上下文信息以及注意力机制,设计即插即用的小目标特征增强模块。对SSH上下文模块进行改进,通过提取更有效的小目标上下文特征来增强小目标特征显著性;对SE模块、CBAM模块、CA模块这三种注意力模块进行研究和对比,采用合适的注意力模块抑制网络推理过程以及多尺度特征融合过程对小目标引入的背景噪声,增强小目标特征。(3)优化小目标检测网络的检测策略,提高小目标的检测精度。针对小目标检测正负样本不平衡的问题,提出一种宽高比敏感的高斯核标签,提高正样本数量,同时提高检测效果;对目标检测头进行重新设计,实现目标分类和边界框回归两个任务之间的相互影响,采用CIOU作为边界框质量评价指标,提高小目标召回率;利用GFocal Loss(Generalized Focal Loss)进一步提高边界框检测效果,获得更高的小目标检测精度,同时网络也能获得较快的收敛速度,解决了基于关键点检测网络收敛较慢的问题。(4)将改进的小目标检测网络应用于集装箱铅封检测任务。针对铅封检测任务设计了针对性数据增强方法,在较小的计算量下实现小目标数量的扩增,提高检测网络在图像色彩、目标尺度差异、目标位置随机等方面的鲁棒性,从而提高小目标的检测效果;针对高分辨率图像提出了随机中心裁剪以及图像分块两种检测策略,分别满足不同的应用场景,实现高分辨率图像的快速检测。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码导航 ,原文地址:https://m.bishedaima.com/lunwen/54340.html

相关推荐

发表回复

登录后才能评论