前方车辆车窗抛物行为智能检测技术研究
这是一篇关于车窗抛物,深度学习,车辆检测,小目标检测,目标跟踪的论文, 主要内容为“车窗抛物”是指驾驶员和乘车人员从车内向外乱扔杂物的不文明行为,是最普遍的驾驶陋习之一。“车窗抛物”不仅会使周边环境恶化,而且可能引发一系列交通安全事故,已经成为中国进入汽车社会的一大公害行为。近年来,“车窗抛物”问题引起了社会各界的广泛关注,各地交通管理部门也已将其列为重点查处的违法行为,但是仍然屡禁不止。究其原因,一方面是还存在宣传教育不够,部分驾驶员文明意识、安全意识比较淡薄等问题;另一方面,在“车窗抛物”违法行为查处实践中,面对“车窗抛物”行为所具有的隐蔽性强、随机性强等特点,对于传统的仅依靠固定式电子警察抓拍设备抓拍,道路巡逻及岗点警力日常勤务中利用车载行车记录仪对机动车的“车窗抛物”行为进行拍摄取证等手段,往往面临监测范围受限和取证难等诸多现实困难。近年来,随着人工智能相关领域技术的快速发展,提出更具智能性、实时性和普及性的“车窗抛物”行为检测方法,已被认为是在更大范围对“车窗抛物”行为进行更有效查处整治的现实途径之一。基于上述背景,本文以车载式单目摄像头作为交通场景视频采集方案,结合实际道路交通场景特点,综合运用人工智能技术、机器视觉技术,围绕摄像视野内前方车辆“车窗抛物”行为智能检测技术开展深入研究。主要的研究工作及研究成果如下:(1)在多运动车辆检测方面,针对实际交通场景中车流密度大,车辆种类繁多,道路环境复杂,以及车载式移动视频图像存在噪声干扰等问题,为进一步提高实际交通场景内的多运动车辆识别性能,提出了一种改进Yolov4的运动多车辆目标识别算法。该算法通过采用Ghost Net轻量级网络代替原Yolov4模型中的CSPDarknet53主干网络,以减少模型参数和计算量,同时在模型的路径聚合网络结构中,采用Dense Net对模型结构进一步实施简化处理,以改善梯度消失问题。实验结果表明,该方法相较于原Yolov4模型,在检测速率方面有了大幅提升。(2)在车窗抛物小目标检测方面,针对复杂场景中小目标检测存在的检测速度慢、误检率高等问题,提出了一种基于Cascade RCNN的感兴趣区域小目标检测算法。该算法借鉴注意力机制思想,将图像视野内的小目标检测问题转化为感兴趣区域内的小目标检测问题,以提高小目标在背景图像中的像素占比。算法实现过程中,首先根据车窗抛出物体运动轨迹统计学特征建立感兴趣区域动态生成算法,然后利用该算法动态标定目标车辆感兴趣区域,最后利用Cascade RCNN目标检测模型,对感兴趣区域内是否存在疑似车窗抛物小目标进行实时检测。实验结果表明,该方法可以有效提升小目标检测结果的精度及检测速度。(3)在小目标跟踪与“车窗抛物”行为判定方面,基于多运动车辆检测和感兴趣区域内小目标检测算法,提出了一种基于Deep Sort算法的感兴趣区域内小目标物体跟踪方法,以及基于小目标大小特征和运动轨迹特征的“车窗抛物”行为判定规则。实验验证结果表明,综合集成本论文在目标检测与目标跟踪方面所提出的模型算法,利用“车窗抛物”行为判定规则,可有效对“车窗抛物”行为实施检测与判定。
基于信息增强的微小目标检测与识别方法研究
这是一篇关于小目标检测,信息增强,多尺度特征融合,横向连接的论文, 主要内容为基于深度学习的小目标检测发展是推动智能现代化生活的重要研究领域,广泛应用于智能安全、缺陷检测、智能农业和医疗诊断等领域,极大地提升工作效率。然而,在复杂场景中小目标检测方法面临着目标尺度变化大、小目标与背景相近、小目标密集叠加等问题,因此目标检测模型难以自适应地提取不同尺度的、具有判别性的目标特征,导致检测准确率低和泛化能力较差。针对以上问题,本文利用信息增强、筛选式目标重采样、多尺度特征融合等方法增加小目标的训练次数和增强语义信息特征,从而增强模型对小目标群体的信息提取能力。本文的三个主要研究内容如下:(1)像素筛选式的目标位置区域信息增强方法研究。由于数据集中小目标可视化信息不足导致提取到具有鉴别力的特征少,本文提出一个像素筛选式的目标位置区域信息增强模型对数据集中的所有目标进行筛选式重采样操作,通过复制图像中像素阈值下的小目标来直接获取组合数量的合成训练数据,实现在不增加数据集图像数量的前提下增加小目标样本数目。另一方面,通过在包含小目标图像中进行目标粘贴,并确保在粘贴每个小目标对象时不与任何现有目标对象产生完全重叠,进一步增强小目标位置区域特征信息提取能力。(2)基于多尺度特征融合和浅层信息增强方法研究。针对提取小目标浅层位置特征和深层语义信息难以保留完整的问题,本文提出一种基于多尺度特征融合和浅层信息增强模型,通过将Res Net-50与适配型特征金字塔网络组合连接的方法增强目标的语义信息特征提取,其中适配型特征金字塔网络用来解耦大小各异的目标特征信息,为小目标分配更适配的特征层级。其次,通过深度学习技术对提取的浅层语义信息和深层语义信息进行横向连接,实现利用卷积网络和语义信息连接加强各层级特征映射间的联系,进一步加强目标信息提取的完整程度。(3)基于信息增强的微小目标检测与识别方法研究。首先使用像素筛选式的目标位置区域信息增强模型,对数据集中的所有目标进行筛选式重复采样,并通过从源图像中剪切小目标块,经过对小目标块进行复制与翻转处理后粘贴到原目标图像,直接获取组合数量的合成训练数据。然后使用基于多尺度特征融合和浅层信息增强模型,对经过处理的数据集图像进行采样处理,提取出目标的特征信息并输出特征图进行图像尺寸统一化处理。将其传入全卷积网络后得到热力图,其中每个热力图的峰值点位置预测目标中心位置信息,最终由预测得到的中心关键点回归得到目标边界框的位置大小和目标所属类别。实验结果表明,所提方法能够显著提高含有小尺度目标图像的检测性能。与原算法在安全帽佩戴数据集(Safety Helmet Wearing Dataset,SHWD)上的检测效果相比,取得89.06%的平均精度均值和28.96的每秒传输帧数,相比之前的方法的平均精度均值提高了18.08%,并且对小目标的检测结果也优于原算法和当前先进的检测算法YOLOv4等,进一步证明所提模型对检测小目标群体的有效性。
前方车辆车窗抛物行为智能检测技术研究
这是一篇关于车窗抛物,深度学习,车辆检测,小目标检测,目标跟踪的论文, 主要内容为“车窗抛物”是指驾驶员和乘车人员从车内向外乱扔杂物的不文明行为,是最普遍的驾驶陋习之一。“车窗抛物”不仅会使周边环境恶化,而且可能引发一系列交通安全事故,已经成为中国进入汽车社会的一大公害行为。近年来,“车窗抛物”问题引起了社会各界的广泛关注,各地交通管理部门也已将其列为重点查处的违法行为,但是仍然屡禁不止。究其原因,一方面是还存在宣传教育不够,部分驾驶员文明意识、安全意识比较淡薄等问题;另一方面,在“车窗抛物”违法行为查处实践中,面对“车窗抛物”行为所具有的隐蔽性强、随机性强等特点,对于传统的仅依靠固定式电子警察抓拍设备抓拍,道路巡逻及岗点警力日常勤务中利用车载行车记录仪对机动车的“车窗抛物”行为进行拍摄取证等手段,往往面临监测范围受限和取证难等诸多现实困难。近年来,随着人工智能相关领域技术的快速发展,提出更具智能性、实时性和普及性的“车窗抛物”行为检测方法,已被认为是在更大范围对“车窗抛物”行为进行更有效查处整治的现实途径之一。基于上述背景,本文以车载式单目摄像头作为交通场景视频采集方案,结合实际道路交通场景特点,综合运用人工智能技术、机器视觉技术,围绕摄像视野内前方车辆“车窗抛物”行为智能检测技术开展深入研究。主要的研究工作及研究成果如下:(1)在多运动车辆检测方面,针对实际交通场景中车流密度大,车辆种类繁多,道路环境复杂,以及车载式移动视频图像存在噪声干扰等问题,为进一步提高实际交通场景内的多运动车辆识别性能,提出了一种改进Yolov4的运动多车辆目标识别算法。该算法通过采用Ghost Net轻量级网络代替原Yolov4模型中的CSPDarknet53主干网络,以减少模型参数和计算量,同时在模型的路径聚合网络结构中,采用Dense Net对模型结构进一步实施简化处理,以改善梯度消失问题。实验结果表明,该方法相较于原Yolov4模型,在检测速率方面有了大幅提升。(2)在车窗抛物小目标检测方面,针对复杂场景中小目标检测存在的检测速度慢、误检率高等问题,提出了一种基于Cascade RCNN的感兴趣区域小目标检测算法。该算法借鉴注意力机制思想,将图像视野内的小目标检测问题转化为感兴趣区域内的小目标检测问题,以提高小目标在背景图像中的像素占比。算法实现过程中,首先根据车窗抛出物体运动轨迹统计学特征建立感兴趣区域动态生成算法,然后利用该算法动态标定目标车辆感兴趣区域,最后利用Cascade RCNN目标检测模型,对感兴趣区域内是否存在疑似车窗抛物小目标进行实时检测。实验结果表明,该方法可以有效提升小目标检测结果的精度及检测速度。(3)在小目标跟踪与“车窗抛物”行为判定方面,基于多运动车辆检测和感兴趣区域内小目标检测算法,提出了一种基于Deep Sort算法的感兴趣区域内小目标物体跟踪方法,以及基于小目标大小特征和运动轨迹特征的“车窗抛物”行为判定规则。实验验证结果表明,综合集成本论文在目标检测与目标跟踪方面所提出的模型算法,利用“车窗抛物”行为判定规则,可有效对“车窗抛物”行为实施检测与判定。
改进YOLOv5小目标检测方法在智慧矿山中的应用研究
这是一篇关于智慧矿山,小目标检测,多层融合,子像素卷积,K-means++,SIoU损失函数的论文, 主要内容为在露天矿作业场景中,使用激光云台对生产过程进行监控,在监控画面中通常存在大量的人和车辆等小目标。然而,这些小目标分布密集、分辨率低且尺度不均匀,导致目标检测算法的检测难度大,可能造成漏检或误检的情况,将给露天矿安全开采带来隐患。针对上述问题,本文提出了一种基于改进YOLOv5的小目标检测算法(Multi Layer Fusion and Super-resolution Network,MS_Net),旨在满足露天矿作业场景中小目标的检测需求,实现矿山智能检测。具体的改进内容如下:(1)针对露天矿作业场景中小目标分布密集的问题,本文提出了多层融合模块(Multi-layer Fusion,MLF)。MLF模块融合了PANet的三个输出层和保留大量小目标位置信息的F1特征图,综合利用不同层所提供的位置信息和语义信息,增强模型对小目标的识别和定位能力,有效解决露天矿作业场景中小目标分布密集的问题。(2)针对露天矿作业场景中小目标分辨率低的问题,本文采用超分辨率方法中的子像素卷积作为模型的上采样方法。相比于双线性插值进行上采样,子像素卷积在提高分辨率的同时,可以最大限度地保留特征图的细节信息,减少特征丢失。(3)针对露天矿作业场景中小目标尺度不均匀的问题,本文使用K-means++算法自适应确定最佳的锚框数量和大小,可以更好地适应不同尺度目标的检测需求,提高模型的检测精度和鲁棒性。K-means++算法还可以减少训练时间和空间消耗。(4)为了更准确地评估小目标预测框和真实框之间的匹配程度,本文采用SIo U损失函数作为模型的定位损失函数。相比于CIo U损失函数,SIo U损失函数考虑到所需回归之间的向量角度,重新定义了惩罚指标,从而提高模型的稳定性和鲁棒性,特别是在小目标检测方面具有较好的效果。MS_Net模型在VOC数据集上的m AP@0.5为79.4%,FPS为59;在矿山数据集上的m AP@0.5为80.2%,FPS为64.5。消融实验结果表明,MS_Net模型提出的四种优化策略可以有效增强YOLOv5在露天矿作业场景中小目标的识别和检测能力。MS_Net模型部署到Deep Stream平台中的检测效果和实际应用分析表明,MS_Net模型能快速、准确、高效地检测出露天矿作业场景中的车辆和作业人员等小目标。
基于ResECNet的小目标检测算法研究与实现
这是一篇关于小目标检测,ResECNet算法,特征金字塔网络,损失函数,原型系统的论文, 主要内容为随着深度学习技术的快速发展,目标检测领域也取得重大突破,目标检测技术被成功应用于安防监控、智能驾驶、医疗图像识别等众多领域。然而,由于小目标自身的特性(像素少、易于噪声混淆等),当前主流目标检测算法对小目标的检测精度远低于中大尺寸目标的检测精度。本文针对小目标特征难以提取的问题,对特征金字塔网络进行改进,设计一个全局上下文信息模块提取上下文信息辅助小目标的检测,并在此基础上提出Res ECNet小目标检测算法。本文主要研究工作如下:(1)面向小目标检测的跨分辨率信息交互算法研究。针对特征金字塔网络底层特征较弱、鲁棒性不强影响小目标检测的问题,设计一种特征金字塔网络的改进形式。在原本特征金字塔网络的基础上,增加一个特征拼接模块和自底向上的路径,通过充分融合不同分辨率的特征,对各层特征进一步加强。同时针对小目标像素少,提取到的特征也少,导致难以检测小目标的问题,设计一个全局上下文信息提取模块,利用全局上下文信息来辅助小目标检测。最后将全局上下文信息提取模块与改进的特征金字塔网络进行融合,使得融合后的特征既含有丰富的语义、位置信息又含有丰富的全局上下文信息。(2)基于Res ECNet的小目标检测。针对Retina Net算法存在的问题,为了更好的检测小目标,设计Res ECNet小目标检测算法。该算法在Retina Net算法的基础上进行多种改进,以深度残差网络为特征提取网络,使用分辨率更高的底层特征图来检测小目标,并利用融合全局上下文信息的再优化跨分辨率信息交互网络进行特征融合和上下文信息提取,使得最终提取的特征兼顾深层语义信息和全局上下文信息;同时设计改进的GIo U Loss作为算法的边界回归损失,以及使用K-means对锚框进行参数设置来进一步提升算法对小目标检测的性能。最后,通过实验验证Res ECNet算法的有效性。(3)小目标检测原型系统设计与实现。为了实际部署本文设计的Res ECNet算法,本文设计并实现一个基于C/S架构的小目标检测原型系统,原型系统以Res ECNet为小目标检测算法,拥有用户登录、图片检测、视频检测、数据存储、检测记录查看、模型训练和用户权限管理的功能。最后对系统进行测试,验证系统的有效性。
基于深度学习的小目标检测算法研究
这是一篇关于小目标检测,残差特征增强,对称网络,多尺度融合,自注意力的论文, 主要内容为随着深度学习的发展,目标检测算法的性能得到了很大提升,是智能安防、自动驾驶、智慧交通、医疗诊断等领域的重要支撑技术。在目标检测的实际应用中,由于角度、距离、遮挡等因素导致图像中存在许多面积占比小、像素点少的目标。这些目标的尺寸小、特征信息有限,因此检测精度较低,漏检、误检率高。为了提高小目标检测精度,本文深入分析不同场景下小目标检测难点,提出了两种小目标检测算法。本文的主要工作如下:(1)针对远距离监控场景下产生的小尺度目标漏检问题,提出基于残差特征增强与对称金字塔网络(Residual Feature Enhanced-Symmetric Pyramid Network,RFE-SPN)的小目标检测算法。该算法设计了一种新颖的特征金字塔网络REF-SPN,包含残差特征增强RFE和对称金字塔网络SPN两个模块。其中,RFE用于过滤浅层特征图的背景噪声、增强底层特征信息;SPN构建对称结构的特征金字塔网络,利用双分支结构传递信息,使每层都可以补充来自其他层的高级语义信息和底层详细信息。所提出算法在多个数据集上实验,实验结果表明该算法可以有效提高小目标检测精度,缓解小目标漏检问题。(2)针对复杂场景下由遮挡导致的小目标特征信息缺失问题,提出基于自注意力网络的小目标检测算法。该算法提出了一种基于上下文信息的自注意力机制(Context Based Self Attention,CBSA),将上下文信息挖掘和自注意力学习集成在统一的框架中,对图像非局部特征建模,有效获取全局信息。基于提出的自注意力机制设计了一种自注意力网络CBSA-Net,利用自注意力在浅层网络学习全局特征信息,加强远距离像素之间的联系,通过全局上下文信息增强小目标特征。其次,CBSA-Net重新构建网络的深层特征图,在不增加下采样次数的情况下,使深层特征图尽可能保留小目标信息,同时拥有较大感受野和强大语义信息。基于自注意力网络的小目标检测算法在两个数据集上实验,实验结果表明该算法可以有效解决由遮挡造成的小目标特征信息缺失问题,有效提高小目标检测精度。综上所述,本文针对远距离监控场景下产生的小目标漏检问题以及复杂场景下由遮挡导致的小目标信息缺失问题,提出的两种小目标检测算法,通过有效利用网络浅层小目标信息以及全局信息,提高了小目标检测精度。
基于无人机的道路监测系统设计与实现
这是一篇关于小目标检测,轻量级模型,道路监测系统,深度学习,安卓开发的论文, 主要内容为传统的道路监控探头在处理交通事故中需要专业人员手动找到违规人员和肇事车辆,这样不仅效率低下,且因为探头被固定安装带来了机动性差、视野狭窄等问题。将无人机摄像头作为道路监控探头具有体积小、成本低、视野广阔、灵活性高等优点,此外,运用基于视觉的目标检测技术对无人机影像进行智能化分析可以快速且准确的定位地面的行人及车辆,同时大幅度提升监测效率。基于上述背景,本文对行人及车辆目标检测技术展开了研究,并基于安卓开发和目标检测设计并实现了一个道路监测系统,主要工作如下:1)对基于深度学习的行人及车辆检测算法进行理论研究和实验分析。为了增强模型的泛化能力,独立标注了无人机拍摄和网络视频截图的图片,与部分Visdrone2019图片一同构成本文使用的数据集。虽然基于深度学习的目标检测和传统算法相比,其可以学习到不同的辨别性特征,且泛化能力更强,但网络复杂度的增加使其在便携式设备上的移植出现了困难。针对上述问题,本文选取了一个轻量级检测模型YOLOv5s,其检测速度快、检测效果佳、计算量小且模型体积仅为14.4MB,降低了对系统算力的要求。此外还通过处理数据集以及调节训练时参数优化检测模型,使得m AP(mean average precision)上升2.0%。2)针对无人机视角下密集区域小目标检测问题,改进了检测模型网络结构。无人机需要在复杂多变的环境中监测地面情况,其飞行较高时地面目标尺寸会变得很小,给目标检测带来了困难。本文在Backbone部分加入了CBAM注意力机制,同时在Neck部分增加了一个小目标检测层,使得检测模型的m AP提升7.6%。针对无人机摄像头在飞行中可能会出现的角度变化、遮挡、镜头模糊等问题,对改进后的模型进行了鲁棒性分析,实验结果表明改进后的模型具有较强的稳定性和适应能力。3)基于安卓移动应用程序开发及Py Torch转ncnn技术,将改进后的检测模型部署到算力弱、价格低廉、易携带、功耗低以及可扩展性高的安卓设备上,实现无人机摄像头在线对行人及车辆进行监测。为了使系统更加智能化,还引入了在线的高德2D地图,添加了若干与自主飞行相关的可交互按钮,用户可以根据自己的需求定制飞行任务,实现无人机在自主飞行时对地面目标监测。经过测试,此道路监测系统可以在线检测行人及车辆,系统可用且检测效果好。
基于深度学习的农作物害虫检测算法研究
这是一篇关于深度学习,农作物害虫检测,轻量级网络,小目标检测的论文, 主要内容为害虫是造成农作物产量减少和品质下降的重要因素。快速、准确地检测害虫信息是害虫防治的重要前提。传统方法依靠农技人员深入田间地头“眼观手查”,诊断结果取决于个人知识与经验,费时费力且可靠性不足。基于深度学习的智能害虫检测方法便捷、省时省力、结果客观可靠,弥补了传统方法的部分缺点,但是应用于实际农田环境时仍然存在以下问题:农田环境下害虫与背景过于相似导致检测精度较低,特别是针对小目标害虫的检测,由于目标可提取特征有限、易受环境干扰以及特征在信息流通中易丢失等原因,检测效果不佳;现有模型参数量和计算量大,难以部署至移动设备进行实际应用。针对上述问题,本文针对农作物害虫检测算法,从模型精度和效率两方面开展了相关研究,具体研究内容如下:(1)提出了一种基于改进YOLOv5的农作物害虫检测方法。针对农田环境下害虫特征难以提取、害虫语义信息不足的问题,构建了Pest-YOLOv5检测模型。首先,位置敏感特征提取器整合空间坐标信息与特征通道,增强了农田环境下害虫区域重要特征的提取能力。其次,通过加权双向特征金字塔颈部连接结构增强了深层网络中的害虫特征表示。最后,优化损失函数提高对困难样本的关注程度,进一步增强害虫特征学习能力。在农田环境害虫数据集Agri Pest、PEST35上,Pest-YOLOv5检测精度分别达到70.4%、74.1%,比YOLOv5提高了8.1%、3.2%。Pest-YOLOv5在Agri Pest上的表现优于YOLOv3和Faster R-CNN等目标检测模型,在PEST35上仅次于Faster R-CNN和YOLOv8s。实验结果表明Pest-YOLOv5可以在农田环境下实现更好的检测性能。(2)提出了一种基于改进MobileNetV3的轻量级农作物害虫检测方法。为了降低网络参数量和计算量,构建了轻量级农作物害虫检测模型Lite Net,以极少的参数和计算量实现了害虫检测,并进一步提高了检测精度。首先,通过改进MobileNetV3构建轻量主干网络,有效降低了参数和计算量。其次,轻量特征融合模块以极少参数量融合了局部和全局特征,增强了害虫特征表示。最后,轻量检测头在大幅度降低了模型复杂度的同时显著提高模型检测性能。在Agri Pest数据集上,Lite Net的m AP0.5达到了71.1%,参数量仅1.758M,浮点计算量仅6.7GFLOPs。在PEST35数据集上,Lite Net的m AP0.5达到了76.7%,参数量仅2.234M,浮点计算量仅8.2GFLOPs。与其他轻量模型相比,Lite Net同时实现了模型规模轻量化和最佳检测性能,为模型部署奠定了基础。(3)提出了一种基于混合注意力机制的农作物害虫小目标检测方法。针对环境噪声影响小目标特征学习、小目标特征易丢失导致的检测困难问题,构建了农作物害虫小目标检测模型Pest Lite Net,适用于农田环境,兼顾检测精度、模型规模和检测速度。首先,通过高效通道注意力在小目标特征薄弱处增强害虫特征表示,减少噪声干扰。其次,改进的坐标注意力通过筛选通道,将空间信息嵌入更重要通道,进一步增强特征提取能力。最后,轻量颈部结构在不损害检测性能的情况下减少了参数和计算量,轻量检测头进一步精简模型规模、提高检测性能。本文提出的Pest Lite Net在Agri Pest数据集上实现了最佳检测性能,m AP0.5为75.3%。同时,Pest Lite Net具有与轻量级算法相当的参数量和计算量,且检测单张图片耗时在GPU、CPU环境下分别为10.7毫秒、54.3毫秒,与最快算法相当。
基于单阶段网络RetinaNet的小目标检测方法研究
这是一篇关于小目标检测,RetinaNet,单阶段检测器,骨干网络,特征融合,损失函数的论文, 主要内容为小目标检测是目标检测领域一个颇具挑战性的分支,因图像分辨率较低或在空间上占据的像素数较少,这些目标的定位和分类的难度都大大增加了。在自动驾驶,视频监控,航拍等实际应用中,小目标在总的目标中占据大多数,这使得在主流目标检测数据集训练的模型在应用过程中,会存在域迁移的问题,导致较大的偏差。此外,由于以上领域对目标检测实时性的要求较高,出于速度和精度的折衷,多使用单阶段目标检测器。本文旨在提出具有可移植性的提升单阶段目标检测器的模块化方法,提升这些模型对于小目标的检测能力。本文探索了基于单阶段网络的小目标检测问题,在主流的单阶段检测网络Retina Net的基础上进行了研究。小目标检测的难点在于,需要高的空间分辨率来获得细粒度特征,同时也需要生成高质量的候选边界框。此文提出了几种创新的模块化改良方法,针对性地解决以上难题,增强了单阶段目标检测器Retina Net对于小目标的检测能力。我们将论文的贡献总结如下:第一点,在残差网络中增加了空洞卷积,在增大感受野的同时保留了图像细节,有利于小目标的判别与分类。第二点,提出了一种创新的特征融合方法,可以直接融合语义信息与低层特征。第三点,用ASL1损失函数作为边界框回归损失,这提升了原点附近损失函数的梯度,可以生成更高质量的候选边界框。在小目标数据集MOCOD进行验证,m AP相比原来获得了5.1的大幅提升。我们提出的方法可以很容易地迁移到其他具有特征金字塔结构的骨干网络,来增强它们检测小目标的能力。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设项目助手 ,原文地址:https://m.bishedaima.com/lunwen/47852.html