复杂背景下细粒度车型识别技术研究
这是一篇关于残差网络,注意力机制,YOLOv4,编码器,车型识别的论文, 主要内容为车型识别技术是智能交通系统的关键部分。当前,一些车型识别技术的成果已经运用到了现实交通场景,这些研究成果减少了车辆管理成本并提高了交通执法效率。然而,目前大部分的车型识别技术只可以完成大卡车、小轿车、SUV等较少类别的粗粒度识别,这些大类别数据无法提供更有效的信息。此外,恶劣天气、黑夜场景、树木及不同车辆遮挡等复杂背景都会增加车辆特征提取的难度,进而影响车型识别的准确度和适应性。针对上述问题,本文基于深度学习网络模型探索了复杂背景下细粒度级别车型识别技术,主要工作归纳如下:1.基于Res Net网络、注意力机制以及编码器模块构建了一种新的细粒度车型识别模型。Res Net网络用CNN建模具有很好的归纳偏置,但其相对于注意力机制而言,长序列建模能力较弱。为了加强残差网络的特征提取能力,在Res Net网络的输入和特征输出位置加入通道注意力与空间注意力。此外,为进一步提升残差网络的建模能力,在最后的池化层后增加两个基于注意力机制的编码器。最后通过三组对比实验证明,注意力模块和编码器模块有效的提升了模型的分类准确率。其中,加入上述两个模块的Res Net 50网络分类准确率达到了85.69%,比原Res Net 50网络提高了2.43个百分点。2.基于Res Net 50网络和注意力模块改进了YOLOv4模型,提出了一种前置网络为CBAM-Res Net 50的YOLOv4细粒度车型检测识别模型。先将空间注意力和通道注意力模块添加至Res Net 50的每个残差块之后建立CBAM-Res Net 50网络,然后再将YOLOv4模型中的主干网络CSPDar KNet53替换为本文搭建的CBAM-Res Net 50网络。最后实验表明,前置网络为CBAM-Res Net 50的YOLOv4模型的训练速度更快、所需的参数量更少且m AP值达到了99.02%,比原YOLOv4模型提高了1.16个百分点。3.对实验所用的斯坦福196车型数据集和Comp Cars车型数据集分别进行了预处理。使用数据增强的方式扩充斯坦福196车型数据集的训练集数量,并将所有车型图片剪裁成224×224大小,提升了网络的泛化能力和鲁棒性。从Comp Cars车型数据集中整理出116类车型,每类的车型图片都大于150张,再将所有图片剪裁成448×448大小,构建了一个基于Comp Cars的多分类车型数据集。
基于深度学习的吸烟检测算法研究
这是一篇关于吸烟检测,YOLOv4,卷积神经网络,小目标检测,注意力机制,轻量级的论文, 主要内容为吸烟不仅有害健康,还可能引发火灾,造成难以想象的人身伤亡与经济损失。中国作为世界上吸烟人口最多的国家,针对公共场所内吸烟行为的监测对公共健康和安全具有较大意义。随着近些年神经网络的突飞猛进,深度学习技术已应用许多场景,基于CNN的香烟检测研究已取得一定的成果,传统深度学习目标检测算法用于香烟小目标检测存在易丢失小目标特征、速度慢、误检率高等问题。针对上述问题,本文在此背景和基础上,针对香烟小目标的检测展开研究,提出了一种基于YOLOv4改进的吸烟检测算法,改善传统算法中存在的缺陷。本文主要内容与研究工作如下:(1)分析禁烟场所吸烟行检测的国内外研究现状,介绍当今主流目标检测算法,并在相同实验环境下基于本文自建数据集使用Faster R-CNN、SSD、Retina Net、YOLOv3、YOLOv4等算法分别展开实验,最终选择最优异的YOLOv4算法作为网络原型进行研究改进。(2)针对模型精度和误检率展开算法的改进,提出一种改进的YOLOv4吸烟检测算法,通过对聚类算法的优化获得更适合香烟小目标检测的Anchor增强尺度适应性;研究损失函数对模型的影响;对通过融合不同种类注意力机制获取更多香烟小目标的语意位置信息,使得香烟小目标检测精度有了较好提升,并通过消融实验结果对比,通过增加类棒状物负样本类有效解决了相关误检。(3)针对YOLOv4体积大、计算量大等特点,基于YOLOv4算法展开轻量级的研究。将YOLOv4-tiny改进并与Mobile Net-YOLOv4进行实验,并利用DSC与肩部的结合提出了一直改进的Mobile Netv3-YOLOv4吸烟检测算法,证明本文提出的算法在精度与速度上得到了合理的平衡,能够实现吸烟行为的实时检测,更加具备实用价值。
基于深度学习的苹果快速检测方法研究
这是一篇关于苹果检测,数据增强,YOLOv4,EfficientNet,PyQt5的论文, 主要内容为苹果检测是苹果采摘机器人系统中的重要技术之一,由于果园中的复杂场景和种类多样,导致苹果检测变得困难。因此,实现快速精准地苹果检测对促进苹果产业的发展具有重要意义。本文针对果园中复杂的场景,以红苹果、绿苹果、套袋苹果和缺陷苹果4种常见的苹果种类检测为研究对象,基于YOLOv4系列模型对苹果检测展开研究,本文主要的研究内容如下:(1)针对苹果数据收集不够全面的问题,并结合果园中复杂的场景,本文提出一种插图数据增强方法,利用收集到的苹果叶子插图随机插入到原始的苹果图像上,用于模拟果园中干扰因素最大的苹果树叶遮挡场景。同时还利用一些传统的数据增强方法来进一步扩展数据,使苹果数据集包含更丰富的场景,模型可以学习到更全面的苹果特征,从而提升苹果的检测效果。通过实验对比,本文提出的插图数据增强方法有利于模型性能的提升,可以精准地检测出复杂场景下的苹果。(2)由于YOLOv4模型较为庞大且处理效率不高,本文提出利用轻量化的Efficient Net网络来替换掉YOLOv4中占比最大的主干网CSPDarknet53,并在输出的三个特征处叠加自定义的卷积块Conv2D来进一步提取和匹配特征。通过实验对比,本文改进的Efficient Net-B0-YOLOv4模型的整体性能优于当前主流的苹果检测模型。另外,针对苹果种类的多样性和当前苹果检测研究的单一性问题,本文基于改进后的模型分别对红苹果、绿苹果、套袋苹果和缺陷苹果4种常见的苹果检测研究进行实验对比。实验结果表明,本文改进的Efficient Net-B0-YOLOv4模型可以精准地检测出不同场景下的苹果,表明该模型具有较好的泛化性能。(3)结合EfficientNet网络的优点,将YOLOv4-Tiny模型中的残差模块进行了优化,加入注意力机制SE模块和自适应的Conv模块,进一步利用提取到的特征信息。将改进的YOLOv4-Tiny-SE*模型与改进的Efficient Net-B0-YOLOv4模型进行实验对比,实验结果表明YOLOv4-Tiny-SE*模型在权重大小和处理效率上优于改进的Efficient Net-B0-YOLOv4模型,且满足复杂场景下的苹果检测。(4)设计并实现了基于C/S模式下的在线苹果检测系统,并利用PyQt5、Qt Designer和Python等工具在客户端上设计了一个多功能的人机交互界面,将数据和参数传送至服务端,由服务端部署的模型进行计算处理,最后将检测结果再返回给客户端,从而实现了复杂场景下的苹果快速检测。
基于注意力机制的轻量化口罩佩戴检测研究
这是一篇关于YOLOv4,轻量化,口罩佩戴检测,注意力机制的论文, 主要内容为当前新冠病毒和呼吸性传染疾病依然威胁着全球人民的健康,给我们的社会工作和日常生活造成了极大的影响。机场、地铁站、商店等地方的人流量既密集又持续,通常以人员监督的形式实施口罩佩戴检测,这会耗费大量的人力和物力,检测效率较低,还可能出现漏检,并且会浪费大量的公共资源。随着深度学习的不断发展,涌现出了许多口罩佩戴检测模型,现有模型存在结构庞大、计算复杂度大以及检测速度慢的问题,在准确性和实时性方面还存在不足,实际应用场景中不利于终端部署和成本控制。针对这些问题,论文开展了基于注意力机制的轻量化口罩佩戴检测研究。通过基于注意力机制的轻量化口罩佩戴检测研究实现对口罩的自动化检测,可以解决口罩检测模型结构庞大复杂、计算参数多和检测效率低的问题,还能满足疫情防控场景下的实时检测需求。本文的主要研究内容如下:(1)基于Ghost Net的YOLOv4轻量化口罩佩戴检测模型(GN-YOLOv4)。针对口罩佩戴检测模型中的网络结构庞大复杂、参数多以及检测速度慢的问题,提出GN-YOLOv4模型。该模型首先使用Ghost Net替换原网络的主干网络,以减少网络中的参数量,降低计算复杂度,从而提高模型的检测速度;然后改进YOLOv4的PANet中的部分卷积,增大感受野,使模型参数量进一步缩减,检测速度进一步提升。实验结果表明,模型的参数量和计算量相比YOLOv4减少了60%和76%,检测速度提升了75%,从而实现口罩佩戴检测的轻量化和快速化。(2)基于注意力机制的GN-YOLOv4轻量化口罩佩戴检测模型(GN-AttYOLOv4)。在GN-YOLOv4模型的基础上,提出GN-Att-YOLOv4。该模型首先引入了深度可分离卷积和注意力机制改进主干网络中的部分卷积模块,减少模型计算量,提高检测速度;然后采用Rep VGG网络代替Conv×5卷积块中所有3×3卷积操作,提高模型的特征提取能力和检测精度;最后采取了批量归一化层与卷积层融合计算的策略,使模型的计算复杂度进一步降低。实验表明,该模型在检测精度和检测速度上都得到了提升,相比GN-YOLOv4模型提升了0.64%的精度值,检测速度也高达99.9FPS,能够应用于更复杂的检测情形。(3)基于GN-Att-YOLOv4的口罩佩戴检测原型系统设计。采用Python语言程序设计,使用Pycharm开发工具,采用基于注意力机制的GN-YOLOv4模型研究方法,开发了口罩佩戴检测原型系统。该原型系统能够自动快速地识别图片或视频中人的口罩佩戴情况,具有重要的应用价值。
不停航施工条件下机场跑道施工侵入物图像视频预警研究
这是一篇关于不停航施工,层次分析,YOLOv4,施工侵入物检测,预警平台的论文, 主要内容为随着我国民航运输规模的不断扩大,原有基础设施已逐渐无法满足机场运行的要求,同时为了不影响机场航班的飞行任务,机场改扩建工程往往需要在不停航条件下进行施工,这就为机场航班的安全运行带来风险。不停航的施工区域主要为飞行区,这个区域不是单一的施工区域,同时还承担着航空器起降的重要任务,两种工作时间及空间上的交集,就导致在机场跑道上可能会出现新的外来物,对机场跑道飞行安全造成严重的威胁。机场在发展、效益、服务等关系中始终要将安全置于第一位,如何有效保障不停航施工下的机场运行安全成为了一个亟待解决的热点问题。本文从不停航施工对跑道带来的影响出发,基于图像检测识别的原理,应用目标检测的方法来实现对跑道施工侵入物的检测预警,对提高机场跑道运行安全管理具有一定的理论意义和实践价值。本文结合SHEL模型分析不停航施工对跑道运行安全带来的风险,在此基础上提取具体施工侵入物进行危险性层次排序,将危险性较大的施工侵入物作为本文的研究对象,通过构建目标检测算法模型对其进行检测实验,并对模型进行优化,设计搭建一个跑道施工侵入物检测及预警平台。主要研究结论如下:(1)基于SHEL模型分析不停航施工带来的机场外来物侵入风险,并从中提取具体的施工侵入物体,借助层次分析法对施工侵入物危险性进行排序,得到螺丝、螺母、混凝土脱落物、钢卷尺、石子、塑料瓶、地面裂缝、钢筋八类施工侵入物所占权重较大排序靠前,作为目标检测的对象。(2)构建满足机场跑道施工侵入物检测的数据集,分别使用YOLOv4、Faster-RCNN、SSD算法三种算法进行施工侵入物图像检测识别,通过统计检测结果TP、FP、FN的值,计算每种算法精确率、召回率、平均精度的值,并结合Map及检测速度的值,对比分析三种检测算法的指标结果,其中YOLOv4算法的精确率为70.44%,检测速度为20.73帧/s,综合检测效果最佳。(3)通过对YOLOv4算法进行网络优化及数据集优化来提升算法的检测效果。其中网络优化通过引入注意力机制的方式;数据集优化通过增加每类施工侵入物照片的拍摄数量。两次改进后算法的平均精确率分别提升了15.06%、5.35%,证实改进方式是有效的,使用改进后的算法模型对侵入物视频进行动态检测并加入轨迹跟踪算法。(4)在系统设计目标原则的基础上,分析系统的用户需求及预警等级划分,通过设计机场跑道施工侵入物检测及预警系统的总体架构设计、流程和功能模块,分析反馈回路中侵入物防控应急处置方案,完成实际跑道施工侵入物检测及预警平台的搭建。
复杂背景下细粒度车型识别技术研究
这是一篇关于残差网络,注意力机制,YOLOv4,编码器,车型识别的论文, 主要内容为车型识别技术是智能交通系统的关键部分。当前,一些车型识别技术的成果已经运用到了现实交通场景,这些研究成果减少了车辆管理成本并提高了交通执法效率。然而,目前大部分的车型识别技术只可以完成大卡车、小轿车、SUV等较少类别的粗粒度识别,这些大类别数据无法提供更有效的信息。此外,恶劣天气、黑夜场景、树木及不同车辆遮挡等复杂背景都会增加车辆特征提取的难度,进而影响车型识别的准确度和适应性。针对上述问题,本文基于深度学习网络模型探索了复杂背景下细粒度级别车型识别技术,主要工作归纳如下:1.基于Res Net网络、注意力机制以及编码器模块构建了一种新的细粒度车型识别模型。Res Net网络用CNN建模具有很好的归纳偏置,但其相对于注意力机制而言,长序列建模能力较弱。为了加强残差网络的特征提取能力,在Res Net网络的输入和特征输出位置加入通道注意力与空间注意力。此外,为进一步提升残差网络的建模能力,在最后的池化层后增加两个基于注意力机制的编码器。最后通过三组对比实验证明,注意力模块和编码器模块有效的提升了模型的分类准确率。其中,加入上述两个模块的Res Net 50网络分类准确率达到了85.69%,比原Res Net 50网络提高了2.43个百分点。2.基于Res Net 50网络和注意力模块改进了YOLOv4模型,提出了一种前置网络为CBAM-Res Net 50的YOLOv4细粒度车型检测识别模型。先将空间注意力和通道注意力模块添加至Res Net 50的每个残差块之后建立CBAM-Res Net 50网络,然后再将YOLOv4模型中的主干网络CSPDar KNet53替换为本文搭建的CBAM-Res Net 50网络。最后实验表明,前置网络为CBAM-Res Net 50的YOLOv4模型的训练速度更快、所需的参数量更少且m AP值达到了99.02%,比原YOLOv4模型提高了1.16个百分点。3.对实验所用的斯坦福196车型数据集和Comp Cars车型数据集分别进行了预处理。使用数据增强的方式扩充斯坦福196车型数据集的训练集数量,并将所有车型图片剪裁成224×224大小,提升了网络的泛化能力和鲁棒性。从Comp Cars车型数据集中整理出116类车型,每类的车型图片都大于150张,再将所有图片剪裁成448×448大小,构建了一个基于Comp Cars的多分类车型数据集。
基于改进YOLOv4的交通标志识别方法研究
这是一篇关于深度学习,目标检测,交通标志识别,卷积神经网络,YOLOv4,算法改进,B/S网络架构的论文, 主要内容为随着科学技术的进步,汽车的保有量逐日递增,人们在选择出行方式时均将汽车列为首选方式。为了提高人们驾车的舒适度与安全性,大量研究者们针对汽车的辅助驾驶功能做出了大量的研究。据调查显示,在交通事故的发生原因采集中,发现绝大多数的事故是由于驾驶员未能注意到交通标志信息导致发生不安全事故。所以,交通标志信息在道路行驶上具备尤为重要的地位,它不仅传递驾驶路况的环境信息,也可以规范驾驶人员安全驾驶。交通标志识别技术作为目标识别技术针对应用的技术延展,其发展正是目标识别算法的优化产物。近年来,基于深度学习技术下的目标检测算法精进了许多,国内外学者对此均有相对成熟的理论研究成果。例如,基于卷积神经网络系列代表的YOLO算法,已历经四次大的改进,直至今日的YOLOv4,该算法主要针对目标检测技术,具备一定的高效性,但精准程度上还有很大的改进空间。本文针对基于YOLOv4算法改进的交通标志识别系统研究如下。(1)本文研究了卷积神经网络与其衍生算法YOLOv4,对其网络结构、算法原理做出了深入的研习。针对YOLOv4的两个问题,即训练效率与测试精度做出了相应研究并实现其改进。(2)本文先后三次针对TT100K中国交通标志数据集创建模型进行训练,并得到三种相应的权重,对测试结果进行了性能上的实验并的到结果。基于梯度下降的改进、自对抗训练的方式与批量归一化对训练效率有较好的优化作用;先验框聚类改进与非极大值抑制法的改进上可对测试精度有所提升。其中两种非极大值抑制法DIo U-NMS与Soft-NMS的测试结果也做出了对比,其表现程度相当。(3)本文在实现了YOLOv4算法改进并取得结果后,为改进后的算法设计了一套根据B/S网络架构的Web端可视系统,并进行了效果展示。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码项目助手 ,原文地址:https://m.bishedaima.com/lunwen/46261.html