基于EfficientNet的行人重识别及目标识别研究
这是一篇关于深度学习,行人重识别,目标检测,卷积神经网络,嵌入式的论文, 主要内容为近年来,深度学习在计算机视觉领域的应用取得了突破性的进展,其中行人重识别和目标检测任务都成效显著。一般而言,行人重识别和目标检测实际任务都需要考虑模型体积的问题,以适应实际场景的部署约束。EfficientNet是一类卷积神经网络模型,其采用了复合缩放技术,可以针对网络深度、宽度和分辨率进行独立优化,具有性能高、模型体积小等特点。本文基于EfficientNet主干网模型对行人重识别和目标检测进行研究和应用,主要工作如下:1)针对行人重识别领域中现存SOTA(State-Of-The-Art)方案模型体积大的问题,提出了一种基于EfficientNet的行人重识别网络模型EPRI-Net。该模型吸收了特征金字塔技术的特征融合思想,具有模型体积小且性能优异的特点。实验表明,在典型行人重识别数据集Market1501上,所提出的EPRI-Net达到了90.2%的mAP以及96.1%的Rank-1。2)针对实际轮船检测场景下的行人检测任务,提出了一种基于EfficientNet的小规模行人目标检测模型——EPRI-Det。EPRI-Det是在EPRI-Net的基础上进行设计,其关键特色是通过特征金字塔分支用于检测行人目标的位置与类别。实验表明,EPRI-Det在船员数据集上的mAP为73.2%,略低于Yolov5s的75.6%,但模型参量为4M,大幅低于Yolov5s的7.2M。3)针对实际轮船船员的安全衣帽穿戴任务,对EPRI-Det进行落地应用,部署到瑞芯微嵌入式平台上进行推理测试,提出了一套基于EPRI-Det的船员安全衣帽穿戴嵌入式目标检测方案。实验表明,该方案训练后的mAP为56.2%,部署到嵌入式平台后,单张图片的推理时间为470ms左右。
基于分组卷积的无监督注意机制行人重识别方法研究
这是一篇关于行人重识别,分组卷积,注意力机制,无监督学习,孪生网络的论文, 主要内容为监控系统在现代社会中得到了广泛的应用,对于打击犯罪、追踪嫌疑人、寻找失踪人员等有重要作用。行人重识别是监控系统的关键技术之一,它能够在不同摄像头视角下识别同一行人,因此受到了众多专家学者们的广泛关注。然而,大多数行人重识别方法都是基于有监督学习的,需要大量的标注数据集来训练模型。这种标注数据集不仅耗费人力物力,而且成本高昂,限制了模型在实际场景中的应用。为此,本文提出了一种基于分组卷积的无监督注意机制行人重识别方法。该方法利用聚类算法自动给图像分配伪标签,并使用分组卷积提取图像特征和增强准确性。同时,考虑到实际场景中更常见的是使用单张图像检索视频库中的目标行人,因此本文还设计了一个基于分组卷积的注意力机制孪生网络来实现图像到视频的行人重识别,并同样采用分组卷积提高重识别效果。本文主要研究内容如下:针对图像到图像的行人重识别,提出了一种基于分组卷积的无监督注意力机制行人重识别方法,用于解决行人重识别中需要带有标签的数据集,以及无法进行完全无监督等问题。该方法使用Res Net50作为骨干网络,并用分组卷积替代原有的卷积层。同时,在Res Net50中通过应用CBAM注意力机制来提取行人特征。最后,通过实例判别损失和层次聚类损失来优化网络模型,使网络模型能够在没有任何监督信息的情况下进行行人重识别任务。本文在Market-1501和Duke MTMC-re ID数据集上进行了实验,并实现了性能提升。这验证了该方法的有效性。针对图像到视频的行人重识别,提出了一种基于分组卷积的注意力机制孪生网络行人重识别方法。用于解决图像到视频的行人重识别任务中提取到的图像特征不够具有鉴别性,以及重识别率低等问题。该方法使用Res Net50作为孪生网络的骨干网络,孪生网络中的两个网络分别对应的是图像特征网络和视频特征网络。分别利用图像特征网络和视频特征网络来提取行人图像特征和视频片段的行人特征。并用分组卷积替代原Res Net50中的卷积层,在视频特征网络中使用非局部注意力模块对行人视频中的时间关系进行建模。然后,使用时间信息传播方法,将视频特征网络中的时间信息传播到图像特征网络中。最后,使用分类损失和三元组损失学习具有判别性的特征。本文在MARS和Duke MTMC-videoreid数据集上进行了实验,并实现了性能提升。这验证了该方法的有效性。
基于机器视觉的化工厂区人员安全监测应用技术研究
这是一篇关于化工厂区,机器视觉,行人重识别,危险区域入侵,动态表达的论文, 主要内容为化工厂区涉及大量的危险化学品,人员安全问题备受关注。传统的人工巡查和监控存在限制,而视频监控和机器视觉技术可以更有效地监测人员活动和安全隐患,最大程度地保障人员生命安全和财产安全。行人的身份识别和危险区域入侵是机器视觉的关键技术。视频监控可用于行人身份识别,确定其位置并检测其是否在安全区域。但标注数据成本高,且危险区域入侵技术存在延迟和依赖人员经验等问题。本文旨在针对化工厂区这种应用场景,对这两个技术进行理论和实验研究,并设计实现一个基于机器视觉的安全监测系统,主要工作具体如下:(1)化工厂区人员的身份识别:针对行人重识别数据标签标记人力成本问题,本文提出一种面向行人重识别的自适应弱监督标签标记方法,该方法设计了一种局部和全局特征自适应双分支网络,实现多摄像头下的身份关联标签自动增量更新,有效的降低了数据标记的成本;(2)化工厂区人员危险区域入侵:针对在化工厂区中不同区域的安全风险程度存在差异,同一区域的风险等级也可能随时间变化,本文提出了基于场景动态表达的人员危险区域入侵方法,该方法将行人轨迹的推理结果作为危险区域动态表达模块的输入,结合当前区域的人数、区域个性化规定、预计进入该区域的人数、人员工种等级等因素,动态预测该人员的危险指数,以达到危险区域入侵预计的目的;(3)化工厂区人员安全监测系统。基于上述研究内容,采用Python语言、Flask框架开发,设计并开发了一套化工厂区人员安全监测系统。该系统可直观展示化工厂区中人员的身份和位置,并对其可能存在危险区域入侵的行为进行预警。本文结合机器视觉、行人重识别等相关技术,提出了针对化工厂区人员安全监测的方法和模型,完成了从厂区人员身份识别、人员危险区域入侵预警到应用系统开发的全流程工作,所提出的技术和方法对保障化工厂区人员和财产安全具有一定的应用价值。
单模态和跨模态行人重识别的算法研究
这是一篇关于行人重识别,深度学习,局部与全局特征,轻量级行人重识别网络,跨模态行人重识别网络的论文, 主要内容为行人重识别任务旨在确定由不同相机拍摄的行人是否属于同一个行人。它通常被视为一个图像检索问题,一般被用于跨摄像机行人跟踪与监视。它涉及到计算机视觉,模式识别和深度学习等多个领域,是一个极具挑战性的任务。目前,大多数的行人重识别方法集中于学习有辨识度的和鲁棒的特征,然而在现实世界的场景中,可能存在相似着装、光照强度、姿态、视角变化以及遮挡等因素的干扰,这些干扰因素的存在大大的增加了行人重识别任务的难度,如何驱动模型消除干扰信息对识别任务的影响,挖掘潜在性图像特征成为了单模态行人重识别任务的研究难点。此外目前的大部分方法是采用大型骨干网络进行特征提取。然而,这些大型骨干网络参数量巨大,运算缓慢,在嵌入小型摄像装置时会产生诸多问题,所以构造低参数量,低复杂度的轻量级模型是非常有必要的。单模态行人重识别任务在近年来取得极大的进展,并且取得了较高的性能。然而,单模态的行人重识别模型部署在现实场景中时会存在很多问题,例如大量犯罪或相关事件通常在夜间或黑暗场景中进行,这是无法被普通摄像机拍摄到的,但是这类的事件可以被先进的红外摄像机所捕捉。因此,从可见光摄像头和红外摄像头捕获的行人图像中检索彼此成为一个重要研究方向,而如何有效消除可见光和红外光之间的模态差异成为了跨模态行人重识别任务的关键。针对以上问题,主要研究内容如下:(1).针对目前的一些基于全局和局部特征的方法以及基于注意力的方法存在忽略行人潜在特征的局限性,提出了一种提取行人潜在性特征从而提升模型性能的方法。使用多分支注意力模块来提取行人图像的更细粒度的局部特征。此外,为了增强模型的特征挖掘能力,本文分别在主干网络的不同阶段使用了几个非局部模块。为了防止模型过多的关注显著性区域而忽略潜在信息,利用新的显著性筛选和抑制操作来有效地驱动模型提取潜在的和多样的行人信息。此外还开发了一个新的多阶段全局特征融合模块,以融合不同阶段的显著特征并增加特征的多样性。实验结果表明本文的改进能够在baseline的基础上极大提升模型性能。(2).针对目前的大多数方法使用的都是大型主干模型进行特征提取。然而,这些大型主干模型往往包含大量参数,但是嵌入式设备的计算资源有限,实时运算速度有限。为了克服这个问题,提出了一种新的行人重识别的轻量级模型SCL-net,并对模型的所有底层模块进行了重构,提出了一种新的卷积单元,通过低成本线性变换和通道打乱操作构造维度更加丰富的特征映射。此外还重新设计了通道注意力和空间注意力模块,使它们更加轻量化并且适应于Re-ID任务。实验结果表明本文提出的轻量级模型相对于主流的轻量级网络(如Mobilenet)更加适用于行人重识别任务。(3).针对现有的一些单模态行人重识别任务已经无法满足昼夜变化的行人检索任务,其中一些基于表征学习的跨模态行人重识别方法无法有效消除可见光图像和红外图像间的模态差异和基于生成对抗网络方法需要设计一系列高硬件成本和高时间成本的生成和鉴别模块的问题,本文设计了一个基于深度网络特征的风格损失函数,用于消除可见光图像和红外图像的模态差异,同时设计了一个基于浅层网络特征的内容损失函数,用于驱动模型的不同分支学习可见光图像和红外图像的相似的语义信息。从实验结果来看,本文的模型在Reg DB数据集的可见光图像查询红外图像的设置下实现了SOTA的性能。图 [34] 表 [23] 参 [146]
基于深度学习的行人重识别技术研究
这是一篇关于行人重识别,轻量网络,局部特征,全局特征,跨模态,注意力机制的论文, 主要内容为行人重识别(Person Re-identification,Person Re ID)作为计算机视觉领域中一个非常重要的研究方向,其主要目标是解决在跨摄像头和跨场景下行人的识别和检索问题,可以广泛应用于安防监控和刑事侦查等领域。本文利用深度学习技术,对行人重识别领域存在的难点展开研究,主要的工作如下:(1)针对目前轻量级行人重识别模型识别效果差的问题,本文提出了一种结合全局与局部特征的轻量级行人重识别方法。该方法以OSNet(Omni-scale Network)为基础,设计了CGLF-OSNet(OSNet that Combines Global and Local Features)网络,包含全局特征提取和局部特征提取:在全局特征提取时引入改进的PAN模块,能够更好地融合不同层次的特征;在局部特征提取时使用滑动窗口思想对特征图进行阶梯分块,使模型在学习局部区域的细粒度特征时还能保留区域之间的关联信息。同时,通过交叉熵损失(Cross Entropy)和难样本挖掘的三元组损失(Triplet Loss with Batch Hard Mining)共同指导模型训练,可以更好地挖掘行人图像之间的细粒度差异信息。实验结果表明,本文提出的方法可以在参数量远少于常规网络的同时保持较高的识别准确率。(2)针对当前跨模态行人重识别模型性能普遍较差的问题,本文提出一种基于三重注意力机制(Triple Attention Mechanism,TAM)的跨模态行人重识别方法,该方法以Res Net50为骨干网络,设计了TAM-Net网络。TAM-Net采用双流网络结构,以更好地提取不同模态的特征,并利用网络参数共享的方式,将多模态特征映射到公共特征空间。此外,通过设计三重注意力模块来加强特征学习,可以使模型在训练过程中更关注目标的显著性特征。最后采用交叉熵损失、加权正则化三元组损失(Weighted Regularization Triplet Loss)和异质中心损失(Hetero-center Loss)共同指导模型的训练,使模型能够更好地学习不同模态间的共享特征。实验结果表明,本文方法在跨模态行人重识别任务中具有更高的识别准确率。(3)主流行人重识别方法只能处理分割好的行人图像,无法实现对监控视频的检索,基于此,本文在第三章和第四章提出的行人重识别方法基础上设计并实现了一个面向视频监控场景的行人重识别系统。由于监控场景下采集的视频数据包含较多的背景干扰信息,无法直接输入到行人重识别模型中,本文将目标检测算法与行人重识别算法结合,采用实时目标检测网络YOLOv7对视频中出现的行人进行检测,并将检测到的行人信息输入到行人重识别模型中,从而实现对视频中目标行人的检索。
基于注意力机制和特征互补的行人重识别方法研究
这是一篇关于深度学习,行人重识别,注意力机制,显著特征,局部分支的论文, 主要内容为随着社会经济和科技的快速发展,人们越来越关注稳定的社会公共治安环境,基于计算机视觉的智能视频监控技术被广泛运用在各个安防领域。行人重识别是一种能够在跨摄像头下识别相同身份行人的技术,即给定待查询行人图像,可以从行人图像库中检索出该名人员在视角不重叠的多个摄像头下拍摄的图像。然而在实际场景中,拍摄环境不同、行人姿态变化以及行人外观相似等因素会影响行人重识别模型的性能,如何减小这些因素的干扰,让模型学习到类内行人的不变性特征和类间行人的判别性特征,是行人重识别任务亟待解决的问题。本文的主要研究工作如下:(1)为了提升行人重识别数据集的多样性,减小拍摄环境以及行人姿态变化对特征提取的影响,本文提出了一种基于自动数据增强和线性共享注意力的行人重识别模型AALSA-Net。首先,本文利用生成对抗网络架构为行人重识别数据集搜索合适的数据增强策略。然后,使用实例标准化和批量标准化颈部优化行人重识别骨干网络,进一步设计了通道注意力模块和线性共享注意力模块,并将其嵌入到网络的各个卷积阶段中。通道注意力模块利用两种不同的池化方式提取对行人前景响应较高的特征通道,线性共享注意力模块不仅加强了单张图像内部的显著区域,还引入了共享的外部先验知识用于捕捉样本之间的联系,使得相同身份的行人拥有相似的特征表示,提升模型的鲁棒性。(2)为了提取行人潜在的并且具有判别力的细节信息,本文提出了一种基于多粒度显著性特征互补的行人重识别模型MGSC-Net。该模型包含骨干网络、全局特征提取分支和局部特征提取分支。骨干网络的各个卷积阶段在注意力模块的基础之上嵌入了次级显著性特征挖掘模块,以捕捉除了容易被忽略的潜在特征。全局特征提取分支利用特征融合模块将各级显著性特征进行整合,局部特征提取分支将行人特征划分为多个区域进行特征编码。通过两个分支多粒度地提取特征,形成具有丰富语义信息和判别力的行人特征。(3)本文在两个公开数据集Market1501和Duke MTMC-Re ID上进行实验,实验结果表明本文提出的方法可以有效提取行人具有鲁棒性和分辨性的特征,提升行人检索的准确性。
基于分组卷积的无监督注意机制行人重识别方法研究
这是一篇关于行人重识别,分组卷积,注意力机制,无监督学习,孪生网络的论文, 主要内容为监控系统在现代社会中得到了广泛的应用,对于打击犯罪、追踪嫌疑人、寻找失踪人员等有重要作用。行人重识别是监控系统的关键技术之一,它能够在不同摄像头视角下识别同一行人,因此受到了众多专家学者们的广泛关注。然而,大多数行人重识别方法都是基于有监督学习的,需要大量的标注数据集来训练模型。这种标注数据集不仅耗费人力物力,而且成本高昂,限制了模型在实际场景中的应用。为此,本文提出了一种基于分组卷积的无监督注意机制行人重识别方法。该方法利用聚类算法自动给图像分配伪标签,并使用分组卷积提取图像特征和增强准确性。同时,考虑到实际场景中更常见的是使用单张图像检索视频库中的目标行人,因此本文还设计了一个基于分组卷积的注意力机制孪生网络来实现图像到视频的行人重识别,并同样采用分组卷积提高重识别效果。本文主要研究内容如下:针对图像到图像的行人重识别,提出了一种基于分组卷积的无监督注意力机制行人重识别方法,用于解决行人重识别中需要带有标签的数据集,以及无法进行完全无监督等问题。该方法使用Res Net50作为骨干网络,并用分组卷积替代原有的卷积层。同时,在Res Net50中通过应用CBAM注意力机制来提取行人特征。最后,通过实例判别损失和层次聚类损失来优化网络模型,使网络模型能够在没有任何监督信息的情况下进行行人重识别任务。本文在Market-1501和Duke MTMC-re ID数据集上进行了实验,并实现了性能提升。这验证了该方法的有效性。针对图像到视频的行人重识别,提出了一种基于分组卷积的注意力机制孪生网络行人重识别方法。用于解决图像到视频的行人重识别任务中提取到的图像特征不够具有鉴别性,以及重识别率低等问题。该方法使用Res Net50作为孪生网络的骨干网络,孪生网络中的两个网络分别对应的是图像特征网络和视频特征网络。分别利用图像特征网络和视频特征网络来提取行人图像特征和视频片段的行人特征。并用分组卷积替代原Res Net50中的卷积层,在视频特征网络中使用非局部注意力模块对行人视频中的时间关系进行建模。然后,使用时间信息传播方法,将视频特征网络中的时间信息传播到图像特征网络中。最后,使用分类损失和三元组损失学习具有判别性的特征。本文在MARS和Duke MTMC-videoreid数据集上进行了实验,并实现了性能提升。这验证了该方法的有效性。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设工坊 ,原文地址:https://m.bishedaima.com/lunwen/47870.html