基于轻量级网络的遮挡人脸检测与识别算法研究
这是一篇关于轻量级网络,遮挡人脸检测,特征增强,遮挡人脸识别,特征解耦的论文, 主要内容为身处大数据时代,人工智能技术为我们生活带来诸多便捷,身份认证便是其中之一。人脸检测与识别作为身份认证最重要的支撑技术,一直以来都备受关注。特别是近年来,深度学习的发展极大提升了人脸检测与识别的性能。在疫情的大背景下,出行佩戴口罩是自我保护的重要方式,口罩带来了人脸遮挡问题,而遮挡带来的人脸信息丢失以及遮挡物信息干扰给现有的人脸检测与识别算法带来极大挑战。如何弥补因遮挡而丢失的特征信息以及如何剔除因遮挡所带来的干扰信息,从而提升遮挡人脸检测与识别的性能是本文的研究重点。针对遮挡人脸检测问题,本文基于特征增强技术提出具有遮挡鲁棒性的人脸检测模型。该模型使用轻量级卷积神经网络Mobile Net-0.25作为主干网络提取图像特征,提升模型的推理速度。对于遮挡所带来的信息丢失,提出一种全局与局部特征融合模块,利用特征金字塔网络自上而下的连接方式,将全局特征融入到每个特征元素中,为遮挡人脸提供更多额外信息。同时,还提出一种特征图增强方法,在原有三个学习任务分支的基础上,增加一个弱监督区域分割分支,通过在人脸的遮挡区域与非遮挡区域设置一样的监督信息,强化人脸遮挡区域的特征,从而进一步弥补因遮挡而丢失的特征信息。使用遮挡人脸检测数据集MAFA和通用人脸检测数据集Wider Face进行实验,在MAFA数据集上的AP值达到90.8%,比基线模型提升2.1%,验证了本文所提方法对遮挡人脸检测的有效性。针对遮挡人脸识别问题,本文提出一种三元组特征解耦网络用于遮挡人脸身份验证。对于遮挡带来的干扰信息,提出的特征解耦网络通过解耦权值向量对轻量级特征提取网络Mobile Face Net提取的人脸特征进行分解,去除遮挡相关信息的同时获取更具有区分性的人脸特征信息。在此基础上,进一步提出三元组相似度间隔损失函数,通过拉大同类人脸相似度与异类人脸相似度之差,从而达到减小类内差异增大类间差异的效果。使用mask-CASIA-Web Face作为训练集,mask-LFW和mask-Age DB30作为测试集进行实验,在mask-LFW和mask-Age DB30数据集上分别达到98.78%、89.55%的准确率,比基线方法分别提升了0.33%、0.63%,进一步证明了本文所提方法对遮挡人脸识别的有效性。
基于MST-DeepLabv3+模型的高分辨率遥感影像耕地提取研究
这是一篇关于高分辨率遥感影像,语义分割,轻量级网络,注意力机制,迁移学习的论文, 主要内容为耕地与经济和民生息息相关,是不可或缺的重要资源。然而,在我国城市化和工业化的快速发展中,耕地资源正逐步被占用,威胁到“耕地红线”政策的目标。因此,快速且准确的对耕地信息进行提取对保证农业可持续发展和国家粮食安全有着十分重要的意义。遥感影像能够提供地表物体的丰富信息,遥感影像分类是耕地信息提取的重要手段。随着遥感影像质量的不断提升,高分辨率遥感影像带来了丰富的地物信息,但对其高精度、高效率的分类提取也是一个极大的挑战。深度学习中的语义分割算法凭借着较高的分类精度,以及较强的自动学习能力,逐渐成为处理高分辨率遥感影像的重要手段之一。本文将深度学习语义分割模型应用于高分辨率遥感影像耕地信息提取,探索适用于耕地提取的高精度、高效率方法。经典语义分割模型通常具有大量的训练参数,进行影像分割时存在分割不准确和效率低的问题,且大多数耕地提取的方法只适用于某些特定的数据集或者特定的研究区,模型的泛化能力较差。针对这些问题,本文的主要研究工作和结论如下:(1)对DeepLabv3+模型改进,得到MST-DeepLabv3+模型。使用轻量级网络Mobile Net V2替代DeepLabv3+模型的特征提取网络Xception,以减少模型参数量,提高训练速度;对比不同的注意力机制模块,选取通道注意力机制SENet加入模型,弥补轻量级网络带来的精度损失,提高遥感影像语义分割的精度;引入迁移学习,将Image Net数据集上训练的特征提取网络用做预训练模型,增强模型获取特征的能力,提升网络分割精度。在ISPRS Vaihingen数据集与GID数据集上进行多模型对比实验的结果显示,MST-DeepLabv3+模型具有优秀的分割性能,能够有效解决经典模型分割结果中存在的不同程度误分、漏分及过度分割问题,改善地物边界及轮廓分割不准确的现象,为后续耕地信息提取提供帮助。此外,消融实验也说明了改进方法对模型的影响。(2)耕地信息提取研究。以周口市太康县作为研究区,使用高分一号遥感卫星的PMS影像制作太康耕地数据集。为进一步探索适用于耕地提取的方法,在MST-DeepLabv3+模型的基础上,提出改变迁移模型的MST-DeepLabv3+(GID)与改变影像波段组合的MST-DeepLabv3+(Nir RG)两种方法。将这两种方法与MST-DeepLabv3+、PSPNet、UNet和DeepLabv3+模型应用于太康耕地数据集。实验结果表明,本文提出的MST-DeepLabv3+(GID)、MST-DeepLabv3+(Nir RG)与MST-DeepLabv3+三种方法的各项评价指标值均高于PSPNet、UNet和DeepLabv3+模型,可以很好的完成耕地区域完整分割,具有平滑分割边界,消除粘连现象的能力,能够高效且高精度的实现耕地信息提取。其中MST-DeepLabv3+模型精度最高,整体效果更好。实验证实了本文提出的三种模型均能有效的提取耕地信息,能够为今后的高分辨率遥感影像耕地信息提取提供参考。其中MST-DeepLabv3+模型不仅在耕地提取任务中具有最佳的分割性能,在其他数据集上也能得到较好的分割结果,泛化能力强。
多示例注意力网络的遥感场景分类
这是一篇关于遥感场景分类,多示例学习,卷积神经网络,注意力模块,轻量级网络的论文, 主要内容为相较于自然场景图像,遥感场景图像受高空拍摄影响,造成图像的关键目标较小,图像存在物体形变较大、组成对象较多和背景信息复杂。现有的卷积神经网络受感受野的限制,提取特征具有局限性,造成特征之间的割裂,变换器网络的整图学习对局部语义的理解不足。而且将这些方法应用于遥感场景分类都需要借助在Image Net的预训练,使得遥感场景图像分类的研究依赖大模型,而仅用遥感场景数据集的分类任务存在极大的挑战。本文将基于注意力的多示例学习框架引入,从全局图像与局部图像两方面研究基于注意力多示例的轻量级网络用于遥感场景分类。(1)针对组成对象较多和背景信息复杂问题,提出示例级与场景级信息融合的多示例网络,采用没有预训练的方案探索,该方法由密集连接变换器模块和示例位置感知模块构建,密集连接变换器模块由卷积和自注意力结合,学习全局与局部的关系;示例位置感知模块学习关键示例的潜在位置,通过联合两部分的分类损失获取富于判别的分类模型。(2)针对对象形变较大问题,提出混合注意力的多示例学习网络;利用轻量级网络提取特征,再将特征采用基于混合注意力的多示例池化方法增强构造一个端到端的神经网络;通过结合两部分,构造全局分类损失获取富于判别的分类模型。本文研究在三个公开遥感数据集UCM、AID和NWPU-RESISC上进行了验证,与其他研究相比,本文的研究方法提高了遥感场景分类性能,同时压缩了网络模型参数量以及计算量。本文研究方法在自然场景CIFAR-10与ImageNet2012也做了部分实验,取得较好的结果。
基于注意力机制和特征融合的服装图像检索研究
这是一篇关于深度学习,服装图像检索,特征融合,轻量级网络的论文, 主要内容为随着互联网的快速发展,在线购物已经成为了一种普遍的购物方式,用户可以在购物平台上挑选自己心仪的服装。但是因为服装种类多样且分类标准不同,消费者和商家对服装的文字描述通常不一致,消费者很难快速、准确地找到自己需要的服装信息,这极大的影响了消费者的购物体验。使用基于图像的服装检索技术不仅能够消除消费者和商家对服装的认知偏差,还能大大降低商户的时间成本,也可以为消费者提供更加方便舒适的在线购物环境。在此背景下,本文对服装图像检索进行研究,主要工作如下:202(1)针对网络模型过于复杂,且对设备要求较高的2问题,本文在轻量级网络Mobile Net V2的基础上,提出了融合浅层特征、中层特征和深层特征的MF-Mobile Net网络模型。针对单个特征不能充分表达服装图像信息的问题,本文提出融合SPoC算法、Ge M算法和RMAC算法提取的服装特征。首先使用MF-Mobile Net网络对服装图像进行特征提取;其次分别使用SPoC算法、Ge M算法和RMAC算法对特征进行池化处理;然后使用全连接层对特征进行维度变换和L2范数对特征进行归一化;最后将归一化后的特征融合后用于服装图像检索。在Deep Fashion的In-shop数据集和Consumer-to-shop数据集进行实验验证,在Top-5时,准确率分别达到95.32%和32.46%。(2)针对用户的自拍图片与商家的同款服装图片因光照、背景、和形变因素的影响而相差大的问题,提出了基于注意力机制的SE-Rep VGG网络模型,并使用SPoC算法对特征进行处理。首先使用SE-Rep VGG网络模型提取服装图像特征;其次使用SPoC算法对特征进行处理后得到基于注意力感知的SPoC特征;然后使用全连接层和L2范数对特征进行维度变换和归一化;最后使用归一化的特征进行服装图像检索。经过Deep Fashion的In-shop数据集和Consumer-to-shop数据集的验证,在Top-5时,准确率分别达到95.94%和42.36%。(3)出于以上两种服装图像检索算法,设计并实现了服装图像检索系统软件。系统软件使用B/S三层架构进行开发,使用My SQL数据库保存信息,使用Html框架编写前端网页,使用Flask框架编写后端应用,最后实现用户管理模块和服装图像检索模块。
基于注意力机制和特征融合的服装图像检索研究
这是一篇关于深度学习,服装图像检索,特征融合,轻量级网络的论文, 主要内容为随着互联网的快速发展,在线购物已经成为了一种普遍的购物方式,用户可以在购物平台上挑选自己心仪的服装。但是因为服装种类多样且分类标准不同,消费者和商家对服装的文字描述通常不一致,消费者很难快速、准确地找到自己需要的服装信息,这极大的影响了消费者的购物体验。使用基于图像的服装检索技术不仅能够消除消费者和商家对服装的认知偏差,还能大大降低商户的时间成本,也可以为消费者提供更加方便舒适的在线购物环境。在此背景下,本文对服装图像检索进行研究,主要工作如下:202(1)针对网络模型过于复杂,且对设备要求较高的2问题,本文在轻量级网络Mobile Net V2的基础上,提出了融合浅层特征、中层特征和深层特征的MF-Mobile Net网络模型。针对单个特征不能充分表达服装图像信息的问题,本文提出融合SPoC算法、Ge M算法和RMAC算法提取的服装特征。首先使用MF-Mobile Net网络对服装图像进行特征提取;其次分别使用SPoC算法、Ge M算法和RMAC算法对特征进行池化处理;然后使用全连接层对特征进行维度变换和L2范数对特征进行归一化;最后将归一化后的特征融合后用于服装图像检索。在Deep Fashion的In-shop数据集和Consumer-to-shop数据集进行实验验证,在Top-5时,准确率分别达到95.32%和32.46%。(2)针对用户的自拍图片与商家的同款服装图片因光照、背景、和形变因素的影响而相差大的问题,提出了基于注意力机制的SE-Rep VGG网络模型,并使用SPoC算法对特征进行处理。首先使用SE-Rep VGG网络模型提取服装图像特征;其次使用SPoC算法对特征进行处理后得到基于注意力感知的SPoC特征;然后使用全连接层和L2范数对特征进行维度变换和归一化;最后使用归一化的特征进行服装图像检索。经过Deep Fashion的In-shop数据集和Consumer-to-shop数据集的验证,在Top-5时,准确率分别达到95.94%和42.36%。(3)出于以上两种服装图像检索算法,设计并实现了服装图像检索系统软件。系统软件使用B/S三层架构进行开发,使用My SQL数据库保存信息,使用Html框架编写前端网页,使用Flask框架编写后端应用,最后实现用户管理模块和服装图像检索模块。
基于轻量级网络的遮挡人脸检测与识别算法研究
这是一篇关于轻量级网络,遮挡人脸检测,特征增强,遮挡人脸识别,特征解耦的论文, 主要内容为身处大数据时代,人工智能技术为我们生活带来诸多便捷,身份认证便是其中之一。人脸检测与识别作为身份认证最重要的支撑技术,一直以来都备受关注。特别是近年来,深度学习的发展极大提升了人脸检测与识别的性能。在疫情的大背景下,出行佩戴口罩是自我保护的重要方式,口罩带来了人脸遮挡问题,而遮挡带来的人脸信息丢失以及遮挡物信息干扰给现有的人脸检测与识别算法带来极大挑战。如何弥补因遮挡而丢失的特征信息以及如何剔除因遮挡所带来的干扰信息,从而提升遮挡人脸检测与识别的性能是本文的研究重点。针对遮挡人脸检测问题,本文基于特征增强技术提出具有遮挡鲁棒性的人脸检测模型。该模型使用轻量级卷积神经网络Mobile Net-0.25作为主干网络提取图像特征,提升模型的推理速度。对于遮挡所带来的信息丢失,提出一种全局与局部特征融合模块,利用特征金字塔网络自上而下的连接方式,将全局特征融入到每个特征元素中,为遮挡人脸提供更多额外信息。同时,还提出一种特征图增强方法,在原有三个学习任务分支的基础上,增加一个弱监督区域分割分支,通过在人脸的遮挡区域与非遮挡区域设置一样的监督信息,强化人脸遮挡区域的特征,从而进一步弥补因遮挡而丢失的特征信息。使用遮挡人脸检测数据集MAFA和通用人脸检测数据集Wider Face进行实验,在MAFA数据集上的AP值达到90.8%,比基线模型提升2.1%,验证了本文所提方法对遮挡人脸检测的有效性。针对遮挡人脸识别问题,本文提出一种三元组特征解耦网络用于遮挡人脸身份验证。对于遮挡带来的干扰信息,提出的特征解耦网络通过解耦权值向量对轻量级特征提取网络Mobile Face Net提取的人脸特征进行分解,去除遮挡相关信息的同时获取更具有区分性的人脸特征信息。在此基础上,进一步提出三元组相似度间隔损失函数,通过拉大同类人脸相似度与异类人脸相似度之差,从而达到减小类内差异增大类间差异的效果。使用mask-CASIA-Web Face作为训练集,mask-LFW和mask-Age DB30作为测试集进行实验,在mask-LFW和mask-Age DB30数据集上分别达到98.78%、89.55%的准确率,比基线方法分别提升了0.33%、0.63%,进一步证明了本文所提方法对遮挡人脸识别的有效性。
带钢焊缝杯凸试验视觉检测关键技术研究
这是一篇关于杯凸试验,焊缝定位,轻量级网络,迁移学习的论文, 主要内容为在带钢轧制过程中,通常将前卷带钢尾部与后卷带钢头部焊接起来,实现连续轧制加工,如果焊接质量不合格,将在轧制过程中引起焊缝开裂,甚至发生断带等恶性事故,造成重大财产损失,因此在进行下道工序之前,须对带钢焊接质量进行检测。目前工业上常用的方法是对焊缝做杯凸试验,一般靠人工操作,劳动强度大且效率低。本文提出了一种基于机器视觉的带钢焊缝杯凸试验自动检测系统,对其中的焊缝定位及杯凸试验效果检测两大关键技术进行了研究。首先,对卷积神经网络的卷积层和池化层进行了拓展研究,并探讨了基于锚框和基于无锚框的两种目标检测算法的工作原理。其中基于无锚框的目标检测算法为后文的焊缝定位研究提供了的设计思路,深度可分离卷积为后文的焊缝杯凸试验效果分类研究提供了轻量化的理论基础。其次,针对使用传统目标检测进行焊缝定位时无法获取角度信息的问题,参考Center Net算法,通过在原有网络的基础上增加旋转角度的回归实现了旋转目标检测,并根据网络的输入参数制作合适的数据集。此外,为了进一步提高模型的精度和鲁棒性,将下采样处的标准卷积结构替换为了可变形卷积,在上采样处引入了金字塔分割注意力模块。实验结果表明,使用可变形卷积能够使模型提高3.00%的召回率,单独引入金字塔分割注意力模块能够提高1.01%的准确率,两种模块同时使用,能够提高原模型3.02%的F值。通过稳定性实验证明了优化的网络具有更好的鲁棒性。然后,通过分析采集的焊缝杯凸效果图的特征信息,将样本按照开裂状态分为合格样本与不合格样本,并使用镜像、旋转、调整亮度和对比度、增加高斯和椒盐噪声的方法在一定程度上扩充数据集。针对扩充后数据集样本数量仍然过少的问题采用了基于迁移学习的训练思路,实验结果表明,仅重新训练轻量级网络的分类部分能够获得较高的精度,所有测试算法的准确率均达到了94%以上。通过Grad-CAM算法对训练好的模型中间层进行热力图可视化,验证了模型分类依据的真实性。最后,搭建一套视觉系统,对上述焊缝定位及杯凸试验结果算法进行了验证,完成了部分软件设计及调试,软件运行结果验证了检测算法的可行性。
基于椭圆候选框的目标检测器
这是一篇关于计算机视觉,目标检测,旋转椭圆框,损失函数,轻量级网络的论文, 主要内容为目标检测研究一直是计算机视觉领域的热点课题,其目的是定位并识别出图像中物体。近年来随着深度学习的兴起,涌现出许多基于卷积神经网络的目标检测算法。这些算法在人脸识别、车辆检测以及遥感图像检测方面均取得了成功的应用。但由于深度学习模型的检测效果严重依赖于训练数据集及其标注形式,而现有的目标检测数据集均是以矩形框进行标注,这也就意味着目标检测模型只能以矩形框来检测物体,而矩形框通常不能很好的包络姿态各异的物体,常常会额外引入背景信息进而造成模型定位不精确。为了克服这个问题,本文考虑到旋转椭圆框可以适应物体的不同姿态从而更好地包络物体,因此构造了具有旋转椭圆框标注的数据集,并设计了能够预测旋转椭圆框的目标检测模型。本文的主要研究内容和贡献如下:(1)提出了一种基于圆心的椭圆候选框检测网络Ellipse Net。现有目标检测算法分为两大类:基于锚框和摆脱锚框的算法。其中锚框主要是根据一些先验信息,使模型可以从锚框回归到真实框;摆脱锚框则是直接预测物体的位置信息。考虑到引入椭圆锚框会增加模型复杂度,因此根据摆脱锚框算法的基本思想,设计了一种能够直接输出椭圆圆心,长短轴长以及旋转角度的目标检测网络。另外,为了提高模型的检测精度,设计了一种高效的椭圆交并比损失函数。实验结果表明,由于没有引入复杂的锚框,因此该模型结构简单,且取得了和旋转矩形框目标检测算法相近的性能。(2)提出了一种基于稀疏可学习的旋转椭圆框目标检测算法RSparse RCNN。已有目标检测算法本质上属于密集检测算法,在预测阶段均需要非极大值抑制等复杂的后处理。为了克服上述问题,借鉴集合检测思想,预设了一组稀疏可学习的椭圆框来参与网络的训练,并学习预设椭圆框的偏移量。另外,由于两个椭圆框的交并比损失不可导,致使网络无法训练。于是采用高斯韦恩斯坦距离函数,其将旋转椭圆转成对应的二元高斯分布,并回归高斯分布之间的韦恩斯坦距离计算损失。在预测阶段直接通过网络输出来修正椭圆框的位置便可完成检测。在整个过程中,由于没有复杂的后处理步骤,因此该模型达到了精度和速度方面的权衡。(3)提出了一种轻量级的旋转椭圆框目标检测算法RCenter Net。现有深度学习模型由于计算复杂度高且内存占用大很难部署到边缘设备上。通过结合轻量的骨架网络以及摆脱锚框的思想,设计了一种能够直接预测椭圆框的轻量网络,在预测阶段不需要非极大值抑制等复杂的后处理。实验结果表明,RCenter Net的空间占有率大幅下降且达到了实时检测的需求。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设小屋 ,原文地址:https://m.bishedaima.com/lunwen/48651.html