7篇关于多尺度特征融合的计算机毕业论文

今天分享的是关于多尺度特征融合的7篇计算机毕业论文范文, 如果你的论文涉及到多尺度特征融合等主题,本文能够帮助到你 基于多尺度特征融合的高分辨率遥感图像建筑物分割 这是一篇关于遥感图像

今天分享的是关于多尺度特征融合的7篇计算机毕业论文范文, 如果你的论文涉及到多尺度特征融合等主题,本文能够帮助到你

基于多尺度特征融合的高分辨率遥感图像建筑物分割

这是一篇关于遥感图像,建筑物分割,深度神经网络,多尺度特征融合的论文, 主要内容为建筑物作为城市区域的重要特征,是占主体地位的地物目标,在遥感图像上,建筑物分割在重要目标的识别及定位、国防安全和掌握建筑物实时位置等方面都有着重要研究意义和应用价值。由于不同时相遥感图像受角度、光照、季节等因素的影响,以及建筑物周围背景,如道路、树木及其它地物阴影等干扰,使遥感图像建筑物的分割成为高分辨率遥感图像分割中最具挑战性的任务之一。图像语义分割的问题本质是对图像中像素标注为所在物体的类别。传统的图像分割的大部分算法是根据像素的相似程度进行聚类,或根据纹理或者区域间的色差进行划分,只能对与背景相差较大的物体完成分割。近年来在对遥感图像建筑物的分割中,利用深度学习的方法对图像语义分割取得较大进展,但在训练过程中存在梯度爆炸、梯度消失;受遥感图像中道路、桥梁和阴影等干扰因素影响较大;利用卷积运算提取图像特征时感受域较小且各层级上下文特征无关联导致分割精度难以提升等问题。因此,本文针对上述问题,基于深度学习理论,研究了基于多尺度特征融合的高分辨率遥感图像建筑物分割的方法,研究内容主要包括以下几个方面:(1)针对深度学习网络模型训练过程中因网络层数的加深会导致误差在反向传播时出现梯度消失和梯度爆炸等现象,以Res Net网络结构为基础模型,构建编码器-解码器结构提取建筑物特征信息,并通过批量规范化对数据进行规范化处理,使训练过程中模型收敛速度加快,实现遥感图像建筑物的精确分割。在WHU Building change detection dataset遥感图像数据集和Satellite dataset遥感图像数据集上的实验结果验证了构建模型的有效性。(2)针对Unet模型在遥感图像建筑物分割过程中模型收敛速度较慢,且受图像中树木、道路等因素干扰误分割现象较为明显的问题,提出一种UNet-Res Net的遥感图像建筑物分割模型,模型以Unet为基础模型,用深度残差网络Res Net的特征提取结构代替Unet左侧特征提取结构来增强模型的特征提取能力,再将Res Net中深度残差结构提取的各层特征信息进行融合实现遥感图像建筑物的精确分割,所提模型有效克服了树木、道路等干扰因素对建筑物分割带来的影响。在WHU Building change detection dataset遥感图像数据集和Satellite dataset遥感图像数据集上的实验结果验证了UNet-Res Net模型的有效性。(3)针对深度神经网络在提取特征时难以有效描述遥感图像细节特征,且存在因复杂场景下道路、树木及建筑物之间分割边界不清晰导致分割精度下降等问题。提出一种基于多尺度特征融合空洞卷积Res Net(MFDC-Res Net)遥感图像建筑物分割模型,利用空洞卷积增强提取特征的感受野,通过改进的空洞卷积中心点特征提取方法增强模型对遥感图像特征信息的描述能力,利用多尺度特征融合模块在多个层次的特征图上获取的更大范围的遥感图像建筑物上下文信息,有效克服了遥感图像中道路、树木、建筑物阴影、建筑物不规则及建筑物距离相隔较近等因素的干扰,提升了遥感图像中建筑物的分割精度。在WHU Building change detection dataset遥感图像数据集上验证了MFDC-Res Net模型的有效性。

基于迁移模型的人脸识别攻击技术研究与实现

这是一篇关于迁移攻击,人脸识别,PGD,多尺度特征融合的论文, 主要内容为随着人工智能的不断发展,人脸识别技术已成为公安、金融、零售等领域的重要应用,以卷积神经网络为代表的深度学习算法作为主流的人脸识别方法应用得最为广泛。然而,很多研究证明卷积神经网络存在一个致命缺陷——对抗攻击。对抗攻击通过在原始样本上添加不明显的非随机扰动来生成对抗样本,对抗样本可以欺骗模型并使模型输出错误的识别结果。这一攻击方法可能会对人脸识别系统的安全性和隐私保护造成威胁。在真实场景下,大多面对的是不可知被攻击人脸识别模型内部结构及参数的黑盒攻击,由于对抗样本具有迁移性,可以迁移到不同的模型上进行攻击,从而间接地完成黑盒攻击任务。因此,本文研究了基于迁移模型的人脸识别攻击技术,该研究不仅对大数据时代人脸图像隐私保护具有重要的意义,还可以为如何防御人脸识别任务中的恶意攻击以及提高人脸识别模型的鲁棒性提供一些重要的启发。针对黑盒环境下的攻击,本文提出了基于自适应攻击步长的PGD迁移攻击算法(AM-PGD)和基于多尺度特征融合的AdvGAN对抗样本生成方法(MultiAdvGAN)。首先选取和优化了满足本研究需求的人脸图像数据库,训练了Cos Face、Arc Face和Mobile Face Net三个人脸识别模型作为攻击对象;其次,使用基于自适应攻击步长的PGD迁移攻击算法对这些模型进行了迁移攻击,并对攻击结果进行对比和分析,研究攻击算法的有效性和泛化性;接着,使用基于多尺度特征融合的AdvGAN对抗样本生成方法继续进行迁移攻击,记录和分析实验结果,研究生成对抗样本的仿真性和攻击效果;最后,设计并开发了一个人脸图像的对抗样本生成系统,将以上两种攻击方法生成的对抗样本保存并进行可视化输出。具体研究工作包括:(1)选取CASIA-Web Face和LFW人脸图像数据库,对这些数据进行优化处理。并且训练了Cos Face、Arc Face和Mobile Face Net三个人脸识别模型,训练实验结果表明经过相对大规模数据训练之后的人脸识别模型均取得较好的识别效果。(2)提出基于自适应攻击步长的PGD迁移攻击方法,该算法在反向传播计算梯度时动态调整攻击步长,引入梯度的一阶和二阶矩估计,从而有效地克服了梯度更新过程中的震荡和不稳定性,并增加校正偏执,以此来帮助模型更快更好地收敛到全局最优解。由于现实环境中攻击目标通常是黑盒模型,攻击者很难获得关键参数和网络结构等信息。因此,本文借鉴黑盒迁移攻击的算法思想,并利用本文提出的AM-PGD攻击方法攻击替代模型生成对抗样本,再使用这些对抗样本来攻击迁移模型,从而完成黑盒攻击的任务。分别将Cos Face、Arcface和Mobile Face Net模型中的一个设置为替代模型,另外两个为迁移模型,进行三组迁移攻击实验,实验结果表明本文提出算法在迁移攻击实验中攻击效果有所提升。(3)提出基于多尺度特征融合的AdvGAN对抗样本生成方法,该算法在生成对抗网络的生成器之前加入特征提取器,将提取到的多尺度特征进行特征融合,使用生成器和判别器进行双网络的训练,并通过多轮迭代得到仿真性更强且迁移性提高的对抗样本。在本研究中将Mobile Face Net模型作为替代模型,将攻击替代模型得到的对抗样本依次转移到Cos Face和Arcface模型上,并进行迁移攻击实验,结果显示,与传统的AdvGAN算法相比,该算法生成的对抗样本具有更强的隐蔽性,同时也得到了更强的迁移攻击效果。(4)设计并开发一个人脸图像的对抗样本生成系统,该系统实现人脸图像的上传、人脸图像的识别、攻击算法的选择、扰动系数的修改以及对抗样本的输出等功能。

基于注意力机制和特征融合的细粒度图像分类方法研究

这是一篇关于细粒度图像分类,注意力机制,通道交互,多尺度特征融合的论文, 主要内容为细粒度图像分类是将传统的图像分类进一步细分到子类别,即在区分出超类别对象的基础上,实现对子类别的有效划分。细粒度图像分类技术能够让计算机以“专家级”的程度识别和区分目标对象,在生物多样性自动监测、智能农业等多个专业应用领域中具有较高的研究价值。与传统的图像分类任务不同,细粒度图像分类中具有类内相似度低,类间相似度高的特点。在细粒度图像中,同一类别内的图像从不同角度来看具有较低的相似性,需要识别局部共同区域;来自不同类别但视角相同的图像具有很高的相似性,需要识别局部差异区域。本文通过探索类内图像的共性和类间图像的差异来提高分类性能。本文主要的研究工作如下:(1)提出了通道交互注意力模型(Channel Interaction Attention Networks,CIA-Net)用于挖掘类内图像共同的关键性区域。针对现有的大部分模型以单个图像作为输入,通过学习细粒度特征获得辨别性区域特征信息,但其忽略了同一子类别中其他图像可以提供补充信息帮助模型进行分类。因此,CIA-Net将同一类别的图像对作为输入,提出通道交互结构提取图像对之间的通道相关性,使模型学习到两个图像间相同的辨别性区域。然后设计了注意力增强和抑制模块,其中注意力增强用于加强交互特征信息的分类能力;而注意力抑制则用于消除共同辨别性区域获得抑制图像。最后将抑制图像重新输入模型进行训练,引导模型提取共同区域外的上下文信息。在四个数据集上进行实验,实验结果表明CIA-Net可以有效挖掘类内图像的共性,提高细粒度图像分类的准确率。(2)提出了多注意力金字塔网络(Multiple Attention Pyramid Networks,MAP-Net)用于挖掘类间图像相似区域的差异性。目前大多数算法仍侧重于从高层特征提取信息,没有考虑低层细节特征,导致模型定位到的局部区域通常具有同一语义,缺乏细节差异性从而影响模型分类性能。为解决这一限制,MAP-Net提出双向特征路径模块,用于加强低层特征的细节信息与高层特征的语义信息的双向联合。然后在自上而下的特征路径后引入混合注意力机制,生成注意力特征金字塔,捕捉每个尺度上的重要特征。最后模型通过融合多层次注意力特征进行分类预测。实验表明,MAP-Net是一种性能良好的细粒度图像分类算法。

改进的深度残差网络及其在带钢表面缺陷识别中的应用

这是一篇关于带钢表面缺陷,图像识别,深度残差网络,多尺度特征融合,注意力机制的论文, 主要内容为冷轧带钢是现代钢铁工业中的重要产品,在汽车制造、家电制造、集装箱制作、轻工等众多行业中都有较多的应用。带钢在生产过程中出现的表面缺陷是影响产品质量的一个重要因素,会给钢铁企业和产品用户带来极大的经济损失。传统的缺陷检测方法存在准确率不高、效率低、成本高等缺点,难以满足钢铁企业的需求。近年来,深度学习在机器视觉方面展现出巨大的优势,但深度学习算法在带钢在线检测中存在缺陷图像数据空间冗余、缺陷特征不明显、缺陷尺寸跨度大等问题,不能完全满足工业现场的需求。针对上述问题,本文以深度残差网络(Deep Residual Networks,Res Net)为基础,开展针对空间冗余问题和多尺度特征融合的带钢表面缺陷图像识别方法研究,具体工作内容如下:针对高分辨率带钢缺陷图像存在空间冗余问题,提出一种基于可学习的图像调整器(Learnable Image Resizer,LIR)和扫视-聚焦网络(Glance and Focus Network,GFNet)的带钢表面缺陷快速分类方法。首先,基于动态神经网络(Dynamic Neural Networks,DNN)的特点,本文提出GFNet驱动的带钢表面缺陷分类模型,其可以根据不同样本自适应处理与任务相关区域,在模型推理阶段显著减少计算量,便于模型的部署。然后,采用LIR和分类模型GFNet联合训练的方法,调整图像大小的同时实现针对识别模型的特征增强,所增强的图像特征可以提高分类模型的精度。最后,将Res Net-50作为所提方法的主干网络,在自制数据集CR-CLS上验证方法的有效性。结果表明,与原始Res Net-50比较,所提方法可以在不牺牲精度的情况下,将单张图像的推断时间减少约3.58倍,模型计算量降低约6.11倍。同时,在公开数据集XLData-CLS的实验结果也证明了该方法的有效性。针对带钢表面缺陷缺陷尺寸跨度大、缺陷特征不明显导致的缺陷识别率低的问题,提出一种基于SEPy Res Net(SENet-Py Conv-Res Net)的带钢表面缺陷高精度识别模型。首先,构建一个新的卷积模块SEPy Conv,其采用金字塔卷积(Pyramidal Convolution,Py Conv)代替标准卷积,获取多尺度融合的缺陷特征,再利用SENet为获取的特征通道分配权重,进一步提高卷积对带钢缺陷的特征提取能力。然后,将构建的SEPy Conv引入Res Net中,替代残差网络中的3×3卷积,构建一个改进的Res Net-50,命名为SEPy Res Net-50。最后,在自制数据集CR-CLS上验证所提方法的有效性。结果表明,所提出模型SEPy Res Net-50与原始的Res Net50相比,在模型计算量和参数量分别降低0.54G、1.06M的前提下,识别准确率提高了7.66%。在另一个公开数据集X-SDD上,本方法同样可以将识别准确率提高0.48%,达到99.51%。

基于深度学习的地下排水管道裂缝分类方法研究

这是一篇关于管道缺陷,卷积神经网络,多尺度特征融合,注意力机制,知识蒸馏的论文, 主要内容为管道作为常用气体和液体的传输载体,已被广泛应用于排污领域。管道需要定期进行检查与维护,否则会产生严重的管道缺陷,从而危及公众安全并需要昂贵的修复成本。在工程应用中,虽然管道数据可以通过CCTV或SSET等自动化技术获取,但是缺陷诊断仍然是依靠人工操作完成的。人工判断不仅具有主观性而且容易产生操作错误。因此,本文开展了基于深度学习的地下排水管道裂缝分类方法的研究,研究内容具体如下:(1)构建地下管道裂缝数据集。下水道状况评估准则PACP(Pipeline Assessment Certification Program)需要对管道裂缝子类别进行编码。因此,本文与奥克拉荷马大学合作收集整理了地下管道裂缝CCTV视频图像,对图像进行标注和模糊标签框等处理。针对管道缺陷类型样本数据的不平衡问题,采用数据增强的方法,扩充裂缝样本集,实现数据平衡。最终,构建用于本文研究的管道裂缝数据集。(2)提出一种基于掩码(Mask)注意力机制的管道裂缝分类算法。本算法研究基于图像分割和分类的协同学习模型,结合像素级分割和全局图像级分类注释,构建了基于卷积神经网络的模型。该方法由四个模块组成:特征提取模块、多尺度特征融合模块、掩码注意力模块和子类别分类模块。首先,采用VGG-16作为骨干网络,引入多尺度特征融合方法充分进行特征提取;其次,使用掩码作为一种注意力机制对特征进行细化,增强了裂纹像素点的特征表示,从而降低裂缝细粒度分类任务的歧义性;最后,基于消除背景杂波的特征图,得到子类别分类结果。(3)提出一种轻量化管道裂缝分类算法。在不考虑模型体积的实验室场景下,(2)中提出的算法能得到较高的准确率。然而上述算法在进一步提升准确率的同时不可避免地增加了网络模型的复杂度。因此本文考虑引入了知识蒸馏算法压缩模型。使用微调后的Res Net50作为教师模型,设计了一个面向裂缝分类的轻量级网络CMI(Combined Mobile Net V2&Inception)作为学生模型,进行蒸馏,满足边缘端部署的需求。实验结果表明,分类准确率提高了1.41%,F1-score提高了1.12%。综上所述,以上两种方法分别从分类精度和模型轻量化角度开展研究,获得可满足实际应用需求的深度模型。所提出的方法在管道裂缝数据集上取得了较好的分类效果,其实验结果优于部分基于深度学习的算法,为开发全自动PACP污水管道检测系统奠定了坚实的基础,进一步推动其数字化、智能化进程。

基于改进DenseNet网络模型的农作物病虫害叶片识别系统的设计与实现

这是一篇关于农作物病虫害识别,多尺度特征融合,注意力机制,密集连接网络的论文, 主要内容为我国农业在经济体系中扮演着重要的角色,但是农户在病虫害防治方面仍然依赖人工排查,导致效率低下和病虫害频繁发生,严重影响了农业生产效率和质量,进而影响农户的收益。为了解决这些问题,本文提出了一种基于改进DenseNet网络模型的农作物叶片病虫害识别方法。本文的主要研究内容和创新点如下:(1)本文提出了一种新的网络模型MSFFS-stDenseNet,旨在解决DenseNet网络模型中Dense Block模块存在感受野单一的问题。该模型引入了Inception多分支结构模块来代替Dense Block模块,从多个尺度的卷积核中获得更完整的农作物病虫害特征,从而有效地拓展特征提取的范围,同时还降低模型的参数量和计算成本。此外,考虑到数据集图片上病虫害空间分布不均匀的特点,模型还引入了空间注意力机制。(2)为了解决原DenseNet网络模型在浅层网络特征提取中使用单一的7×7卷积,无法充分提取图片细节特征的问题,MSFFS-stDenseNet模型采用了一种基于CBAM的多尺度特征融合模块进行浅层特征提取。这种方法能够选择性地强调关键特征,进一步提高特征提取的效果。(3)为了解决DenseNet全连接方式导致时间成本过高的问题,本文采用了一种名为ShortNet的连接方式来搭建MSFFS-stDenseNet模型。最终,基于该模型开发了一款农作物病虫害识别APP,它可以在安卓手机上进行拍照并准确地识别农作物病虫害的种类。这款APP能够帮助用户及时了解农作物的状态,并采取措施进行治疗和防治,从而提高农业生产效率和质量。

基于多尺度特征融合的人脸表情识别

这是一篇关于人脸表情识别,多尺度特征融合,注意力机制,金字塔卷积,残差网络,深度学习的论文, 主要内容为人脸表情识别作为计算机视觉中常见的研究领域之一,在人机交互等现实场景下有着重要的应用价值。目前在人脸表情识别领域依旧存在一些问题,比如基于深度学习的人脸表情识别虽然是目前的主流方法,但是在利用深度神经网络提取特征的阶段,随着网络层数的加深,网络的感受野逐渐变大,导致输出的特征图的分辨率变小,对细节的感知能力变差。多尺度特征融合技术对图像的浅层特征和深层特征进行融合,可以解决浅层特征语义性缺乏和深层特征细节丢失的问题。为了能够在图像上提取到更有效的特征,引入了注意力机制,让网络重点关注到对人脸表情识别有用的信息上去,提高人脸表情识别的准确率。本文对基于多尺度特征融合的人脸表情识别展开研究,主要的研究内容和创新工作如下:(1)针对深度神经网络存在的深层特征细节信息丢失和浅层特征语义信息缺乏等问题,提出了基于多尺度特征融合的人脸表情识别算法。在FER2013数据集上的实验结果表明,当采用VGG16、Inception-V3和Res Net50为主干网络时,基于多尺度特征融合的表情识别模型的准确率比基于单一特征的表情识别模型分别提升了0.79、1.02和0.50个百分点;在RAFDB数据集上的实验结果表明,当采用VGG16、Inception-V3和Res Net50为主干网络时,基于多尺度特征融合的表情识别模型的准确率比基于单一特征的表情识别模型分别提升了1.13、0.36和0.36个百分点,验证了多尺度特征融合的有效性。(2)为了进一步提高人脸表情识别性能,在网络中引入了注意力机制。提出了改进通道注意力模块和改进空间注意力模块,并将二者级联得到混合注意力模块。在FER2013数据集上的实验结果表明,当采用VGG16、Inception-V3和Res Net50为主干网络时,基于混合注意力的多尺度特征融合的表情识别模型的准确率比不加混合注意力的多尺度特征融合的表情识别模型分别提升了1.33、1.60和1.08个百分点;在RAF-DB数据集上的实验结果表明,当采用VGG16、Inception-V3和Res Net50为主干网络时,基于混合注意力的多尺度特征融合的表情识别模型的准确率比不加混合注意力的多尺度特征融合的表情识别模型分别提升了1.35、1.76和1.99个百分点,验证了混合注意力模块的有效性。(3)由于卷积运算的局域化,CNN固有的小感受野限制了其在全局上理解场景的能力,为了增大感受野,在网络中引入多头注意力来提高模型的人脸表情识别性能,提出了基于多头注意力的多尺度特征信息交互与融合模块。在RAF-DB数据集上的实验结果表明,当采用Res Net50为主干网络时,基于多头注意力的多尺度特征融合的表情识别模型能够获得82.99%的准确率,验证了多尺度特征信息交互与融合模块的有效性。(4)为了进一步提升网络提取特征的质量,在基于多头注意力的多尺度特征融合人脸表情识别模型中引入金字塔卷积,利用由不同大小和深度的卷积组成的残差模块替代Res Net50中的残差模块来对残差网络进行改进。在RAF-DB数据集上的实验结果表明,当采用Res Net50为主干网络时,基于多头注意力的多尺度特征融合的表情识别模型在引入金字塔卷积之后,模型准确率比未引入金字塔卷积的表情识别模型提升了3.57个百分点,验证了金字塔卷积的有效性。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设货栈 ,原文地址:https://m.bishedaima.com/lunwen/46248.html

相关推荐

发表回复

登录后才能评论