9篇关于损失函数的计算机毕业论文

今天分享的是关于损失函数的9篇计算机毕业论文范文, 如果你的论文涉及到损失函数等主题,本文能够帮助到你 基于互补语义信息挖掘的跨模态检索研究 这是一篇关于跨模态检索

今天分享的是关于损失函数的9篇计算机毕业论文范文, 如果你的论文涉及到损失函数等主题,本文能够帮助到你

基于互补语义信息挖掘的跨模态检索研究

这是一篇关于跨模态检索,互补语义信息,跨模态相似度,语义增强,损失函数的论文, 主要内容为在信息化时代,多模态数据作为表示、存储和传输信息的媒介,呈现出爆炸式增长的态势。从海量多模态数据中有效检索信息具有重要的研究意义和巨大的应用需求。跨模态检索旨在根据用户给定的某种模态的查询项,检索出其他模态中相关的结果,例如使用文本检索图像。得益于跨模态检索更加灵活实用的检索方式,它在搜索引擎、推荐系统等实际场景中得到了广泛应用,并成为信息检索领域的研究热点。跨模态检索的核心任务是有效挖掘不同模态数据之间的关联关系,进而学习更加精确的跨模态相似度。主流的跨模态检索方法致力于为不同模态的数据学习公共嵌入空间,以跨越它们之间的“异构鸿沟”。由于互补语义信息挖掘在跨模态相似度学习中发挥着重要作用,本文将以此为切入点研究面向跨模态检索的深度神经网络设计方法。本文从充分挖掘“模态间的互补语义信息”和“模态内的互补语义信息”这一崭新的研究视角出发学习跨模态相似度,实现语义增强并提高跨模态检索的准确性。针对这两类互补语义信息的挖掘,本文提出了两种跨模态检索网络:(1)提出一种“面向模态间互补语义信息挖掘的多模态多粒度语义增强网络”,通过两个阶段收集和融合分散在不同模态全局层面和局部层面丰富的互补语义信息,有效跨越“异构鸿沟”和“粒度鸿沟”,学习更加精准的跨模态相似度。在第一阶段,引入“主要模态”和“辅助模态”的概念,进而定义“主要相似度”和“辅助相似度”,并基于粗粒度特征和细粒度特征分别构建全局级子网络和局部级子网络。在第二阶段,提出一种新颖的“多弹簧平衡损失函数”,选择最需要被优化的样本构建多弹簧平衡系统,通过利用样本间潜在的相互作用,实现跨模态相似度的自适应优化。在各子网络中使用多弹簧平衡损失函数联合优化主要相似度和辅助相似度,将辅助相似度蕴含的有重要价值的语义知识迁移到主要相似度,有效捕获模态间的互补语义信息,通过语义增强显著提升跨模态检索的性能。通过在多个数据集上与多种方法进行对比,以及设计相关的消融实验,充分证明了该网络的有效性和优越性。(2)提出一种“面向模态内互补语义信息挖掘的上下文感知多分支对齐网络”,通过全面建模和推理模态内有价值的细粒度交互,充分挖掘每种模态内部的上下文互补语义信息,进一步实现不同模态之间的精准对齐。首先,基于自注意力机制和门控机制设计了“上下文感知单元”,用于抑制细粒度特征之间部分无用的交互关系,自适应调节模态内信息流动,从而有效建模模态内的上下文关系。然后,为了学习更加全面的跨模态关联,设计三分支对齐模块,用于推理不同语义层面上的跨模态相似度。最后,通过联合优化语义一致性损失函数和跨模态对齐损失函数,有效集成“概要”、“目标”和“关系”三种模块学习到的同一样本对在不同语义层面上的跨模态相似度,同时实现不同类型跨模态相似度的有效互补以及不同模态样本的精准对齐。在Flickr30K和MS-COCO两个基准数据集上与多种先进方法的性能对比证实了该网络的有效性,消融实验进一步证明了网络中各个关键模块的有效性。综上所述,本文根据现有研究存在的问题有针对性地提出了两种跨模态检索网络,在跨模态相似度的学习中充分挖掘“模态间的互补语义信息”和“模态内的互补语义信息”,从而实现语义增强并有效提高跨模态检索的准确性。

基于深度学习的输电线路目标检测算法

这是一篇关于输电线路,目标检测,缺陷检测,损失函数,注意力机制的论文, 主要内容为随着现代社会的发展和科技的进步,我国对电力供应的安全可靠性技术的需求也愈来愈大,因此用电安全技术在行业的主导地位,比以往任何一种时候都更加关键。作为电力系统的重要组成部分,对输电线路定期进行巡检必不可少,为了确保输电线路正常稳定的运行,需要在输电线路巡检过程中重点检查和维护绝缘子和防震锤等电力部件。基于无人机的输电线路巡检会产生大量的图像,检查这些图像中的异常通常需要大量的人力,因此,人们对使用基于深度学习的目标检测算法来自动检测这些图像越来越感兴趣。然而,目前基于计算机视觉的目标检测算法大多运行在具有较高算力的计算机上,难以部署在移动端。在计算资源有限的情况下,如何在无人机上实现在线检测是一个具有挑战性的问题。为了解决上述问题,本文基于深度学习,对输电线路巡检图像的目标检测进行研究,本文的主要研究内容如下:1.针对防震锤、鸟窝、绝缘子以及绝缘子缺陷元件等常见的电力巡检目标,本文在互联网上搜集了大量输电线路巡检图像,并通过亮度、对比度、运动模糊、雨雪雾等方式进行数据增强,用于模型的训练和性能测试。2.无人机在航拍过程中会遇到多种天气状况,本文提出了一种基于改进的C-YOLOv4的目标检测网络,在特征融合阶段通过引入一种轻量型的坐标注意力模块来增强模型对检测目标位置的敏感性;针对目标检测中的类别不平衡问题,本文采用Focal Loss和EIOU来重新设计检测器的损失函数,平衡正负样本的同时提高模型的分类与检测精度。本文模拟了雨雪雾等恶劣天气状况,对数据集进行数据增强,并送入模型进行训练和测试,实验结果表明模型检测平均精度m AP达到了95.68%,在当前的输电线路图像目标检测任务中具有良好的检测性能。3.输电线路中不同尺度的目标尺寸通常差异较大,且无人机航拍的图像尺度变化较大。针对这一问题,本文提出了一种基于动态选择机制的轻量型网络模型Mobile Net-YOLO,首先利用轻量级网络Mobile Netv2作为模型的主干,结合SKNet动态选择机制,为不同大小的目标选择不同大小的卷积核;同时使用ASPP结构增强模型的感受野,适应航拍图像中不同尺度的目标;在检测头前引入ULSAM自注意力机制,为每个特征图的子空间学习不同的注意力图;最后将模型在本文的输电线路巡检图像数据集上进行训练和测试,实验结果表明本文的算法检测平均精度m AP达到了87.52%,平均检测速度达到了58.21帧/秒,模型体积大小为79.98MB,满足在输电线路的边缘移动端部署的要求。为了满足电力巡检轻量化和精度高的要求,本文在YOLOv4算法的基础上提出了C-YOLOv4与Mobile Net-YOLO两种改进算法。C-YOLOv4通过嵌入协调注意力机制和优化损失函数提升了模型的检测精度,Mobile Net-YOLO算法通过引入Mobilenetv2以及SKNet结构使得在优化性能的同时均衡了推理速度、模型大小和精度,更易于模型在手机等嵌入式设备上的部署。最后,通过对比网络改进前后检测结果,以及与YOLOv3、YOLOv4、SSD等目标主流的目标检测算法进行精确度进行对比,本文提出的模型兼顾了轻量化、识别准确率高和检测速度快的综合性能优势,具有识别准确、适用性好、轻量化等特点。最后,本文在公共数据集PASCAL VOC上进行大量对比实验来验证本文算法的有效性。

基于隐式反馈的多兴趣会话推荐模型

这是一篇关于推荐系统,多兴趣,兴趣漂移,隐式反馈,损失函数的论文, 主要内容为在大数据时代,科技得到了飞速的发展,人们可以获得大量的信息。但是在面对海量的信息的时候,如何做出最佳的选择却成为了一个难题。为了缓解这个问题,推荐系统应运而生。在推荐算法中,顺序推荐范式在推荐系统中占据着重要的地位。它对用户偏好的表征使用的是单向量。但是,在用户的会话中包含着用户的多种兴趣,单向量的表征很难对用户多兴趣进行准确的表征。为获取更准确的用户偏好,一些研究人员把目光纷纷投入多兴趣建模的研究中,取得了很好的效果。虽然这些多兴趣模型取得了一定的效果,然而仍然存在着一些问题:(1)众多经典模型常采取让每个兴趣单独召回一系列的候选物品。而在现实生活中,用户在每个时刻做出的选择都是多兴趣共同参与的,用户的多兴趣信息没有得到有效的利用。(2)忽略了多兴趣场景下的兴趣漂移问题。大多数研究者专注于从用户的历史记录中挖掘用户的多兴趣,试图通过细化用户的不同兴趣以更好的应对用户兴趣漂移。但是,当用户的新兴趣与历史兴趣相差很大时,用户会话中的信息与用户新兴趣之间的关联性会很弱。此时仅凭用户会话中的信息将不足以支撑对新兴趣的推理,这会导致模型性能的严重降低。(3)在使用显式反馈数据集进行模型的训练时,模型可以根据用户对物品的评分,对物品进行有侧重的学习,从而对用户兴趣表征的更加准确。而在现实世界中,用户很少在网上给出自己的评分、或者给出的评分很随意,甚至不会给出自己的评分。这就导致,在现实中模型在训练的过程中所使用的数据集大都是隐式反馈数据集,这使得模型训练的难度加大,训练的成本增加。然而,对这个问题的研究却很少。为了缓解上述问题,本文提出了2个用户多兴趣的模型以及设计了1个损失函数。对于第一个问题,本文提出了一个Multi-I模型。它通过胶囊网络挖掘出用户的多种兴趣,然后对用户每种兴趣的演化路径进行了建模,给出了在下一时刻,每种兴趣的表征向量。最后,通过多兴趣的协作,共同作出决策,为用户进行推荐。通过大量的实验表明,获得了良好的效果。对于第二个问题,本文提出了一个RA-Bert模型。该模型以Bert为基础架构,采用双向自注意力机制对用户会话进行双向表征,以解决在用户兴趣漂移场景中,用户会话由于非严格有序,采用单向表征会损伤模型的性能的问题。在该模型中,设计了一个关联性信息增强模块,以便从邻居的会话中自适应的挖掘出与用户新兴趣相关联的信息。通过将该关联信息融入用户会话中,可以有效增强用户会话与新兴趣之间的关联性。进一步地,本文设计了一个新的注意力单元,显式建模了用户与邻居之间的差异性信息,有效地补充了用户会话中缺失的关联性信息。此外,本文分析并揭示了在用户与邻居进行信息融合的过程中,用户与邻居之间信息抽象化程度的不同,对融合效果所产生的差异性影响。通过大量的实验表明,本文提出的方法获得了良好的提升效果。对于第三个问题,本文首先通过实验总结了显式反馈数据集中不同评分样本的损失随模型训练的变化规律,发现模型训练对评分具有高度敏感性。其次,设计了一种带有动态阈值的自适应分级训练函数,能够将数据集中不同评分样本作出有效的区分,从而将隐式反馈数据集在一定程度上优化成显式反馈的数据集。最后,为了更好的学习不同评分的样本,还提出一种自适应分级训练策略以在隐式反馈数据集中获得更好的训练效果。通过大量的实验表明,该方法获得了极佳的性能,大大提高了模型的性能。

面向自动驾驶场景的高效语义分割网络研究

这是一篇关于语义分割,自动驾驶,实时,小目标,损失函数的论文, 主要内容为图像语义分割旨在为输入图像逐像素地分配语义类,作为计算机视觉任务的重要组成部分之一,其为自动驾驶领域的研究做出了巨大贡献。现有基于深度卷积神经网络的方法通过复杂的网络设计,在分割精度方面取得了显著提高,但其面临内存占用高及前向推理速度缓慢等问题,导致很难将其用于实时自动驾驶场景。故本文在实现精度与前向推理速度的平衡,及如何改善小目标分割精度等方面进行了研究,详细的研究内容为:采用轻量级技术提出了一种多级上下文引导的实时分割网络,其构成主要包括基于并行非对称卷积的上下文引导模块及通道注意模块。其中,前者采用深度可分离卷积及非对称卷积来减少计算量,并通过上下分支提取局部及其周围上下文的联合特征信息。为进一步改善联合特征信息,利用优化模块对其进行指导。后者主要是从精度提高的角度出发,通过深层语义来指导浅层筛选出更具表达能力的特征,从而改善分割效果。将上述模块应用于网络的各阶段,有效地实现了特征的多级优化。实验结果表明,同当前其它实时网络相比,所提方法在推理速度与分割精度的平衡上更具优势。针对小目标分割精度不高且分割边界模糊等问题,提出了一种基于注意力及边缘特征提取的实时分割网络,它是对Bise Net V3的改进。首先,结合非对称卷积,对短期密集连接模块做了轻量化处理,并通过并行的通道注意力及空间注意力增强了特征信息间的全局相关性。其次,边缘特征融合模块滤除了语义特征中与边界无关的信息,丰富了边缘特征并促进了语义分支及边缘分支的信息交流。边缘分支的设计使得网络在真实场景下仍能利用边缘信息进行分割,克服了Bise Net V3的缺陷。最后,在加权交叉熵基础上,将Focal Loss应用到多分类的语义分割任务中,使网络能够向着利于小目标分割的方向更新参数。在道路场景数据集上的对比实验及真实环境预测都表明,所提网络改善了边界清晰度及小目标分割精度,并在真实场景下仍具有很高的鲁棒性。

基于频域空间和色彩空间优化的深度学习的对抗样本研究

这是一篇关于对抗样本,神经网络,特征图,损失函数,频域变换的论文, 主要内容为随着计算能力的迅猛增长,深度学习(Deep learning)在各类领域中都大规模应用,如图像分类、情感文本处理、声纹识别等。特别是在物联网中,图像识别应用于实时监测模块,实时处理数据,极大地提升了计算机的效率和准确性。尽管DL算法具有出色的表现,但是它也存在一些潜在的风险:攻击者可能利用特定的噪音来欺骗DL模型,仅仅在输入数据中添加微小到难以察觉到的扰动,使得模型经过Softmax在错误的标签中输出很高的概率,在物联网各类应用中会导致严重的隐私泄漏以及数据盗窃等安全问题。因此对抗攻击是生产项目中部署DL模型的巨大障碍,越来越多的研究开始关注对抗性攻击和防御技术的研究,旨在通过研究对抗样本的攻击性提升模型安全性能。针对DL中的模型安全隐患,本文研究对抗样测试模型的可靠性,从挖掘模型在安全方面漏洞这个角度来抵御对抗攻击,使模型在部署过程中防御性提高,提升模型的鲁棒性和安全性。本文将从两个角度来阐述研究要点:(1)从频域角度加入扰动,搜寻参数以达到最好攻击效果。本文采用在频域空间优化扰动攻击方法BWA(Blind Watermarking Attack)生成对抗样本。创新性在于将图片转换到频域角度,在频域对图片的添加扰动,再将其从频域转换到RGB空间。将从原图上添加扰动进一步优化到在高维特征图像中添加扰动,扰动图像的重要特征,增大了图片信息的可扰动性,为求得最优参数提供了更多可能性。图像转换到频域空间不会导致信息丢失,每个分量明确代表了不同频率带的信息,频域的能量排布更加可视化,易于了解图像频率的分布情况。实验结果显示,在小波变换频域加入扰动具有一定攻击性,并可以将扰动完整提取出来作为水印信息,BWA方法在Image Net数据集对VGG和Resnet进行攻击时,相比对抗水印方法方法,攻击成功率分别提升了2%,1%,迁移能力从数据集上看具有显著优势。(2)本文从损失函数优化的角度,探究如何使用范数来限制对抗扰动的大小。在本文中采用了Lab空间图像色彩相似度作为扰动控制的优化方案,并表明本文的技术可以生成具有平滑图像变形的真实对抗样本。实验结果显示,在扰动信息嵌入频域空间并逆变换到RGB空间时,图片的像素的改变导致对抗样本与原图的相似度非常低,优化损失函数后实验结果表明,方法在Image Net数据集对VGG和Resnet攻击率分别提升了2.5%,此外,相似度与BWA频域攻击方法提高了3%。

基于隐式反馈的多兴趣会话推荐模型

这是一篇关于推荐系统,多兴趣,兴趣漂移,隐式反馈,损失函数的论文, 主要内容为在大数据时代,科技得到了飞速的发展,人们可以获得大量的信息。但是在面对海量的信息的时候,如何做出最佳的选择却成为了一个难题。为了缓解这个问题,推荐系统应运而生。在推荐算法中,顺序推荐范式在推荐系统中占据着重要的地位。它对用户偏好的表征使用的是单向量。但是,在用户的会话中包含着用户的多种兴趣,单向量的表征很难对用户多兴趣进行准确的表征。为获取更准确的用户偏好,一些研究人员把目光纷纷投入多兴趣建模的研究中,取得了很好的效果。虽然这些多兴趣模型取得了一定的效果,然而仍然存在着一些问题:(1)众多经典模型常采取让每个兴趣单独召回一系列的候选物品。而在现实生活中,用户在每个时刻做出的选择都是多兴趣共同参与的,用户的多兴趣信息没有得到有效的利用。(2)忽略了多兴趣场景下的兴趣漂移问题。大多数研究者专注于从用户的历史记录中挖掘用户的多兴趣,试图通过细化用户的不同兴趣以更好的应对用户兴趣漂移。但是,当用户的新兴趣与历史兴趣相差很大时,用户会话中的信息与用户新兴趣之间的关联性会很弱。此时仅凭用户会话中的信息将不足以支撑对新兴趣的推理,这会导致模型性能的严重降低。(3)在使用显式反馈数据集进行模型的训练时,模型可以根据用户对物品的评分,对物品进行有侧重的学习,从而对用户兴趣表征的更加准确。而在现实世界中,用户很少在网上给出自己的评分、或者给出的评分很随意,甚至不会给出自己的评分。这就导致,在现实中模型在训练的过程中所使用的数据集大都是隐式反馈数据集,这使得模型训练的难度加大,训练的成本增加。然而,对这个问题的研究却很少。为了缓解上述问题,本文提出了2个用户多兴趣的模型以及设计了1个损失函数。对于第一个问题,本文提出了一个Multi-I模型。它通过胶囊网络挖掘出用户的多种兴趣,然后对用户每种兴趣的演化路径进行了建模,给出了在下一时刻,每种兴趣的表征向量。最后,通过多兴趣的协作,共同作出决策,为用户进行推荐。通过大量的实验表明,获得了良好的效果。对于第二个问题,本文提出了一个RA-Bert模型。该模型以Bert为基础架构,采用双向自注意力机制对用户会话进行双向表征,以解决在用户兴趣漂移场景中,用户会话由于非严格有序,采用单向表征会损伤模型的性能的问题。在该模型中,设计了一个关联性信息增强模块,以便从邻居的会话中自适应的挖掘出与用户新兴趣相关联的信息。通过将该关联信息融入用户会话中,可以有效增强用户会话与新兴趣之间的关联性。进一步地,本文设计了一个新的注意力单元,显式建模了用户与邻居之间的差异性信息,有效地补充了用户会话中缺失的关联性信息。此外,本文分析并揭示了在用户与邻居进行信息融合的过程中,用户与邻居之间信息抽象化程度的不同,对融合效果所产生的差异性影响。通过大量的实验表明,本文提出的方法获得了良好的提升效果。对于第三个问题,本文首先通过实验总结了显式反馈数据集中不同评分样本的损失随模型训练的变化规律,发现模型训练对评分具有高度敏感性。其次,设计了一种带有动态阈值的自适应分级训练函数,能够将数据集中不同评分样本作出有效的区分,从而将隐式反馈数据集在一定程度上优化成显式反馈的数据集。最后,为了更好的学习不同评分的样本,还提出一种自适应分级训练策略以在隐式反馈数据集中获得更好的训练效果。通过大量的实验表明,该方法获得了极佳的性能,大大提高了模型的性能。

基于深度学习的服装标签识别研究与应用

这是一篇关于深度学习,服装标签识别,残差结构,损失函数的论文, 主要内容为服装衣长、领型等标签信息在电商平台的销售过程中起着重要作用,但是传统通过人工标注的方式费时费力,并且非常容易产生错误。为了解决该问题,本文依托课题组服装云交易平台,将计算机视觉与深度学习技术应用于服装标签识别,提出了一种改进的Inception-v4服装标签识别模型,并将其应用到服装上架过程中。服装商家只需上传服装图像,系统就能自动识别服装标签,再经过商家校对后存入数据库中,提高服装标签的准确率的同时节省了人力。在对深度学习相关技术以及图像处理相关算法深入研究的基础之上,提出了一种改进的Inception-v4服装标签识别模型。首先在识别模型中,通过将残差连接引入到Inception模块,在网络加深的情况下,加快了收敛速度。在此基础之上将服装标签分为长度类与设计类,分别设计了一个长度类标签识别模型和设计类识别模型,通过硬参数共享的方式,复用卷积与池化操作,在减少过拟合的风险与确保准确率的同时,大大降低了计算量。然后通过使用Soft Label和基于类间相似度的损失函数,充分挖掘了数据集中的标签关联信息,提升了模型的性能。并在Fashion AI数据集上进行了评估,实验结果表明本文所描述的方法在取得良好性能的同时拥有更快的收敛速度,准确率相较基础算法提升了4.1%。最后开发了服装标签自动标注系统,该系统是对服装标签识别模型的应用,简化了服装上架的流程。本文所实现的服装标签自动标注系统,为销售平台中的服装提供准确的标签信息,解决了上架过程中,人工标注标签繁琐且具有主观性的问题。此外,本文提出的Soft Label与基于类间相似度的损失函数,还可以用于识别年龄、身高等存在增量关系的任务。

基于Yolov5的猪只健康监测系统研究与设计

这是一篇关于深度学习,卷积神经网络,激活函数,损失函数,优化器的论文, 主要内容为猪肉向来是餐桌上的必需品。猪肉的品质与猪只的养殖方式有着直接的联系。目前,现有的猪只健康检测大多采用人工的方式检查,这样的方式不仅会增加人力物力成本,而且易于危害人体的身体健康。因此,本文提出基于Yolov5算法的猪只健康检测系统,旨在利用深度学习进行猪只跟踪,对猪只的运动量进行等效计算,通过猪只的运动量可以分析出不同猪只的活跃状况。猪只的健康状况与其本身的活跃状态密不可分,由此实现对猪只健康状况的监测。本文研究的是基于Yolov5算法的猪只健康监测系统。通过将Yolov5目标监测算法与DeepSort算法相结合作为基准网络,并在Yolov5算法上进行了一系列创新。创新成果如下:(1)针对猪舍环境复杂,猪只易于出现扎堆现象,难以将目标与背景以及目标与目标之间区分的问题,本文将空间金字塔池化网络与卷积注意力机制进行融合生成了空间卷积注意力模块,并嵌入到Yolov5网络中的残差块中。本文提出的注意力机制可以增强有效特征,抑制无效的特征,从而减少猪只检测中出现的错检和漏检现象。(2)由于本文检测目标猪只大小不一且不同猪只之间距离较近,因此对于目标回归的速度和稳定性有更高的要求。针对出现真实检测框与预测检测框完全重合的情况时,GIoU损失无法准确得出两者的位置关系导致回归速度变慢问题,在GIoU的基础上进行改进,提出了一种新增边界回归盒的回归损失。该回归损失函数加快了预测框的回归,提高检测准确率。(3)针对猪只检测训练阶段所使用的Adam优化器存在的不收敛问题,本文提出了基于高次指数平滑动态边界限制的优化器算法。该算法通过引入多个超参,并进行多次指数平滑,弥补一次指数平滑的不足。此外,对二阶动量计算加以修正,预防二阶动量数据发生不良的波动,从而达到平滑非预期的大学习率的效果。(4)由于采集的图片中猪只数量多且相互遮挡,导致图片数据集复杂度较高,易于出现欠拟合现象。因此,本文提出了一种基于分数指数平滑的线性单元。通过增加激活函数的函数特性,使得参数相互依存的关系增加,从而增加了网络的复杂度,缓解了欠拟合问题的发生。(5)本文通过对监控视频中猪只的像素点移动量进行记录和分析,来等效猪只运动量的计算,从而对猪只活跃情况进行评判。本文将所有创新嵌入到基准算法Yolov5中去,并与DeepSort相结合实现猪只运动量的实时监测。此外,将Vue与Flask相结合搭建了前后端分离的基础平台,从而实现了一个小型的猪只健康监测系统。

轻量级神经网络在图像识别中的应用及优化研究

这是一篇关于轻量级神经网络,图像识别,注意力机制,损失函数的论文, 主要内容为深度卷积神经网络在图像识别领域表现突出。然而,随着网络规模的不断增加所需的计算和存储资源急剧上升,无法满足在移动设备等资源受限环境中高效地进行图像识别。轻量级卷积神经网络的出现有效解决了高精度复杂模型对高性能计算机过分依赖的问题,但在识别精度上略有损失。论文从降低网络规模和保证图像识别精度两个方面开展研究,提出了一种优化的轻量级网络模型结构及损失函数,在多个不同数据集上的实验结果表明了优化的有效性。论文主要研究工作如下:1.对Mobile Net V2、Shuffle Net V2、Squeeze Net、Xception、Efficient Net、Ghost Net等六种经典轻量级神经网络进行研究从识别的准确率、精确率、召回率及模型的参数量、计算量、处理速度等方面进行比较,根据实验结果挑选出综合性能良好的Ghost Net作为后续研究和优化的对象。2.基于Ghost Net模型提出了优化模型L-Ghost Net。该模型将学习分组卷积和改进的CA注意力机制融入Ghost Net中,减少了模型计算量和参数量;同时在学习分组卷积中增加剪枝比例,来控制剪枝在整个过程中的结束时间;改进的CA注意力机制使用全连接层替换掉卷积层,使两个维度之间联系更加紧密,增加了模型的灵活性。在葡萄叶识别、手势识别、人脸识别、水稻识别等多个领域的数据集上的实验表明,L-Ghost Net相比Ghost Net,在所有数据集上,精度略微提升,计算量降低了44%以上,参数量下降了33%以上,处理速度提升了33%。与其它常用轻量级网络模型Mobile Nets、Shuffle Nets在同等级计算量下相比,在所有数据集上具有最低的计算量,最高的精度,较少的参数量,综合性能优良。3.基于可变化角裕度的损失函数进行改进,提出了Mp Loss损失函数模型。模型增加了超参数m和参数p,其中超参数m用于控制不同类之间阈值大小,参数p用于记录模型训练的进度。将L-Ghost Net做为实验模型,在葡萄叶识别、手势识别、人脸识别、水稻识别等多个领域的数据集上的实验表明,Mp Loss相比Center Loss、L-Softmax、A-Softmax、Cos Face、Arc Face、Mag Face等损失函数,在所有数据集上,准确率、精度、召回率、F1-宏平均都有小幅提升,综合性能优良。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码导航 ,原文地址:https://m.bishedaima.com/lunwen/47959.html

相关推荐

发表回复

登录后才能评论