基于模型轻量化的目标跟踪算法研究
这是一篇关于目标检测,空间特征融合,目标跟踪,孪生网络,特征自适应融合的论文, 主要内容为随着卷积神经网络的不断加深,目前目标检测与跟踪算法在每次进行推理计算时的计算量变得无比巨大,无法满足实际应用场景的需要,且在跟踪过程中目标跟踪受背景杂波、光照剧烈变化等因素的影响,针对这一现象,本文以目标检测与跟踪技术为研究对象展开研究,实现对目标检测算法的轻量化以及对单目标跟踪算法的改进,主要完成的工作内容包括如下:(1)针对目标检测算法中计算量大、模型复杂等问题,造成在计算资源有限的应用场景下难以部署的现象,本文提出一种基于优化Retina Net模型的特征融合的轻量化目标检测方法。首先,利用深度可分离卷积参数量少的特性,构建堆叠新的紧凑网络进行特征提取,以减少模型参数量。通过一种空间特征融合机制,提高特征的尺度不变性。其次,融合了结构重参化的思想,增加训练深度,实现多分支训练,单分支推理,更好的提升模型的推理性能。实验结果表明,优化后的目标检测算法平均精度为54.1%,高于Retina Net的平均精度;推理时所占的内存是Retina Net所占内存的44.27%,在保证精度的前提下极大提高网络的推理速度。(2)针对快速运动目标跟踪时图像的背景复杂和光照变化剧烈等较难解决的问题,基于当前的孪生网络,提出一种基于归一化注意力机制的特征自适应融合目标跟踪算法。通过轻量级的注意力机制抑制不太明显的权重,通过路径增强对主干网络最后四个特征层进行路径增强。实验结果表明,提出的算法在构建的数据集中获得了较高成功率59.5%,优于主流的跟踪器。在外界光照变化、图像背景复杂、目标平面内旋转时,算法具有较强的鲁棒性。(3)设计了一个目标检测与跟踪系统测试实际场景下的目标跟踪系统。在实际应用场景下的实验,验证了在背景复杂的环境下以及光照变化剧烈的情况下取得了良好的跟踪效果,证明优化的算法和设计系统的可应用性。
基于深度学习和局部差异的图像自适应隐写分析技术研究
这是一篇关于图像隐写分析,局部差异分析,LSTM,去噪自编码器,孪生网络的论文, 主要内容为图像隐写术作为隐蔽通信的重要手段,得到了广泛的应用。同时,不法分子恶意利用隐写术在图像载体中隐藏恶意代码或秘密信息的安全事件也频繁发生。因此,利用隐写分析技术检测图像是否含有秘密信息,对于保护数字内容安全具有重要意义。近年来研究者提出了多种基于卷积神经网络的隐写分析模型,有效提升了隐写分析模型的检测能力,但仍存在检测性能不足、隐写率失匹配情况下性能下降明显等问题。可见,设计新型架构的隐写分析模型,提升模型的检测能力,推动了隐写分析技术实用化,具有重要现实意义。针对上述问题,本文从如下方面展开研究:(1)基于局部差异分析的隐写分析模型研究针对当前基于全局特征的隐写分析模型容易受到图像自身属性影响,从而造成在隐写率失匹配情况下检测性能下降的问题,本文提出了一种新的基于局部差异分析的隐写分析模型LDANet。该模型通过分析图像不同局部分块的空间平滑性差异和特征属性差异来判断图像是否是隐写图像,提高了空域隐写分析模型的检测性能。LDANet首先运用基于残差结构的卷积神经网络提取局部分块的隐写特征,组成特征序列;再运用长短期记忆网络(Long Short-Term Memory,LSTM)按照希尔伯特曲线顺序学习特征序列的空间平滑性差异;最后融合平滑性差异特征和序列的统计特征进行分类,实现隐写图像检测。区别于仅依赖交叉熵的损失函数设计方式,LDANet设计了包含对比损失、局部分块分类损失和整体网络分类损失的损失函数,引导网络能够更好地提取到图像的局部特征。实验结果表明,LDANet在检测隐写率为0.4 bpp的WOW隐写算法生成的隐写图像时准确率最高,为92.05%。LDANet的检测性能也优于当前其他先进的隐写分析网络,LDANet检测准确率相比于YeNet、SiaStegNet和SRNet,分别最高提高了 11.78个百分点、3.07个百分点和1.05个百分点。在隐写率失匹配的情况下,LDANet的检测性能也优于SRNet。(2)基于去噪自编码器和孪生网络的隐写分析模型研究针对当前基于去噪自编码器和孪生网络的ASSAF隐写分析模型性能较差且只适用于JPEG域的问题,本文提出了基于去噪自编码器和孪生网络的隐写分析模型DAES-Net。不同于现有的基于卷积神经网络的隐写分析模型直接提取图像的隐写特征进行分类,DAES-Net通过孪生网络提取原图像与其去隐写噪声图像之间的差异特征进行隐写图像检测,拓展了隐写分析模型的网络架构设计思路。DAES-Net的预处理模块采用去噪自编码器对输入图像进行去隐写噪声处理;特征提取模块采用基于残差结构和孪生结构的卷积神经网络提取输入图像与其去隐写噪图像的隐写差异特征;分类模块根据自然图像和隐写图像分别与各自去噪图像的特征差异距离不同的特点,计算特征之间的距离度量,并使用全连接层进行分类,从而判断图像是否是隐写图像。实验结果表明,DAES-Net的去噪编码器能够有效去除图像的隐写噪声,产生的图像不仅具有更多的细节纹理,而且在视觉效果和统计分析两个方面都优于ASSAF产生的图像。DAES-Net在检测隐写率为0.4 bpp的WOW隐写算法生成的隐写图像时准确率最高,为91.01%。在检测WOW、S-UNIWARD和HUGO隐写算法时,DAES-Net的检测性能相比于ASSAF分别最高提高了7.53个百分点、8.85个百分点和7.75个百分点。
基于深度学习的FMCW雷达步态识别算法研究
这是一篇关于步态识别,毫米波雷达,深度学习,小样本,孪生网络的论文, 主要内容为步态识别技术是通过分析人体步态特征对人员进行身份识别,具有可远距离获取、难伪造的特点。近年来,该技术已经被广泛应用在安全检查、健康监测和新型人机交互等领域。基于FMCW(Frequency Modulated Continuous Wave,调频连续波)毫米波雷达的步态识别方法具有独特的优势,能够在完成身份识别的同时保护用户的隐私。随着深度学习技术的飞速发展,不少研究人员将其应用于步态识别任务。研究表明,深度学习网络在解决步态识别问题方面具有良好的应用能力,但也存在一些待解决的缺陷。为了进一步提升识别准确率,本文利用深度学习网络对基于FMCW雷达的步态识别问题进行了研究,主要工作如下。(1)本文提出的步态识别方法都是基于毫米波雷达采集的点云数据。现有的基于毫米波雷达点云的步态识别算法没有充分考虑人体步态点云的所有属性,并且在特征提取的过程中忽略了其中的时序信息,网络提取的特征信息不够丰富,导致识别准确率不足。针对这一问题,本文提出了一种基于Point Net和时序卷积的步态识别算法。该算法充分考虑了人体步态点云的相关属性,聚合了点云的三维空间信息、速度和信噪比等特征,并且利用时序卷积提取其中的时序信息,增强算法对时序特征的感知能力,最后根据提取的特征进行分类识别。本文进行了仿真实验来测试该算法在不同的数据场景下的表现,实验结果表明该算法具有较高的鲁棒性,并且可以实现较高的识别精度。(2)针对样本较少的点云数据,直接使用深度学习模型可能会过拟合,导致识别性能降低。为解决该问题,对特征提取网络进一步进行了优化,提出了一种基于孪生网络和注意力机制的网络模型。通过基于权重共享的并行神经网络提取的特征向量来表示匹配和非匹配的步态点云对,然后利用相似性度量和对比损失函数使相同的步态点云对彼此接近,不同的步态点云对相互远离。针对不同场景,划分多个规模不同的小样本数据集,并在数据集上进行仿真实验,最后实验结果表明,该方法可以在监督样本量较少的情况下实现较高的识别精度。
基于孪生网络与图卷积的API推荐模型研究
这是一篇关于孪生网络,图卷积,知识图谱,API推荐的论文, 主要内容为在软件开发日趋复杂的现代,API(Application Programming Interface,应用程序接口)作为软件开发中不可或缺的一部分,其重要程度正在凸显。现有的API推荐模型更多的是关注文本之间的匹配,缺乏对API之间空间结构的研究,难以解决API推荐领域的知识鸿沟和表征差异等问题。因此本文针对现有API推荐模型存在的问题,构建了一个关于API的知识图谱,并结合孪生网络和图卷积提出了一个新的API推荐模型,在一定程度上提升了API推荐的质量和准确度。本文主要工作如下:1.构建API知识图谱。提出一种异源知识图谱,分别从文档和第三方知识社区切入提取知识,对其中的冗余知识进行了过滤,并对滤后的知识进行了对齐和重构,使得这些异源知识构成了一个60万节点量的API知识图谱。2.提出了基于孪生网络与BERT的API推荐模型。基于BERT获取自然语言问句向量表征,并在问句中进行API知识抽取,引入孪生网络结构用抽取出来的知识对句向量进行语义纠正,使其蕴含更丰富的API信息,填补了BERT预训练模型对API知识的缺失和微调困难等缺陷。3.研究图卷积网络对API知识嵌入。针对现有推荐模型中API知识空间语义的缺失,本文提出了一种基于图卷积的API知识嵌入模型,在二维空间中利用知识间的相互关联关系,对API知识进行嵌入,加入了更高维度的空间结构信息。在语义嵌入与空间嵌入的结合下,一定程度上解决了API推荐模型中知识鸿沟和表征差异等问题。并在BIKER模型的数据上,TOP@5、MRR@5、MAP@5三个指标上分别达到了76.96%、62.59%、60.59%,均在BIKER和Deep API模型的基础上有所提升。
基于深度学习的相机源取证研究
这是一篇关于数字图像取证,相机源取证,传感器模式噪声,深度残差网络,孪生网络的论文, 主要内容为随着图像采集技术的快速发展以及数码相机的迅速普及,数字图像己经融入了人们的日常工作和生活当中。但是随之而来暴露出了越来越多的图像信息安全问题:不法分子借助各种功能强大的图像处理软件对图像进行篡改来达到违法犯罪的目的,以及非法利用他人拍摄的作品牟取利益等。因此数字图像取证技术的研究具有重要的意义。本文所研究的相机源取证技术是数字图像取证的一个重要的分支,该技术可以在图像来源不明的情况下,将数字图像与其拍摄的设备进行关联。相机源取证技术在版权保护、图像溯源、法医鉴定等领域有重要的应用。本文首先介绍了数字图像取证以及相机源取证的历史和研究背景,介绍了数码相机的成像管线以及模式噪声,分析了目前现有的相机源取证算法,之后根据实际中不同的应用场景做了如下3个工作:1.提出了一种基于残差网络的大规模图像集相机源辨别算法。传统方法为手动设计特征并且可分类设备的数量较少(20部以下)。本文使用深度残差网络替代传统提取模式噪声的方法,将可用于设备分类的融合特征进行提取;并且设计了高通滤波器,在网络的输入端对低频的图像内容进行过滤,更有助于对模式噪声的提取。我们收集了多达65种型号,共119部设备的大规模图像数据集,算法在测试集上达到了型号级别87%、个体级别83%的平均分类准确率。2.提出了一种基于孪生网络的相机源两两匹配算法。针对另一种应用场景,当我们只有查询图像,没有源相机的信息时,通过该算法将图像进行两两匹配,判断图像对是否为相同的相机所拍摄。算法在孪生网络的基础上进行改进,将双通道的特征提取器替换为本文第一个工作所提出的分类网络,对图像进行成对训练,相同相机拍摄图像标签设为0,不同设为1。算法对输入图像进行两两匹配给出预测结果。经过实验,算法在测试集上达到了89%的准确率。3.设计并实现了基于B-S架构的相机源取证分析平台。将本文提出的两个算法进行了模块化封装,通过将两个算法模块进行线上部署,构成了多维度的相机源取证分析系统。通过型号级别与个体级别的相机源分类与相机源匹配给用户提供多角度的相机源取证分析功能,将复杂的算法转换为网页这种简单易于操作的系统,让更多的用户可以使用我们的算法,在算法的应用以及推广上起到了很大的作用。
基于孪生神经网络的目标跟踪研究
这是一篇关于目标跟踪,孪生网络,注意力机制,可变形卷积的论文, 主要内容为目标跟踪是计算机视觉领域中的研究热点,被广泛应用于我们的生活中。目前基于深度学习的目标跟踪方法取得了巨大的成功,然而在跟踪过程中存在诸如背景杂斑、低分辨率、尺度变化、目标形变等干扰因素,使得在目标跟踪上的研究依然存在许多挑战。为了解决上述问题,本文以孪生神经网络模型为理论基础,结合在实际跟踪环境下的挑战,提出了两种具有创新性的高性能跟踪算法,具体的研究内容以及成果概括如下:(1)提出一种基于注意力机制的孪生网络跟踪算法。在主干网络Alex Net中加入一种由通道注意力机制以及空间注意力机制组成的自注意力机制模块,让网络模型重点关注图像中与当前跟踪任务相关的关键信息,解决在背景杂斑以及低分辨率等干扰因素下算法跟踪性能下降的问题。(2)引入一种由通道注意力机制并结合孪生网络双分支特点组成的互注意力机制模块。在孪生网络中,模板分支相比搜索分支更加关注目标自身信息,但缺乏丰富的目标周围有用信息,而搜索分支相比模板分支则含有较多的目标周围干扰信息,利用该模块可以解决传统的基于孪生网络的跟踪算法在特征提取过程中,模板分支和搜索分支均无法获取对方重要信息的问题,进一步提升网络模型对复杂场景变化的适应能力。(3)提出一种基于可变形卷积和候选区域的孪生网络跟踪算法。使用Res Net网络模型作为特征提取的主干网络,增强网络模型的特征表达能力;使用通道注意力机制,利用图像各通道间的非线性相互作用,让网络模型对图像通道间的关系进行建模,提升网络模型的判别能力;并引入候选区域网络,解决传统的基于孪生网络的跟踪算法在面对目标发生尺度变化时需要进行多尺度预测导致跟踪速度下降的问题,同时使用深度互相关操作,在提升训练稳定性的同时进一步降低网络模型的参数量。(4)使用可变形卷积来构建可变形残差模块,利用可变形卷积感受野灵活的特点,来提升网络模型对形变目标的建模能力,该模块主要解决传统卷积在图像固定位置采样导致的无法有效拟合形变目标的问题。最后,在公开数据集上进行对比实验,将本文算法与其他算法进行大量的实验对比分析。根据实验具体数据证明了本文提出的两种算法均可有效提升跟踪性能,并且可以很好适应各种复杂的跟踪场景。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码码头网 ,原文地址:https://m.bishedaima.com/lunwen/46245.html