7个研究背景和意义示例,教你写计算机深度哈希论文

今天分享的是关于深度哈希的7篇计算机毕业论文范文, 如果你的论文涉及到深度哈希等主题,本文能够帮助到你 基于内容的图像检索系统设计与实现 这是一篇关于图像检索,深度哈希

今天分享的是关于深度哈希的7篇计算机毕业论文范文, 如果你的论文涉及到深度哈希等主题,本文能够帮助到你

基于内容的图像检索系统设计与实现

这是一篇关于图像检索,深度哈希,自注意力模块,三元组,变分自编码器的论文, 主要内容为随着互联网和成像技术的迅猛发展,数字图像的数据量和分辨率得到了极大提升,如何从海量的图像数据中快速准确地检索出目标图像成为了当前亟待解决的问题。基于内容的图像检索(CBIR)系统利用图像的视觉信息进行检索而表现了优越的性能。传统的CBIR系统通常使用手工方法获取图像的低级视觉特征,并使用线性搜索方法进行数据库搜索,导致了较低的检索精度和效率。围绕现有图像检索方法的不足和限制,本文进行了以下研究:1)针对现有图像检索中存在的检索效率低和正负相似对数量不平衡问题,提出了基于非对称深度注意力哈希的图像检索算法。该算法是在Res Net50网络的基础上进行注意力哈希网络构建。一方面,在Res Net50网络中引入自注意力模块和用于生成哈希码的哈希层,以提高哈希码的辨别能力,并通过该网络得到查询集的哈希码;另一方面,通过设计的损失函数训练网络并生成数据库图像的哈希码,大大提高了哈希学习的效率。实验结果表明,该算法不仅解决了正负相似对数量不平衡问题,还有效提高了检索的效率与精度。2)针对监督学习中标签标注费时费力的问题和现有无监督图像检索中存在的原始数据语义类别信息不足问题,提出了基于深度三元组哈希的图像检索模型。该模型首先利用K-means聚类算法生成图像的标签信息,以便构造三元组,同时设计了一种三元组选择策略进行有效的三元组选择。其次,利用三个共享参数的变分自编码器将输入的三元组特征嵌入潜在空间,以获得保留原始数据结构信息的紧凑、低维的哈希码。最后,设计了一个新的损失函数,以鼓励输出的二进制哈希码接近图像的特征表示。实验结果表明,该算法有效提升了哈希码的辨别能力,增强了图像检索的性能。3)基于上述两种方法的研究成果,使用Pycharm平台、Tkinter框架及My SQL数据库设计开发了一套CBIR系统。结果表明,设计的CBIR系统满足图像检索任务快速、实时的要求,表现了良好的检索性能,可适用于多场景的图像检索任务。

基于无人机和卫星图像的跨视角地理定位方法研究

这是一篇关于图像地理定位,环形划分策略,视野感知,深度哈希的论文, 主要内容为图像地理定位是估计图像所在地理位置的研究,给定一张未知地点的查询图像,通过图像检索技术从数据库中检索出与查询图像最相似的参考图像,利用参考图像的GPS标签估计查询图像的地理位置。基于图像地理定位的无人机视觉定位和导航技术,能够辅助GPS和INS等传统技术,同时也拥有独立完成定位导航任务的潜力,具有重大的应用价值和研究意义。本文主要探讨无人机图像与卫星图像在视角剧烈变化下所带来的类间相似性和类内差异性问题,并从图像预处理、特征提取、检索速度优化等多个角度进行分析研究。主要研究工作如下:(1)图像预处理与数据集重构由于异源图像采集自不同平台,差异性大,为增强跨视角图像的统一性,提升后续算法精度与效率,本文针对颜色风格差异对图像进行预处理。同时利用Sf M算法估计无人机图像的位姿信息,通过位姿信息对数据集进行重构,为后续实验奠定数据基础。(2)基于多尺度环形划分的图像地理定位算法针对现有特征提取方法易忽略特征间的关系以及潜在显著性特征易被掩盖的问题,本文提出一种基于多尺度环形划分的图像地理定位算法,以Res Net-50作为骨干,构建多视图多分支的孪生网络,通过多尺度环形划分策略得到粗粒度、中粒度和细粒度特征,并通过Ghost Vlad获取特征间的相对分布,保留不同类型地理场景的基本结构,加强特征间的关联性从而完整的表达图像的整体属性。在University-1652数据集上的实验结果表明,该算法优于大部分主流方法,能较好的完成跨视角图像地理定位任务。(3)基于视野感知与深度哈希的快速图像地理定位算法为了弥合无人机图像之间存在类内差异,减少特征提取过程中的特征冗余,解决难以同时保证准确性和实时性的问题,本文提出了基于视野感知和深度哈希的快速图像地理定位算法。该算法首先使用Mobile Vi T网络构建轻量级视野感知模型,对无人机图像进行视野范围判断;接着,利用图像的视野信息输入到特定分支,在特定分支内执行具有针对性设置的环形划分策略,提高图像特征鉴别性;最后,通过深度哈希算法提升图像检索速度。在University-1652数据集上的实验结果表明,本文方法在损失较少精度的情况下,检索速度得到明显提升,从而更好地兼顾实时性和准确性。

基于深度哈希和可旋转M树索引技术的快速图像检索

这是一篇关于基于内容的图像检索,深度学习,深度卷积神经网络,深度哈希,PM-tree索引的论文, 主要内容为大规模图像数据集已经成为一种获取信息的可靠来源,在各个领域发挥着越来越重要的作用。快速有效的检索这些大规模图像数据集成为现阶段的一个研究热点。因此,如何高效地检索大规模数据集对用户与网络公司来说都是一项挑战。传统数据库无法获取图像中有价值的信息,不能满足图像处理和检索的需要。因此,在图像检索领域,建立一个能够产生准确输出的信息检索系统是至关重要的。本文针对于大规模图像数据集的内容检索,提出了一个高度可扩展且计算精准的图像检索系统。本文提出的方法基于深度学习解决了上述问题。具体方法是利用深度卷积神经网络(CNN)中预先训练好的网络Res Net-50,通过迁移学习对图像进行特征提取,从而获得图像数据的深度特征描述符,并对未参与训练的图像数据进行分类。之前的研究表明,CNN在图像的识别与分类中有着较为优秀的表现,使用预先训练好的CNN网络在大规模图像数据集上进行适应性调整与迁移学习在识别与检索方面具有较好的效果。本文的研究框架是对预先训练好的网络进行函数层级自适应调整,将深度网络中参数权值调整到一个新的分类域。同时,使用深度监督哈希的方法,对图像的语义信息生成二进制哈希编码,从而实现对大规模图像数据的检索。通过图像中的某些潜在属性确定假定图像的语义标签和分类。在这一假定的基础之上,构建哈希函数作为深度学习网络中的隐藏层,并通过最小化目标函数中定义的分类错误来学习二进制编码。在此基础上,为了能够在搜索时平滑快速地进行查询,本文还对索引结构进行了优化,提出了使用PM-tree索引结构来存储哈希值的有效策略。这种方法不但便于搜索,而且将时间复杂度从O(n)降至O(logn)。在实验部分,为了比较该方法与其他基于内容的图像检索方法的准确性和计算效率,本文使用Cat-Vs-Dog、Food-5k、MNIST、CIFAR-10和Places205等图像数据集进行了一系列验证。实验结果表明,本文使用的Res Net-50模型在图像检索方面优于其他网络模型。在Cat-Vs-Dog数据集和Food-5k数据集上,本文方法的平均检索时间小于10ms,检索准确率约为98%,在Places205数据集上本文方法的准确率约为90%,同时在CIFAR-10和MNIST数据集上的实验结果也表明,我们的方法优于一些最新的算法。

基于视觉Transformer的深度哈希图像检索算法

这是一篇关于图像检索,视觉Transformer,深度哈希,注意力模块的论文, 主要内容为随着互联网技术和移动设备的普及,越来越多的图像和视频被上传至互联网,面对海量的图像数据,快速准确地检索图像变得越来越重要。基于深度哈希算法的图像检索模型通过哈希学习将图像编码为一个固定长度的哈希码来快速检索和匹配,以此解决大数据时代图像检索复杂度高和检索效率低的问题。深度哈希检索算法有两个关键点:特征提取网络和哈希学习。特征提取网络的性能决定了检索模型对图像特征的表征能力和对语义信息的建模能力,哈希学习算法的优劣则决定了生成的哈希码的判别力,进一步影响哈希码匹配的准确率。以往的深度哈希检索模型使用卷积神经网络,利用卷积与池化技术去提取图像的局部信息,并且需要不断加深网络层次来获得全局长依赖关系,这会带来较高的复杂度与计算量。而基于自注意力的视觉Transformer模型能够有效地学习图像的长依赖关系,并且在各种图像任务上表现出了优秀的性能。针对以上问题,本文对深度哈希图像检索算法的两个关键点进行了研究:1、设计了一种注意力增强的视觉Transformer图像检索网络——AE-Vi T。针对视觉Transformer能够有效地学习图像特征的长依赖关系却无法高效地对图像空间局部特征进行建模的问题,在本文提出的AE-Vi T中设计了一个注意力增强模块——AEM,来捕获输入特征图的局部显著信息和视觉细节,学习相应的权重以突出重要特征,并增强输入到Transformer编码器的图像特征的表征力以及提升模型收敛速度。实验在不同的哈希码长度下,分别在两种基准数据集上,将AE-Vi T、Alex Net和Res Net作为骨干网络进行对比,验证了AE-Vi T在图像检索任务上的有效性以及优越性,证明了基于视觉Transformer架构的检索模型相较于基于纯卷积神经网络架构的检索模型在图像检索任务上的性能优势。2、在本文提出的特征提取网络基础上,进一步设计了四种基于经典深度哈希损失的图像检索模型和一种基于联合损失的图像检索模型。一方面,通过对比实验,验证了AE-Vi T在不同深度哈希损失函数下的图像检索性能优越性。另一方面,针对分类标签信息没有被充分利用的问题,提出了结合分类损失的对比损失函数——HSC-Loss,实验对比多种经典的深度哈希检索方法和基于Transformer的哈希检索方法,验证了本文所提基于视觉Transformer的深度哈希图像检索算法的优越性。

基于视觉特征的三维室内模型检索研究

这是一篇关于三维模型检索,视觉特征,深度学习,特征提取,深度哈希的论文, 主要内容为随着计算机图形技术的快速发展,三维室内模型在室内设计行业得到了广泛应用,设计师只需在室内设计软件中简单地拖拽和替换三维室内模型就能高效地对室内空间进行设计和修改,大幅提高了设计效率,降低了设计成本。目前大多数室内设计软件都提供了大量的三维室内模型供用户挑选,然而用户在挑选模型的过程中通常只能使用有限的关键字以文本的形式进行检索,无法准确地获取到想要的模型,存在较大的局限性。因此,本文研究了一种基于视觉特征的三维室内模型检索方法,该方法使用图像作为检索输入源,将对三维模型的检索转化为对二维图像的检索,能够帮助用户快速准确地找到目标模型。本文的主要研究内容包括:(1)本文分析了用户上传的待检图像中存在的各类干扰因素,提出在特征提取前,先对图像进行主体检测,将包含有待检模型的图像主体从原图中分割出来。本文使用相应的数据集综合比较了当前各种主流目标检测算法的实际表现,从中选用了Faster RCNN对图像进行主体检测,并在此基础上使用残差网络和特征金字塔网络对其进行了改进,进一步提升了算法的检测精度。(2)本文针对传统特征提取网络无法实现实例级别的图像检索的问题,设计了一种基于度量学习的特征提取网络,通过在线构建三元组样本并使用Triplet损失函数对网络进行训练,使网络能够对样本进行细粒度的区分。此外,网络中还添加了空间金字塔池化层,用来对图像中的多尺度特征进行融合,提升了网络对尺度变化的鲁棒性。(3)本文针对特征提取网络因输出特征向量的维度过高无法应用于大规模模型检索的问题,设计了一种引入了分段编码和二值约束项的深度哈希网络。该网络使用分段编码结构减少了输出的哈希码中存在的冗余信息,并通过在损失函数中添加二值约束项的方式约束了网络的输出分布同时减小了特征的量化误差,能够较好地将高维特征向量压缩为低维哈希码,在保证一定检索精度的同时,大幅提升了检索速度。(4)在上述研究的基础上,本文对三维室内模型检索的各环节进行了整合,设计了相应的检索流程,并利用WEB前后端技术以B/S架构的形式较为完整地对检索系统进行了实现。本文通过实验测试了系统的检索性能,并对检索结果进行了分析与评估,实验结果表明该系统在检索精度和速度方面都有着良好的表现,能够胜任大规模的模型检索。

基于视觉特征的三维室内模型检索研究

这是一篇关于三维模型检索,视觉特征,深度学习,特征提取,深度哈希的论文, 主要内容为随着计算机图形技术的快速发展,三维室内模型在室内设计行业得到了广泛应用,设计师只需在室内设计软件中简单地拖拽和替换三维室内模型就能高效地对室内空间进行设计和修改,大幅提高了设计效率,降低了设计成本。目前大多数室内设计软件都提供了大量的三维室内模型供用户挑选,然而用户在挑选模型的过程中通常只能使用有限的关键字以文本的形式进行检索,无法准确地获取到想要的模型,存在较大的局限性。因此,本文研究了一种基于视觉特征的三维室内模型检索方法,该方法使用图像作为检索输入源,将对三维模型的检索转化为对二维图像的检索,能够帮助用户快速准确地找到目标模型。本文的主要研究内容包括:(1)本文分析了用户上传的待检图像中存在的各类干扰因素,提出在特征提取前,先对图像进行主体检测,将包含有待检模型的图像主体从原图中分割出来。本文使用相应的数据集综合比较了当前各种主流目标检测算法的实际表现,从中选用了Faster RCNN对图像进行主体检测,并在此基础上使用残差网络和特征金字塔网络对其进行了改进,进一步提升了算法的检测精度。(2)本文针对传统特征提取网络无法实现实例级别的图像检索的问题,设计了一种基于度量学习的特征提取网络,通过在线构建三元组样本并使用Triplet损失函数对网络进行训练,使网络能够对样本进行细粒度的区分。此外,网络中还添加了空间金字塔池化层,用来对图像中的多尺度特征进行融合,提升了网络对尺度变化的鲁棒性。(3)本文针对特征提取网络因输出特征向量的维度过高无法应用于大规模模型检索的问题,设计了一种引入了分段编码和二值约束项的深度哈希网络。该网络使用分段编码结构减少了输出的哈希码中存在的冗余信息,并通过在损失函数中添加二值约束项的方式约束了网络的输出分布同时减小了特征的量化误差,能够较好地将高维特征向量压缩为低维哈希码,在保证一定检索精度的同时,大幅提升了检索速度。(4)在上述研究的基础上,本文对三维室内模型检索的各环节进行了整合,设计了相应的检索流程,并利用WEB前后端技术以B/S架构的形式较为完整地对检索系统进行了实现。本文通过实验测试了系统的检索性能,并对检索结果进行了分析与评估,实验结果表明该系统在检索精度和速度方面都有着良好的表现,能够胜任大规模的模型检索。

基于深度哈希和可旋转M树索引技术的快速图像检索

这是一篇关于基于内容的图像检索,深度学习,深度卷积神经网络,深度哈希,PM-tree索引的论文, 主要内容为大规模图像数据集已经成为一种获取信息的可靠来源,在各个领域发挥着越来越重要的作用。快速有效的检索这些大规模图像数据集成为现阶段的一个研究热点。因此,如何高效地检索大规模数据集对用户与网络公司来说都是一项挑战。传统数据库无法获取图像中有价值的信息,不能满足图像处理和检索的需要。因此,在图像检索领域,建立一个能够产生准确输出的信息检索系统是至关重要的。本文针对于大规模图像数据集的内容检索,提出了一个高度可扩展且计算精准的图像检索系统。本文提出的方法基于深度学习解决了上述问题。具体方法是利用深度卷积神经网络(CNN)中预先训练好的网络Res Net-50,通过迁移学习对图像进行特征提取,从而获得图像数据的深度特征描述符,并对未参与训练的图像数据进行分类。之前的研究表明,CNN在图像的识别与分类中有着较为优秀的表现,使用预先训练好的CNN网络在大规模图像数据集上进行适应性调整与迁移学习在识别与检索方面具有较好的效果。本文的研究框架是对预先训练好的网络进行函数层级自适应调整,将深度网络中参数权值调整到一个新的分类域。同时,使用深度监督哈希的方法,对图像的语义信息生成二进制哈希编码,从而实现对大规模图像数据的检索。通过图像中的某些潜在属性确定假定图像的语义标签和分类。在这一假定的基础之上,构建哈希函数作为深度学习网络中的隐藏层,并通过最小化目标函数中定义的分类错误来学习二进制编码。在此基础上,为了能够在搜索时平滑快速地进行查询,本文还对索引结构进行了优化,提出了使用PM-tree索引结构来存储哈希值的有效策略。这种方法不但便于搜索,而且将时间复杂度从O(n)降至O(logn)。在实验部分,为了比较该方法与其他基于内容的图像检索方法的准确性和计算效率,本文使用Cat-Vs-Dog、Food-5k、MNIST、CIFAR-10和Places205等图像数据集进行了一系列验证。实验结果表明,本文使用的Res Net-50模型在图像检索方面优于其他网络模型。在Cat-Vs-Dog数据集和Food-5k数据集上,本文方法的平均检索时间小于10ms,检索准确率约为98%,在Places205数据集上本文方法的准确率约为90%,同时在CIFAR-10和MNIST数据集上的实验结果也表明,我们的方法优于一些最新的算法。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设港湾 ,原文地址:https://m.bishedaima.com/lunwen/54580.html

相关推荐

发表回复

登录后才能评论