基于部件检测与分割的服装图像检索研究与应用
这是一篇关于服装图像检索,Mask R-CNN,VGG16,相似度,加权和的论文, 主要内容为随着互联网的不断普及和服装电子商务的兴起,越来越多的用户通过电商平台购物服装,网上购买服装已经逐渐成了人们的重要消费方式之一,如何在海量的服装商品中高效准确地检索出用户心仪的服装成为了热门的研究方向。目前“以图搜图”技术主要依赖于整张图像特征提取的结果,不能关注到服装的部件,并且服装图像拍摄时背景一般比较复杂,导致服装图像检索准确率低,因此,本文提出一种基于部件检测与分割的服装图像检索方法。本文调研了目前比较流行的服装图像检索方法,并对其优劣点进行了深入研究,主要完成了以下工作:首先,本文通过对服装实例分割数据集iMaterialist Fashion进行转换,并进一步将衣袖分为短袖、中袖、长袖等类别,在较大样本服装图像标注数据集的基础上,训练Mask R-CNN以建立服装图像检测与分割的深度学习模型,从而实现服装图像的检测与分割。利用自训练的Mask R-CNN模型提取服装主体图像、衣领图像、衣袖类别、口袋位置,同时对衣袖类别、口袋位置进行编码以便于相似性比较。其次,在服装图像检索中,本文首先利用Mask R-CNN对图像进行检测与分割得到服装主体、衣领部件、衣袖类别和口袋位置等信息;然后采用VGG16对服装主体与衣领部件提取512维的特征;基于这些信息,将待检索服装与数据库中的服装逐一计算相似度。相似度的计算方式为服装主体及衣领的512维特征的余弦相似度以及衣袖、口袋相似度的加权和,其中衣袖是比较其类别的相似性,口袋是比较其位置的相似性。根据相似度的降序排列,向用户呈现检索结果。实验结果表明,该方法可以关注服装整体以及各个部件,从而能够实现服装款式或风格的检索。并且允许用户调整相似度的权值,可以返回最符合用户个性化需求的检索结果。最后,针对目前服装图像检索中忽略服装部件相似性的问题,本文设计并实现了基于部件检测与分割的服装检索方法的商城系统,通过使用本文提出的检索方法来实现服装商品检索。整个系统使用前后端分离的技术实现,客户端采用小程序框架,服务端采用Spring Boot框架,充分的考虑到了系统的跨平台性和横向扩展性。系统的功能主要包括登录注册模块、商品浏览与检索模块、购物车及支付模块、个人中心管理模块等。
基于关键点特征的服装图像检索研究
这是一篇关于服装图像检索,服装关键点,卷积神经网络,特征融合的论文, 主要内容为随着互联网的发展以及智能手机的普及,在线购物已经成现代人日常活动的一个重要部分,各大电商平台也致力于为用户打造更加便捷舒适的在线购物环境。传统线上购物检索方式主要通过文字检索商品,而如今互联网中具有海量的商品信息,仅基于文字搜索无法得到精准的检索结果,尤其针对服装这类外观表现更强的商品,文字描述不仅具有主观性,也很难全面准确的去匹配想要的服装商品。因此,基于图像的服装检索技术得到了学术界和工业界的关注,用户通过服装图像进行查询,通过描述服装图像的特征进行服装的相似度匹配,返回检索出的相似服装商品图像和相关店铺,能够简洁有效地针对用户需求进行服装商品的推荐。本文主要工作是关于服装图像检索的研究,利用卷积神经网络对服装图像的特征进行表达,以加强服装图像检索的效果。本文中首先基于服装关键点提取局部特征,描述服装功能性局部区域的信息。同时通过卷积神经网络提取服装图像的全局特征,描述服装图像的全局信息,具有一定的高级语义信息。我们融合关键点局部特征和全局特征,共同对服装图像进行具有区分性的特征表达,能够有效改进服装图像检索的效果。由于本文中服装局部特征是基于服装关键点坐标进行提取,因此服装关键点定位的准确性将直接影响服装功能区域特征的表达效果。本文提出一种基于姿态估计的服装关键点定位方法,通过顺序推理机的结构结合卷积神经网络学习不同服装关键点之间的隐式空间关系,能够很好的应对服装作为非刚性物体形变空间大的挑战。本文通过深度神经网络提取服装图像的全局特征以及关键点局部特征。为了充分利用不同深度卷积层之间特征提取的不同级别的信息,本文提出基于多层卷积提取服装关键点局部特征,对服装图像更加细粒度、具有区分性的特征表达。同时为了保证相似性度量的合理性,本文引入Triplet Loss进行相似性度量学习,以提高服装图像检索任务的精度。本文通过实验首先验证了服装关键点定位方法的有效性,能够精准的得到服装功能区域的位置,更准确的表达服装功能性局部特征,同时能够一定程度消除服装复杂背景的影响,应对服装形变的挑战。融合服装关键点局部特征和全局特征,能够对服装图像特征进行更加有效的表达,加强相似服装图像检索的效果,尤其针对于服装款式更加关注的用户,可以对其查询图像进行更好的相似服装的推荐。
基于部件检测与分割的服装图像检索研究与应用
这是一篇关于服装图像检索,Mask R-CNN,VGG16,相似度,加权和的论文, 主要内容为随着互联网的不断普及和服装电子商务的兴起,越来越多的用户通过电商平台购物服装,网上购买服装已经逐渐成了人们的重要消费方式之一,如何在海量的服装商品中高效准确地检索出用户心仪的服装成为了热门的研究方向。目前“以图搜图”技术主要依赖于整张图像特征提取的结果,不能关注到服装的部件,并且服装图像拍摄时背景一般比较复杂,导致服装图像检索准确率低,因此,本文提出一种基于部件检测与分割的服装图像检索方法。本文调研了目前比较流行的服装图像检索方法,并对其优劣点进行了深入研究,主要完成了以下工作:首先,本文通过对服装实例分割数据集iMaterialist Fashion进行转换,并进一步将衣袖分为短袖、中袖、长袖等类别,在较大样本服装图像标注数据集的基础上,训练Mask R-CNN以建立服装图像检测与分割的深度学习模型,从而实现服装图像的检测与分割。利用自训练的Mask R-CNN模型提取服装主体图像、衣领图像、衣袖类别、口袋位置,同时对衣袖类别、口袋位置进行编码以便于相似性比较。其次,在服装图像检索中,本文首先利用Mask R-CNN对图像进行检测与分割得到服装主体、衣领部件、衣袖类别和口袋位置等信息;然后采用VGG16对服装主体与衣领部件提取512维的特征;基于这些信息,将待检索服装与数据库中的服装逐一计算相似度。相似度的计算方式为服装主体及衣领的512维特征的余弦相似度以及衣袖、口袋相似度的加权和,其中衣袖是比较其类别的相似性,口袋是比较其位置的相似性。根据相似度的降序排列,向用户呈现检索结果。实验结果表明,该方法可以关注服装整体以及各个部件,从而能够实现服装款式或风格的检索。并且允许用户调整相似度的权值,可以返回最符合用户个性化需求的检索结果。最后,针对目前服装图像检索中忽略服装部件相似性的问题,本文设计并实现了基于部件检测与分割的服装检索方法的商城系统,通过使用本文提出的检索方法来实现服装商品检索。整个系统使用前后端分离的技术实现,客户端采用小程序框架,服务端采用Spring Boot框架,充分的考虑到了系统的跨平台性和横向扩展性。系统的功能主要包括登录注册模块、商品浏览与检索模块、购物车及支付模块、个人中心管理模块等。
基于深度学习的服装图像检索方法研究与实现
这是一篇关于深度学习,服装图像检索,卷积神经网络,注意力机制,多模态融合的论文, 主要内容为随着电子商务领域的迅速发展,人们在网上购物也越来越方便,服装产品的线上交易量占比也不断增加,导致网络上的服装图像数据量增长迅猛。如何在网络上大量的服装图像数据库中精准地检索出人们需要的服装图像逐渐变为了一个热门的研究课题。传统的基于文本的服装图像检索方法由于需要人工标记,存在描述不清晰和主观性强等不足,使得检索结果准确度不高。传统的基于内容的服装检索方法存在背景干扰、遮挡等问题,提取服装特征有一定的局限性。由于近年来在计算机视觉领域中,通过深度学习的方法可以很好地处理一些使用传统方法处理困难的问题,让深度学习得到了广泛的应用,因此本文将结合深度学习技术从两个不同角度进行服装图像检索的研究。本文基于深度学习技术研究服装图像检索方法,研究并提出了基于注意力机制的服装图像检索和基于图文联合的服装图像检索两种方法,最后设计了一个基于图文联合的服装检索系统。下面介绍本文具体研究内容。(1)提出了一种基于注意力机制的服装图像检索的方法。由于服装图像中难免会包含一些干扰因素,比如光线、背景和遮挡,在使用卷积神经网络进行特征提取时会将这些干扰因素也一起提取,导致影响检索准确率。为了减少这些干扰因素的影响,提出了基于注意力机制的服装图像检索方法。通过在卷积神经网络中加入一种轻量级的通用注意力模块,对通道和空间两个独立维度依次提取注意力特征图,提升在特征提取过程中服装区域的关注程度,压制背景等干扰区域的关注程度,从而提高图像特征的表达能力。在Deepfashion数据集上与不含注意力机制的网络进行对比实验,证明提出的方法可以有效提高服装检索的准确率。(2)提出了一种基于图文联合的服装图像检索的方法。为了满足用户需要对检索的服装图像中的某一属性进行修改的情况,通过图像和文本联合检索来实现。提出一种多模态融合检索的方法,首先分别对服装图像和修改的属性文本进行特征提取,通过用提出的图文残差门控模块让文本特征替代部分图像特征来结合文本和图像的特征,最后在数据集中检索出与新特征相似的服装图像。在Fashion-200K数据集上与其他检索方法进行对比实验来验证提出的多模态融合检索的方法的优越性。(3)服装图像检索系统的设计与实现。通过使用本文提出的图文联合检索的方法设计了一个基于网页的服装图像检索系统,该系统通过前后端分离的形式来实现,前端使用Vue框架,后端使用Spring Boot框架。用户可以在该系统中上传服装图像和输入修改文本,在数据集中检索符合要求的服装图像,并显示在系统的检索结果中。
基于深度学习的服装图像检索方法研究与实现
这是一篇关于深度学习,服装图像检索,卷积神经网络,注意力机制,多模态融合的论文, 主要内容为随着电子商务领域的迅速发展,人们在网上购物也越来越方便,服装产品的线上交易量占比也不断增加,导致网络上的服装图像数据量增长迅猛。如何在网络上大量的服装图像数据库中精准地检索出人们需要的服装图像逐渐变为了一个热门的研究课题。传统的基于文本的服装图像检索方法由于需要人工标记,存在描述不清晰和主观性强等不足,使得检索结果准确度不高。传统的基于内容的服装检索方法存在背景干扰、遮挡等问题,提取服装特征有一定的局限性。由于近年来在计算机视觉领域中,通过深度学习的方法可以很好地处理一些使用传统方法处理困难的问题,让深度学习得到了广泛的应用,因此本文将结合深度学习技术从两个不同角度进行服装图像检索的研究。本文基于深度学习技术研究服装图像检索方法,研究并提出了基于注意力机制的服装图像检索和基于图文联合的服装图像检索两种方法,最后设计了一个基于图文联合的服装检索系统。下面介绍本文具体研究内容。(1)提出了一种基于注意力机制的服装图像检索的方法。由于服装图像中难免会包含一些干扰因素,比如光线、背景和遮挡,在使用卷积神经网络进行特征提取时会将这些干扰因素也一起提取,导致影响检索准确率。为了减少这些干扰因素的影响,提出了基于注意力机制的服装图像检索方法。通过在卷积神经网络中加入一种轻量级的通用注意力模块,对通道和空间两个独立维度依次提取注意力特征图,提升在特征提取过程中服装区域的关注程度,压制背景等干扰区域的关注程度,从而提高图像特征的表达能力。在Deepfashion数据集上与不含注意力机制的网络进行对比实验,证明提出的方法可以有效提高服装检索的准确率。(2)提出了一种基于图文联合的服装图像检索的方法。为了满足用户需要对检索的服装图像中的某一属性进行修改的情况,通过图像和文本联合检索来实现。提出一种多模态融合检索的方法,首先分别对服装图像和修改的属性文本进行特征提取,通过用提出的图文残差门控模块让文本特征替代部分图像特征来结合文本和图像的特征,最后在数据集中检索出与新特征相似的服装图像。在Fashion-200K数据集上与其他检索方法进行对比实验来验证提出的多模态融合检索的方法的优越性。(3)服装图像检索系统的设计与实现。通过使用本文提出的图文联合检索的方法设计了一个基于网页的服装图像检索系统,该系统通过前后端分离的形式来实现,前端使用Vue框架,后端使用Spring Boot框架。用户可以在该系统中上传服装图像和输入修改文本,在数据集中检索符合要求的服装图像,并显示在系统的检索结果中。
基于部件检测与分割的服装图像检索研究与应用
这是一篇关于服装图像检索,Mask R-CNN,VGG16,相似度,加权和的论文, 主要内容为随着互联网的不断普及和服装电子商务的兴起,越来越多的用户通过电商平台购物服装,网上购买服装已经逐渐成了人们的重要消费方式之一,如何在海量的服装商品中高效准确地检索出用户心仪的服装成为了热门的研究方向。目前“以图搜图”技术主要依赖于整张图像特征提取的结果,不能关注到服装的部件,并且服装图像拍摄时背景一般比较复杂,导致服装图像检索准确率低,因此,本文提出一种基于部件检测与分割的服装图像检索方法。本文调研了目前比较流行的服装图像检索方法,并对其优劣点进行了深入研究,主要完成了以下工作:首先,本文通过对服装实例分割数据集iMaterialist Fashion进行转换,并进一步将衣袖分为短袖、中袖、长袖等类别,在较大样本服装图像标注数据集的基础上,训练Mask R-CNN以建立服装图像检测与分割的深度学习模型,从而实现服装图像的检测与分割。利用自训练的Mask R-CNN模型提取服装主体图像、衣领图像、衣袖类别、口袋位置,同时对衣袖类别、口袋位置进行编码以便于相似性比较。其次,在服装图像检索中,本文首先利用Mask R-CNN对图像进行检测与分割得到服装主体、衣领部件、衣袖类别和口袋位置等信息;然后采用VGG16对服装主体与衣领部件提取512维的特征;基于这些信息,将待检索服装与数据库中的服装逐一计算相似度。相似度的计算方式为服装主体及衣领的512维特征的余弦相似度以及衣袖、口袋相似度的加权和,其中衣袖是比较其类别的相似性,口袋是比较其位置的相似性。根据相似度的降序排列,向用户呈现检索结果。实验结果表明,该方法可以关注服装整体以及各个部件,从而能够实现服装款式或风格的检索。并且允许用户调整相似度的权值,可以返回最符合用户个性化需求的检索结果。最后,针对目前服装图像检索中忽略服装部件相似性的问题,本文设计并实现了基于部件检测与分割的服装检索方法的商城系统,通过使用本文提出的检索方法来实现服装商品检索。整个系统使用前后端分离的技术实现,客户端采用小程序框架,服务端采用Spring Boot框架,充分的考虑到了系统的跨平台性和横向扩展性。系统的功能主要包括登录注册模块、商品浏览与检索模块、购物车及支付模块、个人中心管理模块等。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码驿站 ,原文地址:https://m.bishedaima.com/lunwen/45498.html