基于部件检测与分割的服装图像检索研究与应用
这是一篇关于服装图像检索,Mask R-CNN,VGG16,相似度,加权和的论文, 主要内容为随着互联网的不断普及和服装电子商务的兴起,越来越多的用户通过电商平台购物服装,网上购买服装已经逐渐成了人们的重要消费方式之一,如何在海量的服装商品中高效准确地检索出用户心仪的服装成为了热门的研究方向。目前“以图搜图”技术主要依赖于整张图像特征提取的结果,不能关注到服装的部件,并且服装图像拍摄时背景一般比较复杂,导致服装图像检索准确率低,因此,本文提出一种基于部件检测与分割的服装图像检索方法。本文调研了目前比较流行的服装图像检索方法,并对其优劣点进行了深入研究,主要完成了以下工作:首先,本文通过对服装实例分割数据集iMaterialist Fashion进行转换,并进一步将衣袖分为短袖、中袖、长袖等类别,在较大样本服装图像标注数据集的基础上,训练Mask R-CNN以建立服装图像检测与分割的深度学习模型,从而实现服装图像的检测与分割。利用自训练的Mask R-CNN模型提取服装主体图像、衣领图像、衣袖类别、口袋位置,同时对衣袖类别、口袋位置进行编码以便于相似性比较。其次,在服装图像检索中,本文首先利用Mask R-CNN对图像进行检测与分割得到服装主体、衣领部件、衣袖类别和口袋位置等信息;然后采用VGG16对服装主体与衣领部件提取512维的特征;基于这些信息,将待检索服装与数据库中的服装逐一计算相似度。相似度的计算方式为服装主体及衣领的512维特征的余弦相似度以及衣袖、口袋相似度的加权和,其中衣袖是比较其类别的相似性,口袋是比较其位置的相似性。根据相似度的降序排列,向用户呈现检索结果。实验结果表明,该方法可以关注服装整体以及各个部件,从而能够实现服装款式或风格的检索。并且允许用户调整相似度的权值,可以返回最符合用户个性化需求的检索结果。最后,针对目前服装图像检索中忽略服装部件相似性的问题,本文设计并实现了基于部件检测与分割的服装检索方法的商城系统,通过使用本文提出的检索方法来实现服装商品检索。整个系统使用前后端分离的技术实现,客户端采用小程序框架,服务端采用Spring Boot框架,充分的考虑到了系统的跨平台性和横向扩展性。系统的功能主要包括登录注册模块、商品浏览与检索模块、购物车及支付模块、个人中心管理模块等。
基于图像处理技术的仪表表盘智能识别系统
这是一篇关于指针式仪表,读数识别,Mask R-CNN,U-Net,图像处理的论文, 主要内容为变电站是电力系统中重要的参量采集点和管控执行点,对配电设备健康状况的实时监测是电力系统安全稳定运行的前提保障。指针式仪表构造简单、抗干扰能力强且价格低廉,因此被广泛应用在电力系统中。随着我国电网自动化程度的提高,传统的人工巡检方式不能满足数字化需求,不仅消耗大量的人力资源,而且无法保障数据的准确性与实时性。此外,仪表作业环境复杂,人工判读难度大且存在一定的危险性。针对以上问题,本文以变电站设备监测仪表中的六氟化硫(SF6)指针式压力表为研究对象,结合现有研究对经典图像处理算法进行改进,融合深度学习理论与计算机视觉技术设计了仪表表盘智能识别系统。本文主要研究内容有:(1)针对户外环境下仪表受外力、相机设备影响导致仪表图像畸变问题,采用了基于关键点检测技术的仪表几何校正算法,使用像素级分割网络Mask R-CNN定位表盘关键点坐标,再结合透视变换完成仪表的几何校正。同时,在网络模型中结合Ghost Net思想,使用Ghost模块堆叠的方式取代主干网络Res Net-50中的瓶颈块结构,以低成本的线性操作取代常规卷积操作,充分发挥Ghost模块的通道重用能力,加强模型对“冗余”信息的利用,增强模型表达能力。(2)针对SF6指针式仪表读数过程中面临背景复杂、指针细小、光照不均、液体填充等因素导致的指针检测难度大、精度低问题,采用了基于语义分割技术的仪表指针分割算法。算法使用U-Net网络模型,并在跳跃连接过程中添加通道域、空间域注意力机制,帮助模型更好地结合浅层的边缘细节,同时降低无用信息与噪声的干扰,进一步加强网络特征融合能力。(3)针对传统读数识别算法特征提取困难、流程繁琐问题,使用一种更为简洁的读数识别算法。算法对语义分割模型输出的掩码图进行处理,结合最小外接矩形和标准化思想完成读数,避免了传统读数识别算法中重复的图像处理操作。
复杂背景重叠叶片面积测量方法研究及系统开发
这是一篇关于叶片面积,重叠叶片,深度学习,Mask R-CNN,图像处理的论文, 主要内容为林木叶片面积是研究林木生长状况和林木栽培保护的重要依据。目前林木叶片面积测量多采用图像处理方法,存在着叶片测量速度慢和重叠叶片面积测量不准确等问题,严重限制了林木研究和企业生产。实际复杂背景下叶片重叠是影响叶片面积准确测量计算的主要因素也是相关研究的难点,目前还没有一种高效成熟的复杂背景重叠叶片面积测量算法。本文针对以上问题,以大叶黄杨、小叶黄杨和银杏叶片为对象,提出复杂背景重叠叶片面积测量计算方法与数据管理系统。主要研究内容如下:首先,建立林木叶片图像数据集并进行增强扩充。本文选择实地拍摄的大叶黄杨、小叶黄杨和银杏叶片图像作为研究对象,使用图像旋转的方法对林木叶片图像进行数据增强扩充模拟叶片采集的角度倾斜,按照Microsoft COCO数据集格式搭建林木叶片图像数据集共计8548张图像,使用Labelme软件对林木叶片图像进行标注。其次,使用传统图像处理算法测量计算重叠林木叶片面积。本文根据重叠林木叶片图像特点和外形特征,针对大叶黄杨和小叶黄杨叶片形状近似椭圆状的特点,提出椭圆拟合法分割叶片轮廓计算面积;针对银杏叶片形状具有一定对称性且轮廓边缘复杂的特点,提出对称面积法分割叶片轮廓计算面积。实验对比不同拍摄高度情况重叠叶片面积计算准确率,得到最佳拍摄高度为300mm到500mm。本文分为实验室环境和实际复杂背景对重叠林木叶片图像进行面积计算和结果分析,在实验室环境下传统图像处理算法计算面积准确率高于85%,实际复杂背景下重叠林木叶片图像面积计算准确率高于74%。再次,使用深度学习算法测量计算重叠林木叶片面积。针对复杂背景传统图像处理算法重叠叶片面积计算准确率较低问题,提出基于深度学习的重叠叶片分割面积计算算法。根据重叠林木叶片图像特点设计改进Mask R-CNN叶片分割算法,在Mask R-CNN网络结构基础上加入跨阶段局部残差网络和级联分割分支模块,有效缩短训练时间提高重叠叶片分割准确率。改进Mask R-CNN模型叶片图像分割平均速度0.658秒/幅,平均精度均值93.14%,与Dense Net、Deep Labv3和UNet三种卷积神经网络对比,其中Dense Net网络平均分割速度0.794秒/幅,平均精度均值77.03%;Deep Labv3网络平均分割速度1.559秒/幅,平均精度均值82.37%;UNet网络平均分割速度0.359秒/幅,平均精度均值74.61%,确定改进Mask R-CNN网络为最佳模型,训练时间13小时,模型大小161.8Mb。在改进Mask R-CNN叶片分割算法基础上增加像素计算模块,复杂背景重叠叶片图像面积计算准确率高于90%,平均叶片面积计算时间0.912秒。最后,利用Vue.js前端框架、Node.js服务端平台和Mongo DB数据库开发林木叶片面积测量与数据管理系统。本系统分为林木叶片图像采集、林木叶片面积计算和林木叶片数据管理三个模块,使用智能手机拍摄上传叶片图像快速便捷获取叶片面积结果并支持数据可视化查看管理。经检验测试本系统稳定可靠,本系统为准确快速便捷的林木叶片面积测量计算提供了有效的解决方案。
复杂背景重叠叶片面积测量方法研究及系统开发
这是一篇关于叶片面积,重叠叶片,深度学习,Mask R-CNN,图像处理的论文, 主要内容为林木叶片面积是研究林木生长状况和林木栽培保护的重要依据。目前林木叶片面积测量多采用图像处理方法,存在着叶片测量速度慢和重叠叶片面积测量不准确等问题,严重限制了林木研究和企业生产。实际复杂背景下叶片重叠是影响叶片面积准确测量计算的主要因素也是相关研究的难点,目前还没有一种高效成熟的复杂背景重叠叶片面积测量算法。本文针对以上问题,以大叶黄杨、小叶黄杨和银杏叶片为对象,提出复杂背景重叠叶片面积测量计算方法与数据管理系统。主要研究内容如下:首先,建立林木叶片图像数据集并进行增强扩充。本文选择实地拍摄的大叶黄杨、小叶黄杨和银杏叶片图像作为研究对象,使用图像旋转的方法对林木叶片图像进行数据增强扩充模拟叶片采集的角度倾斜,按照Microsoft COCO数据集格式搭建林木叶片图像数据集共计8548张图像,使用Labelme软件对林木叶片图像进行标注。其次,使用传统图像处理算法测量计算重叠林木叶片面积。本文根据重叠林木叶片图像特点和外形特征,针对大叶黄杨和小叶黄杨叶片形状近似椭圆状的特点,提出椭圆拟合法分割叶片轮廓计算面积;针对银杏叶片形状具有一定对称性且轮廓边缘复杂的特点,提出对称面积法分割叶片轮廓计算面积。实验对比不同拍摄高度情况重叠叶片面积计算准确率,得到最佳拍摄高度为300mm到500mm。本文分为实验室环境和实际复杂背景对重叠林木叶片图像进行面积计算和结果分析,在实验室环境下传统图像处理算法计算面积准确率高于85%,实际复杂背景下重叠林木叶片图像面积计算准确率高于74%。再次,使用深度学习算法测量计算重叠林木叶片面积。针对复杂背景传统图像处理算法重叠叶片面积计算准确率较低问题,提出基于深度学习的重叠叶片分割面积计算算法。根据重叠林木叶片图像特点设计改进Mask R-CNN叶片分割算法,在Mask R-CNN网络结构基础上加入跨阶段局部残差网络和级联分割分支模块,有效缩短训练时间提高重叠叶片分割准确率。改进Mask R-CNN模型叶片图像分割平均速度0.658秒/幅,平均精度均值93.14%,与Dense Net、Deep Labv3和UNet三种卷积神经网络对比,其中Dense Net网络平均分割速度0.794秒/幅,平均精度均值77.03%;Deep Labv3网络平均分割速度1.559秒/幅,平均精度均值82.37%;UNet网络平均分割速度0.359秒/幅,平均精度均值74.61%,确定改进Mask R-CNN网络为最佳模型,训练时间13小时,模型大小161.8Mb。在改进Mask R-CNN叶片分割算法基础上增加像素计算模块,复杂背景重叠叶片图像面积计算准确率高于90%,平均叶片面积计算时间0.912秒。最后,利用Vue.js前端框架、Node.js服务端平台和Mongo DB数据库开发林木叶片面积测量与数据管理系统。本系统分为林木叶片图像采集、林木叶片面积计算和林木叶片数据管理三个模块,使用智能手机拍摄上传叶片图像快速便捷获取叶片面积结果并支持数据可视化查看管理。经检验测试本系统稳定可靠,本系统为准确快速便捷的林木叶片面积测量计算提供了有效的解决方案。
复杂背景重叠叶片面积测量方法研究及系统开发
这是一篇关于叶片面积,重叠叶片,深度学习,Mask R-CNN,图像处理的论文, 主要内容为林木叶片面积是研究林木生长状况和林木栽培保护的重要依据。目前林木叶片面积测量多采用图像处理方法,存在着叶片测量速度慢和重叠叶片面积测量不准确等问题,严重限制了林木研究和企业生产。实际复杂背景下叶片重叠是影响叶片面积准确测量计算的主要因素也是相关研究的难点,目前还没有一种高效成熟的复杂背景重叠叶片面积测量算法。本文针对以上问题,以大叶黄杨、小叶黄杨和银杏叶片为对象,提出复杂背景重叠叶片面积测量计算方法与数据管理系统。主要研究内容如下:首先,建立林木叶片图像数据集并进行增强扩充。本文选择实地拍摄的大叶黄杨、小叶黄杨和银杏叶片图像作为研究对象,使用图像旋转的方法对林木叶片图像进行数据增强扩充模拟叶片采集的角度倾斜,按照Microsoft COCO数据集格式搭建林木叶片图像数据集共计8548张图像,使用Labelme软件对林木叶片图像进行标注。其次,使用传统图像处理算法测量计算重叠林木叶片面积。本文根据重叠林木叶片图像特点和外形特征,针对大叶黄杨和小叶黄杨叶片形状近似椭圆状的特点,提出椭圆拟合法分割叶片轮廓计算面积;针对银杏叶片形状具有一定对称性且轮廓边缘复杂的特点,提出对称面积法分割叶片轮廓计算面积。实验对比不同拍摄高度情况重叠叶片面积计算准确率,得到最佳拍摄高度为300mm到500mm。本文分为实验室环境和实际复杂背景对重叠林木叶片图像进行面积计算和结果分析,在实验室环境下传统图像处理算法计算面积准确率高于85%,实际复杂背景下重叠林木叶片图像面积计算准确率高于74%。再次,使用深度学习算法测量计算重叠林木叶片面积。针对复杂背景传统图像处理算法重叠叶片面积计算准确率较低问题,提出基于深度学习的重叠叶片分割面积计算算法。根据重叠林木叶片图像特点设计改进Mask R-CNN叶片分割算法,在Mask R-CNN网络结构基础上加入跨阶段局部残差网络和级联分割分支模块,有效缩短训练时间提高重叠叶片分割准确率。改进Mask R-CNN模型叶片图像分割平均速度0.658秒/幅,平均精度均值93.14%,与Dense Net、Deep Labv3和UNet三种卷积神经网络对比,其中Dense Net网络平均分割速度0.794秒/幅,平均精度均值77.03%;Deep Labv3网络平均分割速度1.559秒/幅,平均精度均值82.37%;UNet网络平均分割速度0.359秒/幅,平均精度均值74.61%,确定改进Mask R-CNN网络为最佳模型,训练时间13小时,模型大小161.8Mb。在改进Mask R-CNN叶片分割算法基础上增加像素计算模块,复杂背景重叠叶片图像面积计算准确率高于90%,平均叶片面积计算时间0.912秒。最后,利用Vue.js前端框架、Node.js服务端平台和Mongo DB数据库开发林木叶片面积测量与数据管理系统。本系统分为林木叶片图像采集、林木叶片面积计算和林木叶片数据管理三个模块,使用智能手机拍摄上传叶片图像快速便捷获取叶片面积结果并支持数据可视化查看管理。经检验测试本系统稳定可靠,本系统为准确快速便捷的林木叶片面积测量计算提供了有效的解决方案。
基于双目视觉的码垛区域智能安防系统设计与实现
这是一篇关于智能安防系统,双目视觉,Mask R-CNN,微服务框架,智能网关的论文, 主要内容为随着码垛机在制造业的广泛使用,码垛区域安防系统也备受关注。为消除码垛区域内机械臂对工作人员的安全隐患,传统安防系统主要依赖红外对射探测器、地毯式压力传感器等获取人与机械臂的相对位置,但是这些方法对工厂环境要求高,现场安装复杂,同时也不利于系统后期的远程维护和性能升级。本文以此为背景,完成设计了一套基于双目视觉的智能安防系统,使用人工智能技术对工作人员实现目标识别和测距,结合工业互联网技术实现对码垛机的智能控制。主要研究内容如下:(1)基于双目视觉的目标测距研究与设计。首先对比了三种视觉测距方法,根据生产现场环境选用双目视觉。其次分析了双目测距原理,确定计算深度所需参数为基线、相机焦距和视差值。然后根据市场调查,进行硬件选型。接着对硬件进行标定实验,获取其基线和焦距。对比多种目标检测算法,选用Mask R-CNN完成目标检测;为了实现高效率、高精度的实时追踪,对切片上的人类姿态以时间信息进行积分和轻量化的特征点链接。对比三种立体匹配算法,选用BM(Bidirectional Matching)求得检测目标的视差值。该方法解决了传统方法的准确率低、安装环境要求高和拓展性差等问题。(2)基于Spring Cloud的数据处理平台部署。根据对当前后端框架的技术研究,为保证可用性和拓展性,选用了目前较流行的Spring Cloud微服务框架。根据系统需要,对Eureka服务注册中心、Feign服务调用、Hystrix服务降级与熔断、Gateway智能网关等主要服务进行分析和部署。根据适用场景对TimescaleDB数据库进行设计。在云服务器上搭建RabbitMQ中间件,采用消息队列遥测传输(Message Queuing Telemetry Transport,MQTT)协议实现了云平台与测距模块、智能网关的数据通信。该平台实现了数据存储、计算以及多模块的智能生态集成。(3)基于Python-snap7的智能网关搭建。综合考虑价格和功能两方面因素,选用树莓派(Raspberry Pi)作为网关硬件。面向西门子S7系列的可编程逻辑控制器(Programmable Logic Controller,PLC),使用 Python-snap7库函数实现网关与 PLC 之间的数据交互;使用 RNDIS(Remote Network Driver Interface Specification)协议实现 Raspberry Pi 的无线 4G 通信;使用基于内网穿透技术的ZeroTier对网关进行统一管理。该网关解决了第三方网关的不稳定和数据传输延时较高等问题。(4)系统整体测试。对测距模块进行静态测试和动态测试;对整体系统进行时效性测试和功能测试。由实验结果得:测距模块在5m内误差小于10%,2m内的误差小于5%;每帧图片的检测时间小于0.1s;从视频输入到PLC收到执行指令的时间小于0.5s。结合实际情况对实验结果进行分析,当码垛机正常工作时,该系统可保障目标区域内工作人员的安全。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码工厂 ,原文地址:https://m.bishedaima.com/lunwen/47735.html