基于AGV的托盘识别定位系统设计与实现
这是一篇关于托盘识别,AGV,深度相机,三维点云,目标定位的论文, 主要内容为相较于传统物流技术,自动导引运输车(Automated Guided Vehicle,AGV)克服了其处理效率低和人力成本高等问题,并在智能物流领域获得广泛运用。其中,如何使AGV更高效、更实时地识别定位托盘成为了当前的研究焦点。为此,本文详细分析了AGV的运行需求,利用深度相机获取目标托盘三维点云,设计了新型托盘识别定位方法,并设计搭建AGV软硬件平台验证了提出方法的有效性,进一步提升了复杂场景下托盘识别定位的精度。本文首先针对复杂环境下的托盘识别检测问题,设计一种基于栅格法的地面点滤除方法滤除点云预处理后的地面点噪点。此外,结合HSV颜色空间、KD-Tree优化欧氏聚类和随机采样一致(RANSAC)设计分割算法以实现目标区域分割。再基于形态学运算和像素点计算完成托盘识别。其次,针对点云平面存在孔洞导致识别失败的问题,提出一种基于网格化思想的点云孔洞修补方法,以网格交点作新增数据点实现孔洞修补。同时,通过计算特征点与特征线段得到目标托盘位姿信息,并利用深度图特征匹配获取特征点进行运动模型估计得到相对位姿,填补识别失败后的信息缺失,实现托盘定位。最后,设计搭建AGV实验平台,充分的实验结果显示,所提出的托盘识别定位算法具有较高实时性、稳定性,且可以适用于大多市场上的托盘,并在工程项目中应用,提高了AGV物流搬运的智能化程度,降低了项目实施的难度和成本。
基于深度特征的细粒度图像检索方法研究
这是一篇关于卷积神经网络,细粒度图像检索,局部特征,目标定位的论文, 主要内容为细粒度图像检索是图像检索领域中具有广阔前景的课题,可应用于电商图像搜索、科研动植物图像搜索等领域。随着深度学习在计算机视觉上的成功应用,出现了许多基于深度学习的细粒度图像检索算法,但这些算法忽略了部分局部细节信息,导致了检索性能瓶颈。本文面向该问题,对细粒度图像检索方法展开研究,主要工作和贡献如下:(1)针对全局特征对细粒度图像描述不充分,忽略细节信息,造成检索性能瓶颈的问题,设计了一种融合全局与局部特征的三分支网络模型。该网络由一条全局分支和两条用于提取不同粒度局部特征的局部分支构成,其中,局部分支采用了切分特征图的策略,通过将特征图切分成不同数量的小块,使网络关注到局部区域上不同粒度的细节特征。考虑到细粒度图像的特点,本文提出了两种切分特征图的实现方式,一种是等分切分,另一种是根据感受野大小有重叠的切分。此外,为了对嵌入空间中的特征距离做出约束,引入了深度度量学习损失函数对网络进行训练。在网络完成训练之后,利用该网络模型分别提取全局特征和局部特征,通过晚融合将提取出的全局与局部特征融合,再进行检索。实验结果表明:与MPFE模型相比,本文设计的三分支网络实现简单,在鸟类数据集CUB-200-2011上的召回率(Recall@1)提高了 2.9%,在车类数据集Cars-196上的召回率(Recall@1)提高了4.1%。(2)针对三分支网络存在的局限性,设计了一种由目标定位模块和判别性特征提取模块组成的网络模型。首先,为了减少复杂背景的干扰,该网络在特征提取前引入目标定位模块,通过对卷积特征描述子进行筛选,将主要对象从背景图像中分离出来,滤除大部分的背景干扰。其次,由于利用切分特征图来提取局部判别性特征,会导致一些分块中只有极少量的目标对象信息,不利于网络的训练学习和整体性能的提升。为解决该问题,网络引入判别滤波器组作为局部特征检测器,通过判别滤波器组可以在原始特征图上直接提取局部判别性特征。实验结果表明:对比三分支网络模型,该模型在鸟类数据集CUB-200-2011上的召回率(Recall@1)提高了5.4%,在车类数据集Cars-196上的召回率(Recall@1)提高了 1.6%。(3)本文基于提出的算法设计了一款简易的检索软件,实现了检索结果的可视化。用户也可对结果做出反馈,以便更准确地查找到所需要的内容。该系统页面简洁,检索结果准确,可以较好地体现所提出方法的实用性和有效性。
基于图像细粒度分类的中餐菜品识别系统
这是一篇关于菜品识别,目标定位,细粒度分类,破坏与重构,注意力机制,BiFPN,Swin,级联操纵的论文, 主要内容为菜品识别有广阔应用前景,如自助食物售卖、食品营养评估及分析、热量测量及美食推荐系统等。中餐菜品种类复杂、不同种类菜品之间相似度高、同类菜品具有多种形态,因此中餐菜品识别是计算机视觉领域一个有挑战性的难题。本文立足于中餐菜品图像中常具有多目标的特点,基于中餐菜品分类数据集Chinese FoodNet,补充了多目标的中餐菜品图像,通过级联中餐菜品位置检测模型与中餐菜品细粒度分类模型,开发了可在移动端应用的多/单目标中餐菜品识别系统。主要工作包含以下几个方面:(1)中餐菜品位置检测模型Ca-BiYoLo-Swin。由于目前公开的大型数据集仅有中餐分类数据集,完成多目标检测任务还需图像中目标位置信息,本文在YOLOv5-S的基础上,优化检测网络对位置信息敏感度与推理速度,得到CaBiYoLo-Swin。在特征提取阶段,将坐标注意力机制嵌入CSP1模块提高模型在空间中捕获远程依赖关系的能力和对空间位置信息的敏感度;在特征融合阶段,在CSP2模块中引入swin编码参数,增强特征图内部的空间语义信息,并使用BiFPN思想改进原有FPN结构,提高模型泛化能力。针对GPU平台,使用卷积优化Focus切片操纵;使用串联同等大小池化核优化SPP结构。实验结果表明,Ca-Bi Yolo-Swin网络相比原YOLOv5-S能更快捷有效的定位出CFood-Loc数据集目标区域。(2)中餐菜品细粒度分类模型DCL-EfficientNetV2。针对中餐菜品类内差距大,类间差距小,图像种类特征难提取的问题,提出DCL-EfficientNetV2模型。为了更好提取图像中的类别特征,在数据处理阶段引入破坏分支,将特征图打乱并重构;加入对抗性损失函数,提高网络对判别性区域特征的学习能力降低噪音影响;网络结构设计中使用Efficient V2-S提取图像特征并在MBconv模块中采取不降维局部跨信道交互策略;采用Softpool下采样方法,更好的保留特征图细节信息。训练阶段,采用区域对齐网络引导骨干网络通过端到端训练对局部区域之间进行相关性建模,帮助骨干网络理解目标。本文使用Chinese FoodNet进行测试,Top-1准确率为82.6%,Top-5准确率为96.7%,优于现有主流模型识别准确率。相比原破坏重构方法和EfficientNetV2-S,在经典细粒度数据集CUB-200-2011,Cars196和Aircrafts100数据集上,正确率分别提升3.5%、1.2%、1.7%和4.2%、2.9%、6%。(3)基于移动端的中餐菜品识别系统。为了便于应用本系统,开发了移动端的用户界面,并通过网络访问中餐菜品位置检测模型和中餐菜品细粒度分类模型得到检测结果,为管理员提供菜品信息管理;为用户提供注册登录,(多/单)中餐识别,原料、营养查询,上传图像功能。性能稳定,有较高实用性。
面向复杂场景应用的双传感器目标定位方法研究
这是一篇关于目标定位,点云描述子,损失函数,决策级融合的论文, 主要内容为复杂场景中的准确目标定位技术正逐渐应用于自动驾驶等领域,具有重要的商业和军事价值,本文即在此背景下开展相关研究工作的学术技术性总结。在结构化特征稳定条件下的简单场景中,基于单一传感器的目标定位技术能高效的完成定位任务。然而,在特征稀疏、语义信息少或定位范围大等复杂场景中,单一传感器提供的数据无法全面描述场景的复杂特征,易导致定位失败。所以,基于双传感器的目标定位技术成为实际过程应用中的研究重点课题方向。本文研究面向复杂场景应用的激光雷达和光学相机的双传感器目标定位方法。两方法的共同基本途径是:利用激光雷达和光学相机获得双模态数据,再采用基于深度学习的数据驱动方法为传感数据进行特征编码,最终通过特征编码后的相似度匹配实现目标定位。本文主要工作内容和贡献归纳如下。第一,提出了一种基于激光雷达的目标定位方法。该方法的主要内容是:首先,采用基于Minkowski卷积的Res Net提取点云数据特征;然后,采用加入自适应特征的金字塔模块进行特征融合,具体过程包含对特征图的多次上下采样,以实现深层和浅层特征的融合;最后采用Ge M层进行池化生成能表征目标信息场景的点云描述子。在此基础上设计定位地点相似性损失函数来训练点云描述子提取网络。第二,提出一种基于双传感器的目标定位方法。该方法的主要内容是:首先,设计图像描述子提取网络,其中采用Dense Net网络来提取图像特征并生成特征图,再用Ge M层来对特征图进行池化得到图像描述子;其次,通过设计决策级融合方法将视觉描述子和点云描述子进行特征聚合,得到双模态描述子;最后,针对不同传感器数据之间训练时出现的过拟合现象,对三元组损失函数进行改进。第三,在Oxford Robot Car数据集进行本文方法的实验验证。通过对比实验和消融实验,比较平均召回率Top1和平均召回率Top1%的值。对于激光雷达的目标定位方法,实验表明本文设计点云描述子提取网络平均召回率Top1和Top1%分别达到了94.2%和98.1%,优于Point Net VLAD等点云目标定位方法。对于双传感器目标定位方法,实验表明本文设计的双模态描述子提取网络的平均召回率Top1和Top1%分别达到了96.8%和99.3%,表明双模态描述子提取网络的有效性。
基于北斗卫星和云服务器目标定位监测系统的设计与实现
这是一篇关于北斗,目标定位,B/S架构,云服务器,APP的论文, 主要内容为随着政府对国家信息安全的认识度越来越高,对定位系统的使用逐渐由GPS转向北斗定位。目前,我国大部分定位导航装的是GPS系统,对用户信息安全存在着隐患。近年来,随着互联网信息技术的快速发展,众多的企业将目光转向了云服务。云服务具有高安全性、可扩展性、可靠性及低成本等优势。本文结合我国的北斗定位系统和云服务器、百度地图等研究设计了一套移动目标位置定位监测系统。该系统能够利用Web客户端以及手机APP客户端在有网络覆盖的区域随时随地对目标进行实时定位监测和轨迹查询。本课题利用北斗定位终端获取目标经纬度和时间信息,通过GPRS网络传输到云端数据库服务器,利用MySQL数据库对目标信息进行实时存储。系统开发采用LAMP(Linux,Apache,MySQL,PHP)作为开发平台服务器,调用百度地图API实时显示目标的位置及目标轨迹。最后用户通过浏览器客户端或手机APP客户端登录系统可快捷方便的查询目标位置,实现实时监测目标位置的目的。通过测试,本系统实现了 Web客户端和手机APP客户端的访问,稳定可靠,只要在有网的地方,任何用户都可随时随地对目标进行监测及轨迹查询等,基本实现了各项预期的功能。
汽车轮胎字符识别方法研究及分组系统设计
这是一篇关于汽车轮胎,字符识别,分组系统,图像预处理,目标定位的论文, 主要内容为汽车轮胎字符是轮胎生产厂家在生产中通过模具压印在轮胎侧表面用于记录参数信息的字符,包含产地、工厂代码和生产日期等信息。为了保证流向市场的轮胎不是存放时间较长轮胎,厂家会在出库之前采用人工识别字符的方式,挑选出存放超过一定期限的轮胎。若轮胎存放超过一定期限,会导致橡胶老化,影响使用安全,对客户及厂家会造成巨大损失。如果采用自动识别技术对轮胎字符进行识别并对超期轮胎分组,则不仅可以减少人力物力的消耗,而且可以实现厂家对轮胎的追溯与管理。针对上述问题,本文设计了汽车轮胎字符识别与分组系统,主要工作内容集中在如下几方面:首先针对工厂仓库环境和轮胎成像特点,对整个系统进行结构设计,并选取合适的相机、镜头和光源等搭建出图像采集装置,对汽车轮胎进行实时采集。对采集到的图像进行图像预处理操作,增强轮胎字符区域与背景区域对比度,并通过极坐标转换将轮胎圆环区域转为矩形区域。之后对轮胎字符进行定位,由于DOT标识字符与被识别字符相对位置固定,通过定位DOT字符来确定被识别字符的位置信息,分别使用模板匹配、Faster R-CNN、Yolov4和改进Yolov4进行定位对比实验。经实验发现,替换Yolov4的主干网络,并引入注意力机制对Yolov4进行改进,对定位速度具有很大提升,每秒传输帧数达到101.4789,准确率达到97.76%,表明改进后的Yolov4对本文轮胎字符定位具有良好效果。其次对定位之后的轮胎字符进行识别,将字符图像提取多种特征送入支持向量机进行模型训练。针对经典LeNet-5网络提出改进,提出了引入BN层,添加Inception模块等改进方法。使用基于支持向量机、LeNet-5网络和改进LeNet-5网络进行识别实验,最终发现改进LeNet-5网络识别准确率有所提高,达到99.4%,相比于经典LeNet-5网络提升了3.3%,识别速度达到64毫秒每张。最后在Qt软件平台进行系统软件设计,系统加载预训练好的模型,可实现在线识别检测,能够在主界面直接查看识别结果和分组结果,并可以将识别数据上传至数据库,实现远程的操作查看,方便轮胎追溯管理。
基于AGV的托盘识别定位系统设计与实现
这是一篇关于托盘识别,AGV,深度相机,三维点云,目标定位的论文, 主要内容为相较于传统物流技术,自动导引运输车(Automated Guided Vehicle,AGV)克服了其处理效率低和人力成本高等问题,并在智能物流领域获得广泛运用。其中,如何使AGV更高效、更实时地识别定位托盘成为了当前的研究焦点。为此,本文详细分析了AGV的运行需求,利用深度相机获取目标托盘三维点云,设计了新型托盘识别定位方法,并设计搭建AGV软硬件平台验证了提出方法的有效性,进一步提升了复杂场景下托盘识别定位的精度。本文首先针对复杂环境下的托盘识别检测问题,设计一种基于栅格法的地面点滤除方法滤除点云预处理后的地面点噪点。此外,结合HSV颜色空间、KD-Tree优化欧氏聚类和随机采样一致(RANSAC)设计分割算法以实现目标区域分割。再基于形态学运算和像素点计算完成托盘识别。其次,针对点云平面存在孔洞导致识别失败的问题,提出一种基于网格化思想的点云孔洞修补方法,以网格交点作新增数据点实现孔洞修补。同时,通过计算特征点与特征线段得到目标托盘位姿信息,并利用深度图特征匹配获取特征点进行运动模型估计得到相对位姿,填补识别失败后的信息缺失,实现托盘定位。最后,设计搭建AGV实验平台,充分的实验结果显示,所提出的托盘识别定位算法具有较高实时性、稳定性,且可以适用于大多市场上的托盘,并在工程项目中应用,提高了AGV物流搬运的智能化程度,降低了项目实施的难度和成本。
基于深度特征的细粒度图像检索方法研究
这是一篇关于卷积神经网络,细粒度图像检索,局部特征,目标定位的论文, 主要内容为细粒度图像检索是图像检索领域中具有广阔前景的课题,可应用于电商图像搜索、科研动植物图像搜索等领域。随着深度学习在计算机视觉上的成功应用,出现了许多基于深度学习的细粒度图像检索算法,但这些算法忽略了部分局部细节信息,导致了检索性能瓶颈。本文面向该问题,对细粒度图像检索方法展开研究,主要工作和贡献如下:(1)针对全局特征对细粒度图像描述不充分,忽略细节信息,造成检索性能瓶颈的问题,设计了一种融合全局与局部特征的三分支网络模型。该网络由一条全局分支和两条用于提取不同粒度局部特征的局部分支构成,其中,局部分支采用了切分特征图的策略,通过将特征图切分成不同数量的小块,使网络关注到局部区域上不同粒度的细节特征。考虑到细粒度图像的特点,本文提出了两种切分特征图的实现方式,一种是等分切分,另一种是根据感受野大小有重叠的切分。此外,为了对嵌入空间中的特征距离做出约束,引入了深度度量学习损失函数对网络进行训练。在网络完成训练之后,利用该网络模型分别提取全局特征和局部特征,通过晚融合将提取出的全局与局部特征融合,再进行检索。实验结果表明:与MPFE模型相比,本文设计的三分支网络实现简单,在鸟类数据集CUB-200-2011上的召回率(Recall@1)提高了 2.9%,在车类数据集Cars-196上的召回率(Recall@1)提高了4.1%。(2)针对三分支网络存在的局限性,设计了一种由目标定位模块和判别性特征提取模块组成的网络模型。首先,为了减少复杂背景的干扰,该网络在特征提取前引入目标定位模块,通过对卷积特征描述子进行筛选,将主要对象从背景图像中分离出来,滤除大部分的背景干扰。其次,由于利用切分特征图来提取局部判别性特征,会导致一些分块中只有极少量的目标对象信息,不利于网络的训练学习和整体性能的提升。为解决该问题,网络引入判别滤波器组作为局部特征检测器,通过判别滤波器组可以在原始特征图上直接提取局部判别性特征。实验结果表明:对比三分支网络模型,该模型在鸟类数据集CUB-200-2011上的召回率(Recall@1)提高了5.4%,在车类数据集Cars-196上的召回率(Recall@1)提高了 1.6%。(3)本文基于提出的算法设计了一款简易的检索软件,实现了检索结果的可视化。用户也可对结果做出反馈,以便更准确地查找到所需要的内容。该系统页面简洁,检索结果准确,可以较好地体现所提出方法的实用性和有效性。
汽车轮胎字符识别方法研究及分组系统设计
这是一篇关于汽车轮胎,字符识别,分组系统,图像预处理,目标定位的论文, 主要内容为汽车轮胎字符是轮胎生产厂家在生产中通过模具压印在轮胎侧表面用于记录参数信息的字符,包含产地、工厂代码和生产日期等信息。为了保证流向市场的轮胎不是存放时间较长轮胎,厂家会在出库之前采用人工识别字符的方式,挑选出存放超过一定期限的轮胎。若轮胎存放超过一定期限,会导致橡胶老化,影响使用安全,对客户及厂家会造成巨大损失。如果采用自动识别技术对轮胎字符进行识别并对超期轮胎分组,则不仅可以减少人力物力的消耗,而且可以实现厂家对轮胎的追溯与管理。针对上述问题,本文设计了汽车轮胎字符识别与分组系统,主要工作内容集中在如下几方面:首先针对工厂仓库环境和轮胎成像特点,对整个系统进行结构设计,并选取合适的相机、镜头和光源等搭建出图像采集装置,对汽车轮胎进行实时采集。对采集到的图像进行图像预处理操作,增强轮胎字符区域与背景区域对比度,并通过极坐标转换将轮胎圆环区域转为矩形区域。之后对轮胎字符进行定位,由于DOT标识字符与被识别字符相对位置固定,通过定位DOT字符来确定被识别字符的位置信息,分别使用模板匹配、Faster R-CNN、Yolov4和改进Yolov4进行定位对比实验。经实验发现,替换Yolov4的主干网络,并引入注意力机制对Yolov4进行改进,对定位速度具有很大提升,每秒传输帧数达到101.4789,准确率达到97.76%,表明改进后的Yolov4对本文轮胎字符定位具有良好效果。其次对定位之后的轮胎字符进行识别,将字符图像提取多种特征送入支持向量机进行模型训练。针对经典LeNet-5网络提出改进,提出了引入BN层,添加Inception模块等改进方法。使用基于支持向量机、LeNet-5网络和改进LeNet-5网络进行识别实验,最终发现改进LeNet-5网络识别准确率有所提高,达到99.4%,相比于经典LeNet-5网络提升了3.3%,识别速度达到64毫秒每张。最后在Qt软件平台进行系统软件设计,系统加载预训练好的模型,可实现在线识别检测,能够在主界面直接查看识别结果和分组结果,并可以将识别数据上传至数据库,实现远程的操作查看,方便轮胎追溯管理。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码海岸 ,原文地址:https://m.bishedaima.com/lunwen/47876.html