梅花鹿体温非接触监测方法研究
这是一篇关于非接触测量,目标检测,YOLO,ResNet,BP,图像融合的论文, 主要内容为近年来,随着机器视觉技术等人工智能领域技术逐渐应用于我们的日常生活当中,不断推动者智能化产业的发展。而梅花鹿是我国的特产品种。人类通过养殖,可以利用梅花鹿的皮、尾、鞭、筋、茸、血、肉等,这些物质在医药、食品、皮肤等领域都有很高的经济价值,其养殖规模也逐渐变大。但在养殖过程中,梅花鹿会出现各种疾病,短时间内会对梅花鹿生命造成危害,而传统人工对梅花鹿的监测往往效率不高,进而造成一系列的经济损失。为此,需要通过其体征信息的变化来判断梅花鹿的健康状况。人工测量梅花鹿体温会引起鹿的强烈应激反应,为此本文提出了一种梅花鹿体温非接触监测方法,研究内容主要分为以下几个方面:(1)梅花鹿个体信息检测。首先制作了梅花鹿数据集,采用录像设备进行拍摄,采集到来自吉林省长春市双阳区东鳌鹿业集团养殖场梅花鹿个体的视频数据。为了得到梅花鹿的个体信息,本文提出了一种基于改进后的梅花鹿面部识别模型SK-Res Net,模型使用Res Net-50作为基础模型,在模型中使用SK-Bottleneck模块融合多个感受野的信息多尺度提取面部特征。其次,在快捷连接中使用了最大池化层减少信息丢失。最后,在网络中使用ELU激活函数,以减少梯度消失,防止过拟合,加快收敛速度,提高模型的泛化能力。(2)梅花鹿眼部位置检测。利用改进后的YOLO5S的目标检测算法,将SKNet模块与YOLOv5s中backbone部分的Res模块进行融合,增加网络的感受野,提高了网络的特征提取能力,提高了检测的准确性,运用Transformer encoder模块替换了YOLOV5s中部分的CSP模块,模型捕捉全局信息和丰富上下文信息的能力增强,检测准确率进一步提高。(3)非接触测温装置的实现。以Jetson Nano人工智能开发板为核心配件,加入了红外热成像仪和摄像头。为了减少实际环境对温度测量精度的影响,运用最小二乘法多项式拟合和基于遗传算法的BP神经网络补偿算法的方法,构建温度拟合曲线,进而提高测量精度,最后通过对应像素坐标的图像融合的方法,将红外热图像和可见光图片进行了融合,实现了梅花鹿体温的非接触测量。
基于梯度图像融合的绝缘子缺陷检测技术研究
这是一篇关于接触网绝缘子缺陷,图像融合,多尺度变换,神经网络,WLE-WSEML,图像质量评价的论文, 主要内容为绝缘子作为接触网中比较重要的设备之一,起到了支撑馈电线和阻断电流流向塔杆的作用。然而接触网绝缘子长期暴露在外界环境中工作,易受雨雪、雾霾、太阳光、强电场、强机械张力的影响,使得绝缘子出现破损、自爆、污秽等缺陷。这些缺陷严重威胁着机车的安全运行。因此需要对绝缘子常见的一些缺陷进行检测,提前发现隐患,杜绝因绝缘子缺陷而导致的行车安全事故。传统的绝缘子缺陷检测方法主要基于图像处理技术,如形态学、边缘检测、纹理分析等,但这些方法存在着检测精度低、易受干扰等问题。相较于传统方法,本文的方法在图像融合和缺陷检测方面具有更高的准确性和鲁棒性,能够有效地检测绝缘子的自爆、裂纹、污秽等缺陷。该研究对于提高接触网绝缘子的安全性和可靠性,保障铁路交通的安全运行具有重要的意义。为了解决接触网绝缘子长期暴露在外界环境中易受影响的问题,提出了一种基于红外和可见光图像融合的方法来进行绝缘子缺陷检测。主要研究成果和创新点有:(1)针对单一红外图像或可见光图像不能够实现全天候检测的问题,提出了一种梯度图像融合模型算法,将绝缘子的可见光图像和红外图像融合在一起。先对红外和可见光图像进行预处理,接着采用加速稳健特征算法(Speeded-Up Robust Features,SURF)将两幅图像的特征点进行匹配,使两幅图在不同的维度上都能够对齐,进而确定两者之间的映射关系,为图像的融合奠定基础。在图像融合方面,采用采样剪切波变换(Non-subsampled Shearlet Transform,NSST)算法将图像分解成高频子带图和低频子带图,再分别对高频分量图和低频分量图融合,实现局部融合,再利用NSST的逆变换对高频子带图和低频子带图进行逆变换,得到最终融合图,实现全局融合。通过将红外图像的优点来弥补可见光的缺点,增加系统抵抗外界干扰的能力;(2)针对现有用于图像融合的神经网络算法存在易受外界环境的干扰而导致大量的细节信息缺失以及多尺度变换算法的冗余信息较多而导致运算时间增加得问题,提出了采用多尺度变换和神经网络算法相结合的方法来进行融合处理,将两者之间进行优势互补。采用脉冲耦合神经网络(Coupled Neural Net-works,PCNN)算法将两图像的高频子带图融合在一起,采用加权局部能量(Weighted Likelihood Estimation,WLE)和基于八邻域的改进拉普拉斯算子(WSEML)结合的优化算法(WLE-WSEML)将两图像的低频子带图融合在一起,再利用多尺度逆变换对融合后的高频子带图和低频子带图逆变换成一张整体的图,从而实现全局融合;(3)针对评价图像融合算法使用是否合理的问题,提出了通过计算融合图像的边缘信息保持度、信息熵、互信息、空间频率、均方误差、结构相似度等六个维度对融合后的图像质量进行评价。(4)针对绝缘子常见的自爆、裂纹、污秽等缺陷问题,提出了三种检测方法,分别为:采用最小二乘法直线拟合算法在二值图像的基础上来实现绝缘子的自爆检测;采用像素积分投影法来检测绝缘子片裂纹情况;采用颜色特征分析法来判别绝缘子表面污秽情况。经过实验验证,本文提出的基于红外和可见光图像融合的方法能够有效提高接触网绝缘子的缺陷检测能力。与传统方法相比,采用融合图像的方法能够提高绝缘子缺陷的识别率,特别是在绝缘子自爆、绝缘子片裂纹和绝缘子表面污秽三个缺陷的检测方面,识别率分别达到了95%、91%、90%,均高于了单一的红外图像或可见光图像的识别率。这表明,本文提出的方法具有更高的准确性和鲁棒性,能够有效地检测绝缘子的缺陷,为接触网绝缘子的安全运行提供了重要的保障。因此,该研究具有重要的实际应用价值,对于提高接触网绝缘子的安全性和可靠性具有重要的意义。
基于深度学习的红外图像融合与超分辨率研究
这是一篇关于红外图像,图像融合,超分辨率,深度学习,Transformer的论文, 主要内容为在信息爆炸的时代,各种成像技术迅速发展。红外传感器具有可以在可见度极差的情况下工作和抗干扰能力强等优点,在现代高科技领域发挥着越来越重要的作用,具有十分广阔的发展和应用前景。另一方面,红外图像也存在空间分辨率低和边缘模糊等缺点。因此,红外图像的分析与处理就成为红外图像及其应用中的研究热点。本课题主要研究内容是红外与可见光图像融合研究以及红外图像超分辨率研究。(1)红外与可见光图像融合。红外与可见光图像融合的目标是获得具有完整场景表达能力的高质量融合图像。针对DenseFuse方法的不足和传统的基于多尺度分解的图像融合方法的启发,本课题提出了一种独具创意的渐进式红外与可见光图像融合框架,该框架以U-Net为骨干提取多尺度特征,然后逐渐融合多尺度特征,最终逐层重建融合图像。提出的方法有以下两个优点。首先,与许多基于深度特征的融合方法不同,我们不仅对包含全局信息的高层特征进行融合,而且对包含更多细节的低层特征进行融合。其次,我们不仅在原始尺寸的特征上进行融合(保持更多细节),还在其他更小尺寸的特征上进行融合(保持语义信息)。大量实验证明了我们方法的有效性和泛化性。与其他先进的方法相比,我们的方法在主观和客观评估上都显示出更好的结果。(2)可见光图像引导的红外图像超分辨率。考虑到很多场景下低分辨率红外传感器都和高分辨率可见光传感器搭配使用,一种可行的思路是利用可见光传感器捕获的高分辨率图像,辅助红外图像进行超分辨率。为此,本课题提出了一种使用高分辨率可见光图像来引导红外图像进行超分辨率的神经网络模型。考虑到红外和可见光图像对一般是不对齐的,两者之间存在一定的视差,我们使用基于引导Transformer的信息引导与融合方法,从高分辨率可见光图像中搜索相关纹理信息,并将这些相关纹理信息与低分辨率红外图像的信息融合得到合成特征。然后这个合成特征经过后面的超分辨率重建子网络,得到最终的超分辨率红外图像。在超分辨率重建模块,我们使用通道拆分策略来消除深度模型中的冗余特征,减少计算量,提高模型的性能。实验结果表明,我们提出的方法可以取得优于对比方法的超分辨率性能。针对DenseFuse融合方法的不足和基于多尺度分解的图像融合方法的启发,本课题提出了一个基于U-Net的渐进式红外与可见光图像融合框架,提出的方法实现了比较好的结果,超越许多图像融合方法。面向引导超分辨率任务,本课题提出了一种通过Transformer来使用高分辨率可见光图像引导红外图像进行超分辨率的方法,提出的方法能够充分利用红外图像和可见光图像之间的关联信息,同时取得在主观和客观评价上均优于其他对比方法的性能。
基于切片的非凸卷积稀疏编码问题研究
这是一篇关于卷积字典学习,非凸优化算法,图像融合,各向同性全变分,压缩感知的论文, 主要内容为卷积字典学习旨在从所给信号中学习卷积字典以及对应的稀疏系数映射。传统的卷积字典学习算法大多利用图像块进行字典学习,为求解方便,大多数算法均在凸优化背景下进行,这就导致忽略了图像块之间的相关性以及稀疏系数非稀疏问题。随着研究的不断深入,非凸优化问题也得到了进一步的发展。并且在数学角度也可得到收敛性证明。基于此,本文对非凸优化问题展开研究。本文在基于切片处理的凸优化字典学习(Slice-Based Dictionary Learning,SBDL)算法和基于傅里叶域的自适应非凸前向后向分裂(Adaptive Nonconvex Forward–Backward Splitting,AFB)算法的基础上展开研究。针对非凸问题,本文将切片思想用以解决非凸优化问题,由此提出了基于空域的可收敛的基于切片的非凸前后向分裂自适应(A Convergent Slice-Based Nonconvex Forward–Backward Splitting Adaptation,ANFBA)算法,并在数学角度证明了算法收敛性。实验结果证明,ANFBA算法可获得更小的目标函数值和更低的稀疏度。为进一步体现非凸优化的性能。本文将对应情况下的凸优化问题进行了对比。通过实验结果证明,非凸优化的目标函数值以及稀疏度都要低于凸优化结果。为进一步说明ANFBA算法在应用领域的性能,本文将ANFBA算法应用到图像融合领域并针对多聚焦等开展了实验。实验结果证明,ANFBA算法具有优良的性能。最后,本文将ANFBA算法应用于压缩感知图像重建。为更好解决图像重建问题,本文将ANFBA算法和卡通纹理分离模型相结合,提出基于各项同性TV的压缩感知图像分离网络(Compressed Sensing Image Separation Network Based on Isotropic Total Variation,CSTVISO-Net)。通过实验结果证明,本文所提出的CSTVISO-Net可以获得较高质量的重建图像,尤其在低测量率时,本文的算法效果更加明显。
基于深度学习的图像去噪方法研究
这是一篇关于图像去噪,深度学习,图像纹理,图像融合,多阶段去噪的论文, 主要内容为随着互联网和多媒体技术的快速发展,图像已经成为人类信息交流和信息传递过程中不可或缺的一部分,对现代社会的信息存储和信息交互技术等方面的发展具有实际意义。然而,图像的采集、生成、存储以及传输过程中,难免会受到不同类型、不同程度的噪声信号的污染。因而需要对噪声图像进行处理,即从一幅低质量的噪声图像中恢复出高质量的无噪声图像。目前,许多图像去噪的深度学习方法已经被提出,但仍存在去噪结果的细节或纹理损失严重等问题。因此,本文致力于研究基于深度学习的图像去噪方法:(1)自然图像中包含有纹理较丰富的区域和纹理较稀少的平滑区域,因而对图像区域进行同样的去噪处理,会忽略图像纹理区域差异,造成纹理丰富区域内较大的细节丢失。因此,本文提出了一种结合纹理损失的图像去噪方法。该方法首先在U-Net网络中增加残差模块,从而提升网络的特征提取能力,然后提出一种基于拉普拉斯算子的纹理损失函数用于去噪网络训练。实验结果表明,本文的结合纹理损失的图像去噪方法能重建出良好的去噪图像并保留合理的纹理。(2)我们发现对噪声图像使用不同的去噪参数进行不同强度的去噪后得到的去噪结果在纹理丰富区域和纹理平滑区域分别具有不同的表现。因此,本文提出基于U-Net融合的图像去噪方法。该方法首先增加U-Net网络中编码器个数并增加一个金字塔模块用于将特征从深层融合到浅层,得到二分支U-Net融合网络;其次,使用已有图像去噪方法在两个不同去噪参数下的两幅去噪结果图像;最后,将两幅去噪图像作为二分支U-Net网络的输入,由二分支U-Net融合网络重建出最终的去噪图像。实验结果表明,本文的基于U-Net融合的图像去噪方法能进一步优化现有的图像去噪方法的性能。(3)考虑到现有的基于深度学习的图像去噪方法往往只进行单次的去噪,容易造成去噪结果细节损失,且无法挽回。因此,本文提出了一种基于循环神经网络的多阶段图像去噪方法。该方法包括两个去噪阶段,通过调整两个阶段的训练权重可以使得第一个阶段的去噪结果包含部分未去除干净的噪点和更多细节信息,然后将第一阶段提取的特征通过门控循环单元传递到第二阶段,再进行第二个阶段的去噪。同时,为了使深度网络的训练更稳定,本文还设计了一个估计噪声分布的子网络,用于从噪声图像中估计噪声的分布。最后,将噪声分布和噪声图像拼接,作为网络的输入来训练去噪网络。实验结果表明,本文的基于循环神经网络的多阶段图像去噪方法具有先进的去噪性能。
基于TOF特征图像的煤流量检测方法研究
这是一篇关于TOF相机,深度图像,图像融合,煤流速度检测,煤流量检测的论文, 主要内容为建设信息化、数字化、智能化、无人化的现代化智慧矿山是煤矿行业发展的必然趋势。在智慧矿山的各个环节中,智能生产、智能运输及智能调度管理等都需要煤流量数据的支持。无论是从煤炭生产方面还是从安全方面考虑,带式输送机煤流量检测都十分重要。针对目前非接触式煤流量检测方法无法快速且密集地获取煤料深度信息的问题,本文提出了一种基于飞行时间(Time-of-Flight,TOF)特征图像的输送带煤流量检测方法。首先,在TOF特征图像预处理部分,为便于观察和后续处理,将原始深度图像和强度图像进行直方图均衡化,并且采用中值滤波在去除深度图像中的脉冲干扰信号的同时保护图像的边缘信息。利用坐标转换把深度图像由图像坐标系转换为世界坐标系,便于后续煤料体积检测模型的建立。针对煤料图像采集和处理过程中背景噪声干扰问题,提出煤料区域识别算法,该算法利用TOF深度图像能够直接获取物体表面深度信息的优势,得到煤料ROI(region of interest)。然后,在煤流量检测部分,针对深度图像在深度值不连续处存在飞行像素噪声与多径误差噪声,不能准确表示物体边缘处深度值的问题,利用深度图像和强度图像各自的优势,将深度图像的深度信息和强度图像可靠的边缘位置信息进行融合,以得到高精度深度图。提出了基于TOF特征图像的煤流速度检测算法,并基于上述获得的高精度深度图和煤流速度信息,设计了煤流量计算模型,得到当前的煤流量。最后,为探究所提检测方法的可行性、准确性、精度及实时性,在实验室建立煤流量检测实验平台。在不同的输送带运行速度、载煤量和环境光条件下,对TOF相机采集的特征图像进行处理,并计算煤流量。结果表明,本文所提出的煤流量检测方法最大误差不超过3.54%,最大标准差不超过0.487,适合在矿下环境光复杂的情况下使用,且对每帧图像的平均处理时间不超过83 ms,满足实时性要求。基于TOF特征图像的煤流量检测方法可以为智能生产、智能运输及智能调度管理等环节提供煤流量数据支持,为智慧矿山的建设奠定了基础。
车辆多模态视觉感知系统的设计与开发
这是一篇关于智能汽车,环境感知,图像配准,图像融合,目标检测的论文, 主要内容为在新一轮科技革命和产业变革的背景下,快速发展的计算机技术与传统汽车行业深度融合,智能汽车成为产业发展的战略方向。作为智能驾驶关键技术中的数据前端,车辆感知系统利用多种传感器收集数据,并以此为基础进行算法分析,提取有价值的外部环境信息,供车内乘员及辅助驾驶系统做出驾驶行为决策。本文主要研究设计和实现一个车辆多模态视觉感知系统,选用可见光与红外摄像头作为视觉传感器,以此为基础实现像素级和语义级的外部环境感知。在像素级,基于图像融合技术对不利条件下的可见光图像进行增强;在语义级,基于目标检测与跟踪技术对行人与车辆等目标进行实时监控。为实现上述目标,本文主要完成了以下两方面的工作:(1)算法研究层面:首先,本文提出了一个跨模态的图像配准算法,用以解决可见光与红外图像像素坐标不对齐的问题。该方法一方面使用栅格化的多尺度特征提升了配准参数预测的准确性;另一方面基于对比学习的思路训练了一个跨模态相似度度量模型,实现了配准模型的半监督训练。其次,针对图像融合时可见光与红外图像灰度区域分布不一致的问题,本文提出了一个灰度匹配预处理方法以实现昼夜一致的图像增强效果。(2)系统开发层面:首先,针对硬件平台在资源绑定、状态管理等方面不完善的情况,本文设计了一个系统维护模块实现链路管理,内存管理与任务调度功能以解决上述问题。随后,对于感知功能实现时需要部署的各个算法模型,本文依据算法架构与硬件资源的特点进行了合理分配与优化实现,以期达到最佳的执行效率。通过上述两方面的工作,本文实现了一个实用的车辆多模态视觉感知系统,在真实的道路测试中取得了良好的表现。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码工厂 ,原文地址:https://m.bishedaima.com/lunwen/47810.html