基于深度学习的路面裂缝提取关键技术研究
这是一篇关于计算机视觉,裂缝识别,图像处理,深度学习,卷积神经网络,注意力,Transformer的论文, 主要内容为随着我国的基础设施建设的高速发展以及道路通行车辆的不断增加,道路路面不可避免的就会出现裂缝等病害,对正常的交通运输和车辆的安全驾驶都产生了不同程度的影响。因此,路面裂缝作为路面病害的早期阶段,对路面裂缝进行检测的工作非常重要。而现阶段的路面裂缝检测中,大多数采用人工检测的方法,存在着检测效率低、检测精度低以及影响正常交通运行的缺点,还有部分采用机器学习进行道路裂缝检测的方法,在复杂环境下存在对裂缝图像识别准确率较低、鲁棒性较差的问题。因此,针对以上问题,本文对路面裂缝图像的分类和分割两项关键技术进行了研究,提出一套基于深度学习的路面裂缝提取方法,该方法包括图像预处理、裂缝分类和裂缝分割等技术,对路面图像的处理流程主要是先对路面图像进行预处理,然后对经过预处理后的图像进行分类,最后对分类后有裂缝的图像进行分割提取操作。首先,本文提出了一种基于卷积神经网络的裂缝分类模型RGNet。该模型针对残差网络模型复杂、参数量大的问题,将Ghost Net中的“幻影”结构引入残差模块后,再融合卷积注意力模块(Convolutional Block Attention Module,CBAM)注意力机制,在保证模型分类准确率的同时减少了模型的参数。针对裂缝图像中裂缝区域占比很小的特点,进行了图像增强。并且对交叉熵函数进行改进,采用加权交叉熵函数,缓解了裂缝样本不均匀的问题,实现了对路面裂缝的精准判断。接着在对裂缝图像完成分类的基础上,本文提出两种方法对有裂缝的图像进行分割。第一种方法是在传统的UNet模型的基础上进行改进,提出了RSAUNet分割模型。针对原始UNet模型分割精度低和未充分考虑图像不同区域之间的相互关系的问题,在UNet的下采样和上采样的过程中采用优化后的残差连接,在跳跃连接的部分加入自注意力机制。针对裂缝分割图像中的连通性问题,提出一种考虑像素连通性的交叉熵损失函数。为减少图像中的噪声干扰,对裂缝图像利用中值滤波的方式对路面裂缝图像进行预处理。这些改进使本文RSAUNet模型能有效处理位于复杂背景下的路面裂缝图像,实现对路面裂缝图像的像素级分割。第二种方法是尝试将在计算机视觉领域表现优异的Transformer应用到路面裂缝分割中,这是一个前人未做过的工作。本文提出了一种基于Transformer的裂缝图像分割模型Crack TUNet,该模型首先将卷积块和Transformer结合作为编码器的一部分,然后通过本文所提出的融合模块与UNet的编码器进行特征融合,旨在结合Transformer和UNet的优点,摒弃二者的缺点,以实现对路面裂缝图像的分割。最后通过实验表明,本文提出的裂缝分类模型RGNet和裂缝分割模型RSAUNet相较其他方法更优,具有良好的鲁棒性和有效性,具有理论意义和一定的工程应用价值。相较于本文第一种基于卷积神经网络的裂缝分割模型RSAUNet,第二种基于Transformer的裂缝分割模型效果还不是很理想。因此,如何将Transformer更好地应用在路面裂缝识别领域,将是本文日后的重点研究工作。
基于YOLOv5与U-Net3+算法的桥梁裂缝智能识别方法研究
这是一篇关于桥梁工程,裂缝识别,裂缝测量,YOLOv5,U-Net3+的论文, 主要内容为基于无人机、人工智能的桥梁结构健康监测和智能检测技术已成为当前桥梁工程界重点研究方向。为了克服传统数字图像处理方法进行桥梁裂缝识别时效率低、效果不佳等问题,本研究引入深度学习算法进行桥梁裂缝检测。首先,利用目标检测算法进行裂缝智能识别与定位;然后基于裂缝识别结果,利用图像分割算法进行裂缝像素高精度提取,进而计算裂缝宽度及长度信息,实现裂缝高精度识别定位与信息自动提取一体化。本文所提出的方法可实现桥梁裂缝高效率、高精度、智能化检测,有效降低了桥梁检测工作的风险与成本,具有较强的工程应用前景和社会价值。主要研究内容如下:(1)构建了深度学习模型训练数据集,同时通过研究测试图像采集与预处理方法,建立了裂缝检测模型的测试图像库。利用裂缝公开数据集,通过人工注释裂缝信息,构建了包含4414张裂缝图像的裂缝识别数据集与包含708张裂缝图像的裂缝分割数据集,并采用数据增强方法提升裂缝训练样本的丰富性。规划无人机飞行路线,利用M210 RTK无人机平台采集桥塔测试图像,并通过对无人机图像采用不同的灰度化及滤波去噪方法进行对比分析,确定了加权平均值法、中值滤波以及25%重叠裁剪的测试图像预处理方法。(2)研究深度学习目标检测算法,构建了基于YOLOv5算法的桥梁裂缝识别定位模型。利用裂缝识别数据集,并通过对YOLOv5算法的宽度、深度参数以及边界框损失函数进行优化调整,训练并构建了裂缝识别定位模型。以桥塔图像为测试对象,裂缝识别准确率、召回率及F1分数分别达到91.55%,95.15%,93.32%,实现了裂缝高精度识别定位。(3)研究深度学习图像分割算法,构建了基于U-Net3+算法的裂缝分割模型,同时结合连通域去噪、边缘检测、形态学处理,建立了基于八方向搜索的裂缝宽度测量法。利用裂缝分割数据集,引入结合深度监督策略及预测输出模块的U-Net3+图像分割算法,训练并构建了裂缝分割模型。采用被裂缝识别定位模型成功识别的桥塔裂缝图像对模型分割精度进行评估,裂缝分割结果的总体准确率、召回率和F1分数分别达到93.02%、92.22%和92.22%,实现了裂缝像素高精度提取。同时,基于U-Net3+裂缝分割结果,去除图像噪声,提取裂缝边缘与骨架,最终通过八方向搜索法实现了裂缝长度、宽度的像素级测量。
基于深度学习的建筑裂缝识别方法研究
这是一篇关于深度学习,注意力机制,NDAM,裂缝识别,目标检测,YOLOv5算法的论文, 主要内容为近年来,基于深度学习的建筑物损伤检测算法被广泛应用在建筑裂缝识别和建筑裂缝目标检测这两个任务上。深度卷积神经网络和相应的目标检测算法不仅可以更加智能合理的提取图像特征,并且在经过大量数据训练后,模型具有优异的准确性和泛化能力。本文针对裂缝识别和裂缝目标检测两个重要问题展开了深入研究。主要研究内容和成果如下:(1)搭建无人机采样平台,通过无人机高空采集与互联网开源数据集相互结合的办法,构建了含有16700张照片的建筑裂缝分类数据集和4000张照片的建筑裂缝目标检测数据集。(2)研究了不同深度的Res Net残差网络(Res Net18、Res Net34和Res Net50)的网络结构和算法原理。深入探究了Se Net(Sequeeze and Excitation Networks)、BAM(Bottleneck Attention Module)和CBAM(Convolutional Block Attention Module)三种不同的注意力机制的算法原理。(3)在已有的注意力机制的基础上,克服其存在的推理速度与准确率无法兼顾的问题,提出了一种可以嵌入到任何网络结构中的并且适用于裂缝检测的新型注意力机制NDAM(Novel Dual Attention Mechanism,NDAM),NDAM模型结构相较于其它注意力机制准确率更高、运算复杂度更低。搭建了15种不同深度的Res Net网络和上述四种注意力机制相结合的模型进行实验,结果显示Res Net+NDAM注意力模块的性能,在裂缝分类数据集上显著超过了Res Net+Se Net、Res Net+BAM和Res Net+CBAM这三大类模型。其中Res Net18+NDAM模型的性能最强,在裂缝分类数据集上的准确率为99.5%。(4)采用梯度加权类激活热力图(Gradient-weighted Class Activation Mapping,Grad Cam)可视化算法,分析了Res Net18+NDAM中的4个卷积块的类激活热力图,结果显示Res Net18+NDAM网络的识别判断依据是十分准确的,可以准确地学习到裂缝和非裂缝的区别,这增强了所提算法的有效性和可解释性。(5)分析了YOLOv3、YOLOv4以及YOLOv5的算法原理、训练技巧和网络结构。采用迁移学习的方法在裂缝数据集上训练了YOLOv3和YOLOv5两个模型,并测试了其性能指标。结果显示,在裂缝目标检测数据集上,YOLOv5相较于YOLOv3,在推理速度和识别性能上都有了显著提升。
地铁隧道表面裂缝自动识别系统的设计与实现
这是一篇关于裂缝识别,基于快速卷积神经网络特征提取区域推荐算法,目标检测,开源框架的论文, 主要内容为近年来,随着城市地铁运营里程和线路的快速增长,大量的基础设施,尤其是地铁隧道,由建设期转入养护期,设施面临着自身结构老化及外来因素损害等病害的影响。对于地铁隧道而言,隧道表面的裂缝成为地铁运营安全的隐患之一。而地铁隧道病害的检测,目前主要依靠人工巡检及肉眼判断,检测结果受人为因素影响较大,导致检测结果既不充分而且效率低下,因此,采用计算机技术和图像处理技术自动、有效、高速识别地铁隧道裂缝,成为目前地铁检测现代化的热点问题之一。在这一背景下,论文设计了地铁隧道表面裂缝自动识别系统,该系统是以面向对象,移植性高的Java语言开发,并采用当下较为流行的SSH(Struts+Spring+Hibernate)开源框架,数据库采用体积小,速度快的MySQL关系型数据库,对裂缝信息的检测识别采用是目前识别度高,识别速度快的用于快速特征嵌入的卷积体系结构(Caffe)框架下基于卷积神经网络特征提取区域推荐(Faster R-CNN)算法进行裂缝识别。论文的主要工作如下:(1)首先,论文介绍了本系统的开发背景和国内外研究现状,并阐述了本系统开发过程中使用到的目标检测技术。(2)论文根据隧道表面裂缝自动识别系统的功能需求,确定了系统的整体架构,包括系统的软件架构和技术架构。进而对系统的总体功能结构和数据库结构也进行了设计。(3)论文对该系统的详细设计、实现过程和测试过程进行了阐述。在该部分,详细介绍Faster R-CNN算法网络模型训练,以及各个功能模块的业务处理逻辑的设计方案。论文应用表明,本文设计的地铁隧道表面裂缝自动识别系统的识别效率和识别准确率均达到较好的水平。此外,该系统通过对当前最新目标检测技术Faster R-CNN的应用,实现对地铁隧道裂缝的自动检测与定位,并以此建立隧道裂缝病害分布数据库,通过历史数据对比,分析洞体变形与裂纹的发展趋势,及时指导维修人员对裂缝修复养护。
基于深度学习的建筑裂缝识别方法研究
这是一篇关于深度学习,注意力机制,NDAM,裂缝识别,目标检测,YOLOv5算法的论文, 主要内容为近年来,基于深度学习的建筑物损伤检测算法被广泛应用在建筑裂缝识别和建筑裂缝目标检测这两个任务上。深度卷积神经网络和相应的目标检测算法不仅可以更加智能合理的提取图像特征,并且在经过大量数据训练后,模型具有优异的准确性和泛化能力。本文针对裂缝识别和裂缝目标检测两个重要问题展开了深入研究。主要研究内容和成果如下:(1)搭建无人机采样平台,通过无人机高空采集与互联网开源数据集相互结合的办法,构建了含有16700张照片的建筑裂缝分类数据集和4000张照片的建筑裂缝目标检测数据集。(2)研究了不同深度的Res Net残差网络(Res Net18、Res Net34和Res Net50)的网络结构和算法原理。深入探究了Se Net(Sequeeze and Excitation Networks)、BAM(Bottleneck Attention Module)和CBAM(Convolutional Block Attention Module)三种不同的注意力机制的算法原理。(3)在已有的注意力机制的基础上,克服其存在的推理速度与准确率无法兼顾的问题,提出了一种可以嵌入到任何网络结构中的并且适用于裂缝检测的新型注意力机制NDAM(Novel Dual Attention Mechanism,NDAM),NDAM模型结构相较于其它注意力机制准确率更高、运算复杂度更低。搭建了15种不同深度的Res Net网络和上述四种注意力机制相结合的模型进行实验,结果显示Res Net+NDAM注意力模块的性能,在裂缝分类数据集上显著超过了Res Net+Se Net、Res Net+BAM和Res Net+CBAM这三大类模型。其中Res Net18+NDAM模型的性能最强,在裂缝分类数据集上的准确率为99.5%。(4)采用梯度加权类激活热力图(Gradient-weighted Class Activation Mapping,Grad Cam)可视化算法,分析了Res Net18+NDAM中的4个卷积块的类激活热力图,结果显示Res Net18+NDAM网络的识别判断依据是十分准确的,可以准确地学习到裂缝和非裂缝的区别,这增强了所提算法的有效性和可解释性。(5)分析了YOLOv3、YOLOv4以及YOLOv5的算法原理、训练技巧和网络结构。采用迁移学习的方法在裂缝数据集上训练了YOLOv3和YOLOv5两个模型,并测试了其性能指标。结果显示,在裂缝目标检测数据集上,YOLOv5相较于YOLOv3,在推理速度和识别性能上都有了显著提升。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈 ,原文地址:https://m.bishedaima.com/lunwen/51213.html