基于Transformer和深度卷积神经网络的路面裂缝检测方法研究
这是一篇关于路面裂缝的检测与分割,卷积神经网络,Transformer,多尺度特征融合,复杂环境的论文, 主要内容为当前公路建设里程持续增加,公路养护的重要性也逐渐凸显出来,即公路管理正逐步从规划建设到养护为主转变。路面病害检测是公路养护的重要基础环节,裂缝作为路面病害中的主要类型,其存在可以为养护措施提供指导信息。如果不能及时发现并修复裂缝病害,会增加公路的养护成本,并大大缩短公路的使用年限。因此,裂缝检测对确保交通运输的安全性和提高经济效益具有重要意义。早期检测路面裂缝的方法主要以人工实地调查为主,这种人工检测方式的缺点是成本高、效率低下,且检测结果易受到检测人员主观因素的影响。因此,有必要设计一种自动、准确和高效的路面裂缝检测方法。基于深度学习的路面裂缝检测方法相较于传统方法有巨大优势,尤其是深度卷积神经网络(Convolutional Neural Network,CNN),能够自动学习裂缝特征从而实现端到端的自动化检测。于是本文深入研究了基于CNN的路面裂缝检测算法和深度学习算法,总结了目前CNN在裂缝检测上存在的挑战与困难,发现卷积操作的局部性,复杂的路面检测环境,裂缝本身的特征不均性和多变的拓扑结构都会使得路面裂缝检测性能下降。特别是当光照不均导致裂缝和周围路面背景的对比度低和有背景噪声干扰的情况下,裂缝的边缘检测精度受限,这就要求模型需要有较强的长期依赖建模能力。卷积的优势在于提取局部信息,但是在长期依赖关系方面建模不足,Transformer弥补了CNN的不足,通过其特有的自注意力机制能够出色地建模输入像素之间的长期依赖关系和全局信息,但是局部信息提取不足。因此为了解决上述问题,本文结合CNN在处理底层视觉上的优势和Transformer在建模长期依赖关系上的长处,以提高模型检测性能为目标,提出有效的融合机制,设计了两种基于Transformer和深度CNN的路面裂缝检测方法以满足不同的检测需求:(1)基于裂缝的快速分类与定位需求,提出了一种融合Swin Transformer和YOLOX的路面裂缝的目标检测模型。该模型针对CNN对长期依赖关系建模不足的问题,通过引入Swin Transformer模块增强复杂环境下的裂缝特征提取能力并更好地保留输入图像的边缘细节信息,以提高裂缝检测的精度;设计了全局注意力引导模块来改进特征金字塔的特征融合方式,以高层语义信息引导低层空间细节信息,有效提升多类、多尺度裂缝特征融合能力;在后处理阶段应用α-Io U-NMS来提高遮挡、重叠目标的检测精度。实验结果表明,在保证实时性的前提下,该模型的m AP相较于原始的YOLOX模型提高了3.37%,能够为公路中的车载低成本路面裂缝检测提供参考价值。(2)基于裂缝的精确分割需求,提出了一种基于Swin Transformer和U-Net的像素级路面裂缝检测算法。该模型针对复杂环境下具有复杂拓扑尺度关系的裂缝检测精度不高的问题,在编码的高级语义特征图后引入融合Swin Transformer的多尺度空洞卷积模块,能够在复杂路面环境中精准捕捉裂缝边缘特征,获取更加精细的裂缝边缘分割效果;针对裂缝像素与背景像素数量相差过大形成的样本不平衡问题,提出一种融合Dice Loss和Focal Loss的损失函数,以应对正负样本不平衡的裂缝数据集,并专注于难分样本的学习。针对改进后的模型参数量增大、推理速度下降的问题,本文利用Ghost模块去除解码器中的冗余特征图从而达到轻量化模型的目的。实验证明,改进后的模型相比于原始的U-Net在参数量相差不大的情况下,将m Io U指标提高了1.27%,FPS也增大了3.56fps。该像素级检测模型能够生成全局图像分析结果,有助于后续裂缝的精细分类与严重程度的量化测量。总之,本研究提出基于深度CNN和Transformer融合的检测方法,能够为路面裂缝检测与识别领域提供新的思路和方法,也可以给研制自动化检测装置提供一定的技术、理论支持。同时,本文也探索了二者之间的融合机制,能够为CNN和Transformer的融合研究在工业、农业生产等领域的实际应用提供一定的意义。
复杂环境下声音事件检测与定位技术的研究
这是一篇关于复杂环境,声音特征,声音事件检测,声源定位,神经网络的论文, 主要内容为声音事件检测与定位技术在环境监测、智能家居、智能交通等领域具有广泛的应用前景。在复杂环境下受到非平稳噪声、混响、定向干扰等因素的影响,声音事件检测与定位的精度较低。因此,本论文将实现在复杂环境下声音事件检测与定位为目标,从声音特征提取、声音的事件检测、声源的定位等方面展开研究。论文主要工作包括:(1)研究声音特征提取方法。针对声音信号中的受到非平稳噪声干扰,导致声音事件检测准确率低问题,提出基于变分模态分解(Variational Mode Decomposition,VMD)的Gammatone频率系数特征(GFCV)。针对多声音重叠的声源定位,提出用于FOA格式声音的基于强度差的声源定位特征(GCVV)与用于MIC格式声音的基于相位差的声源定位特征(GCVP)。在真实环境噪声数据集中,GFCV特征相较于对数梅尔特征,F1-score提升0.81%、1.14%、1.16%、1.17%。在最大声音重叠数为3的数据集中,GCVV、GCVP特征相较于强度矢量、广义互相关相位变换特征的定位误差分别降低1.3°与1.1°,定位召回率分别提升2.9%与2.5%。(2)研究声音事件检测方法。针对现实环境中声音事件检测受到非平稳噪声的干扰,精度严重下降问题;采用大量强标记(包含声音事件类别、开始时间和偏移时间注释)声音数据训练,耗费昂贵的人工标记成本问题。本文提出基于卷积循环神经网络的弱标记半监督声音事件检测方法(CIRAS)。首先,构建了门控卷积双向独立循环神经网络(GCBIndRNN),通过RNN层间残差连接来增加CRNN网络深度,使网络训练的模型更加拟合,提升声音事件检测的性能;其次,在GCBIndRNN网络中引入高效通道注意力使网络在背景噪声下更加关注声音事件特征;最后,建立样本关系一致性平均教师半监督模型,有效地利用弱标记声音数据(包含声音事件类别)和未标记声音数据输入对神经网络训练,实现网络输出强标记的声音事件检测结果。在真实环境噪声数据集中进行实验,CRIAS方法相较于DCASE Task4 2018与2019的基线系统,F1-score提升2-18%。(3)研究声源定位方法。针对小样本的声源定位,本文提出一种基于特征频谱的数据扩充方法(LSA),将生成的数据与原数据送入网络模型训练,促进神经网络的拟合。针对混响与定向干扰下的声源定位,提出一种基于ResT-Net的声源定位方法。该方法首先将强度差或相位差两种不同特征输入,其次利用两层卷积提取与整合特征维度,再使用Res2Net提取多尺度的特征,然后利用Transformer模块提取多尺度特征中的时间上下文关系,最后通过反向传播算法来优化模型,实现声源定位。在存在环境噪声、混响、定向干扰的TNSSE 2021的数据集中实验,本文方法在FOA和MIC格式声音的定位误差分别为20°和21.3°,定位召回率分别为60.3%和46.4%。
基于Transformer和深度卷积神经网络的路面裂缝检测方法研究
这是一篇关于路面裂缝的检测与分割,卷积神经网络,Transformer,多尺度特征融合,复杂环境的论文, 主要内容为当前公路建设里程持续增加,公路养护的重要性也逐渐凸显出来,即公路管理正逐步从规划建设到养护为主转变。路面病害检测是公路养护的重要基础环节,裂缝作为路面病害中的主要类型,其存在可以为养护措施提供指导信息。如果不能及时发现并修复裂缝病害,会增加公路的养护成本,并大大缩短公路的使用年限。因此,裂缝检测对确保交通运输的安全性和提高经济效益具有重要意义。早期检测路面裂缝的方法主要以人工实地调查为主,这种人工检测方式的缺点是成本高、效率低下,且检测结果易受到检测人员主观因素的影响。因此,有必要设计一种自动、准确和高效的路面裂缝检测方法。基于深度学习的路面裂缝检测方法相较于传统方法有巨大优势,尤其是深度卷积神经网络(Convolutional Neural Network,CNN),能够自动学习裂缝特征从而实现端到端的自动化检测。于是本文深入研究了基于CNN的路面裂缝检测算法和深度学习算法,总结了目前CNN在裂缝检测上存在的挑战与困难,发现卷积操作的局部性,复杂的路面检测环境,裂缝本身的特征不均性和多变的拓扑结构都会使得路面裂缝检测性能下降。特别是当光照不均导致裂缝和周围路面背景的对比度低和有背景噪声干扰的情况下,裂缝的边缘检测精度受限,这就要求模型需要有较强的长期依赖建模能力。卷积的优势在于提取局部信息,但是在长期依赖关系方面建模不足,Transformer弥补了CNN的不足,通过其特有的自注意力机制能够出色地建模输入像素之间的长期依赖关系和全局信息,但是局部信息提取不足。因此为了解决上述问题,本文结合CNN在处理底层视觉上的优势和Transformer在建模长期依赖关系上的长处,以提高模型检测性能为目标,提出有效的融合机制,设计了两种基于Transformer和深度CNN的路面裂缝检测方法以满足不同的检测需求:(1)基于裂缝的快速分类与定位需求,提出了一种融合Swin Transformer和YOLOX的路面裂缝的目标检测模型。该模型针对CNN对长期依赖关系建模不足的问题,通过引入Swin Transformer模块增强复杂环境下的裂缝特征提取能力并更好地保留输入图像的边缘细节信息,以提高裂缝检测的精度;设计了全局注意力引导模块来改进特征金字塔的特征融合方式,以高层语义信息引导低层空间细节信息,有效提升多类、多尺度裂缝特征融合能力;在后处理阶段应用α-Io U-NMS来提高遮挡、重叠目标的检测精度。实验结果表明,在保证实时性的前提下,该模型的m AP相较于原始的YOLOX模型提高了3.37%,能够为公路中的车载低成本路面裂缝检测提供参考价值。(2)基于裂缝的精确分割需求,提出了一种基于Swin Transformer和U-Net的像素级路面裂缝检测算法。该模型针对复杂环境下具有复杂拓扑尺度关系的裂缝检测精度不高的问题,在编码的高级语义特征图后引入融合Swin Transformer的多尺度空洞卷积模块,能够在复杂路面环境中精准捕捉裂缝边缘特征,获取更加精细的裂缝边缘分割效果;针对裂缝像素与背景像素数量相差过大形成的样本不平衡问题,提出一种融合Dice Loss和Focal Loss的损失函数,以应对正负样本不平衡的裂缝数据集,并专注于难分样本的学习。针对改进后的模型参数量增大、推理速度下降的问题,本文利用Ghost模块去除解码器中的冗余特征图从而达到轻量化模型的目的。实验证明,改进后的模型相比于原始的U-Net在参数量相差不大的情况下,将m Io U指标提高了1.27%,FPS也增大了3.56fps。该像素级检测模型能够生成全局图像分析结果,有助于后续裂缝的精细分类与严重程度的量化测量。总之,本研究提出基于深度CNN和Transformer融合的检测方法,能够为路面裂缝检测与识别领域提供新的思路和方法,也可以给研制自动化检测装置提供一定的技术、理论支持。同时,本文也探索了二者之间的融合机制,能够为CNN和Transformer的融合研究在工业、农业生产等领域的实际应用提供一定的意义。
复杂环境下多集群服务协同系统的设计与实现
这是一篇关于复杂环境,共享状态调度,Delta CRDT,带宽感知,预测,故障迁移的论文, 主要内容为随着服务复杂性的增加,服务对计算资源有着更大的需求。单集群难以满足服务对计算资源的需求。与单集群相比,多集群架构有着更灵活的设计,多个集群之间相互协作完成服务,有着更高的效率,因此成为近年来的研究热点。现有的多集群服务协同系统研究主要基于商业环境,对复杂环境下的研究较少。复杂环境如野外无人机集群作业,集群资源受限,且存在单点故障问题,对现有多集群服务协同系统影响较大。基于上述背景,本文设计并实现了一种复杂环境下的多集群服务协同系统。系统采用基于共享状态调度的去中心化模式,解决了复杂环境下的单点故障问题,且针对复杂环境下网络带宽受限、计算存储资源受限等情况做出了相应优化。实验表明,本文设计的系统能够在复杂环境下较好地工作,具有较高的资源利用率与较低的网络带宽占用,以及较好的可用性。本文主要创新工作阐述如下:1.复杂环境下多集群服务协同系统可用性的提高。本文采用基于共享状态调度的去中心化设计,集群之间相互独立,任意集群故障不影响系统的正常运行,解决了复杂环境下的单点故障问题。同时本文提出了基于一致性哈希算法的调度器故障迁移算法,当集群发生永久性宕机时,调度权归属于该集群调度器的服务会通过调度器故障迁移算法迁移至正常集群调度器,以保证集群宕机情况下服务的可用性。上述设计结合在一起,提高了复杂环境下多集群服务协同系统的可用性。2.复杂环境下多集群服务协同系统网络带宽占用的降低。本文改进了原Delta CRDT算法的状态同步子算法,提出了基于带宽感知的状态同步子算法,通过感知实时带宽动态调整同步周期,在同步速度相同的前提下具有更少的网络带宽占用。此外,本文对原Delta CRDT算法的Delta垃圾回收机制进行了改进,优化算法在成员宕机情况下的内存占用。3.复杂环境下多集群服务协同系统资源利用率的提升。本文融合了在线调度算法的实时性与离线调度算法的高资源利用率,通过预测服务资源需求,使用离线调度算法进行预分配,当服务未命中预分配策略时使用在线调度算法进行调度。实验结果表明,本文提出的基于预测的混合调度算法具有较好的实时性与较高的资源利用率。
基于SSM的复杂环境下交通安全速度预测系统设计与实现
这是一篇关于公路交通系统,公路交通安全,复杂环境,安全速度预测,SSM框架的论文, 主要内容为随着现代经济和科学技术的迅速发展,公路交通出行已经成为人们出行的主要方式之一,而公路交通安全是人们出行的基本前提和保障。公路交通系统是一个由驾驶员、车辆、公路和气象环境要素及其耦合关系组成的复杂动态系统,系统内各要素状态具有动态性,要素间的耦合关系也难以预测,为公路交通系统安全运行带来很多不确定性。公路交通安全本质是在复杂运行环境下保持系统内各要素间合理的空间关系,安全行驶速度是保障系统安全最为有效的手段之一。本论文基于公路交通安全本质,研究公路交通安全相关理论和复杂环境下交通安全速度预测方法,并开发了复杂环境下对车辆安全行驶速度进行预测的系统平台。基于该平台系统可以估算复杂环境下的安全运行速度,以及正常环境下的运行速度、复杂环境下的限制速度、侧滑侧翻临界速度等,并对当前气象环境进行评估和预警。本论文首先介绍了安全速度预测系统的国内外研究现状、研究意义和背景;其次,研究了公路交通安全的影响要素和安全速度预测系统开发技术及理论;再次,研究了系统需求、功能及数据库设计方法;最后,对安全速度预测系统进行了可用性和可靠性测试,验证了本文构建安全速度预测系统的有效性。本文考虑到复杂环境会对交通安全产生影响,从驾驶员状态数据、车辆状态数据、公路状态数据和气象环境数据等四个方面对系统内各要素及其耦合关系进行分析和处理,并采用Java面向对象编程语言、SSM框架和My SQL数据库对整个系统进行设计和开发。
复杂环境下葡萄叶部病害发生的等级研究
这是一篇关于OTSU阈值分割,U-net++,语义分割,EXG,复杂环境的论文, 主要内容为我国拥有全球第二大的葡萄种植面积,对于葡萄病害的识别防治更多依赖于农民与专家的经验,通过经验与人工识别对葡萄的病害等级进行划分,对病害的未来发展进行预估。这种方式更多依赖于经验主义,对葡萄园区的预估不够全面准确。葡萄叶片的采集多来自于自然状态下的拍摄,光照、拍摄角度、叶片堆叠都对实验结果造成着重要影响,本文对葡萄叶片数据进行标注,采用U-net++模型对葡萄叶片进行分割,葡萄叶片病害有着典型的植物叶片病害的所有特征,是分析复杂背景下植物叶片分割、病斑分割、病害分级的重要抓手。当前在计算机视觉领域对植物叶片的分割大多采用传统的分割方法,这些分割方法典型代表有k-means聚类算法、OTSU阈值分割算法、边缘检测算法,但这些算法存在难以摆脱人工干预的经验主义,但在进行一些特定的处理时仍具有优势。近年来随着深度学习领域在计算机视觉的应用逐渐广泛,深度学习的方式有望成为自动进行植物叶片分割的重要方式。本文对如何在复杂背景下进行葡萄叶片分割进行了实验研究,并且研究了如何准确对葡萄叶片病害等级进行分级。在深度卷积神经网络U-net的结构基础上使用了改进的跳接神经网络U-net++模型,编码器采用了Resnet18残差网络进行特征提取。在解决葡萄叶片从复杂背景的分割之后,本文采用了OTSU大津法阈值分割,在其中对二值化图像进行了EXG算法,强化了绿色向量,提取了葡萄叶片的绿色部分与病斑,改进了往常葡萄叶片以病斑为基础的植物叶片病害分级系统,解决了病斑难以分割误差大的缺点。对于本文所采用的方法使用纸样法进行了验证,证实了本文的方法可以高效的对葡萄叶片病害进行分级,并对实验室据进行了对比验证,结果真实有效。可以准确对葡萄叶片病害进行分级。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈 ,原文地址:https://m.bishedaima.com/lunwen/53098.html