基于卷积神经网络的名片识别研究
这是一篇关于名片识别,OCR,文本区域检测,去模糊,YOLO的论文, 主要内容为光学字符识别(OCR)目前在证件识别以及文档识别上有广泛的应用,通过将文字的图片数字化,从中快速提取出有用信息。传统的光学字符识别算法大多依赖于人工设计特征,通过模板匹配的方法实现特定场景的识别,因此,适用场景比较单一,泛化能力较差,处理名片识别的任务时效果不佳。此外,在处理文字间存在噪声干扰的图像上,传统的卷积递归神经网络(CRNN)的检测效果也不理想。因此针对上述问题,文本重点研究了基于深度学习的OCR名片识别从而弥补传统识别系统的不足。本文从信息提取的角度出发,利用OCR技术识别名片信息,进而将名片信息电子化,实现名片数据的结构化存储。基于传统方法以及当今主流方法的分析,文本进行了适当的改进与优化,实现了一种全新的基于卷积神经网络的OCR识别系统。在图像预处理方面,本文设计了一套针对于名片图像的预处理流程,如边缘检测,倾斜矫正等,以消除图片干扰因素的影响,并且,针对相机抖动造成的图像模糊情况,本文提出并实现了一种基于编码器/解码器网络的去模糊模型,以提高后续字符识别的效果;在文本区域检测方面,本文提出并实现了针对名片识别的文本区域检测方法,基于YOLO网络,使用固定宽度的文本图像,最终检测准确率提高了0.6%;在文本识别方面,为提高中英文混排情况下的识别率,进行了针对性的训练,使文本识别的准确率提高了1.6%。最后,在系统实现上,设计了系统的人机交互模式,采用B/S架构,在前端Web服务器上采用了高效的Flask框架。在后台服务器上,将OCR的各流程进行了模块化的设计,最终返回结构化的输出结果。
基于轻量化YOLO模型的火焰检测方法研究与应用
这是一篇关于火灾预警,火焰检测,YOLO,轻量化,注意力机制的论文, 主要内容为火焰检测是火灾智能化防控关键技术,通过预警人们能够有效减少损失。传统火焰检测方法依赖人工特征提取,模型的普适性应用较差。深度学习目前已成为火焰检测方法研究的主流,并在复杂环境中拥有较好的表现。但是基于深度学习的火焰检测方法应用于火灾预警时,需要保证火焰检测方法具有较高的实时性和准确性,因此本学位论文选取YOLOv5s为基线模型,提出了轻量化的火焰检测方法。首先,针对模型体积较大不利于嵌入式设备部署的问题,本文分别提出了基于Mobile Netv2、Mobile Netv3和Ghost Net的轻量化方法,通过使用三种轻量级网络瓶颈块对主干网络进行重构,借鉴深度可分离卷积以及Ghost模块思想实现模型轻量化设计;为获取关联性更强的特征信息,引入协调注意力机制来优化主干网络,以此提高特征图的表征能力。其次,针对小目标火焰检测欠佳的问题,本文设计了两种优化模块。第一种为小目标检测模块,通过增加特征融合网络P2检测层和预测网络目标检测器,实现在更高分辨率特征图中对小目标火焰进行检测。另一种为特征融合模块,该方法在特征融合网络中对低层特征层进行跨路径连接,避免了经过上下采样多次融合之后低层特征信息容易丢失的问题,以此来优化小目标检测性能。最后,根据火焰单类别任务特性重定义了损失函数,采用含有预测框和真实框中心点欧氏距离的CIo U替换位置回归损失部分,整合置信度损失和分类损失,达到加速模型训练收敛速度和提高抗干扰性效果。并利用提出的改进方法设计了一种采用Ghost Net的YOLOv5s改进模型的火焰检测算法。实验结果表明,基于上述三种轻量化方法改进之后的新模型体积均得到有效压缩,并且检测效果均优于基线模型,其中基于Ghost Net轻量化方法改进的新模型参数量最小,引入注意力机制后增益效果明显,此方法为最佳方案。相比YOLOv5s算法,本文提出的火焰检测算法参数量下降了34.9%,在自制的火焰测试集中无差别目标和小目标检测的m AP为0.884和0.908,分别提升了3.0%和4.1%,并且在RTX 2080上取得了88.1FPS的平均推理速度。此外,在嵌入式平台Jetson Nano上对不同分辨率的火灾视频进行了测试,高分辨率和低分辨率测试视频的推理速度分别为3.8FPS和6.3FPS,测试结果表明本文提出的火焰检测方法可以部署在嵌入式设备中,具有进一步开发基于火焰检测的实时火灾预警系统的可行性应用。
机场净空区基于YOLO的无人机识别算法研究
这是一篇关于无人机,目标检测,深度学习,YOLO,Flask框架的论文, 主要内容为近年来,通用航空事业不断发展壮大,无人机进入了人们生活的各个领域,为人们带来了极大的便利,然而在无人机带给人们便利的同时,也出现了越来越多的无人机违规飞行事件如利用无人机进行恐怖袭击等,给国家和社会带来了经济损失,并且产生了较大的负面影响,无人机的违规飞行会极大地影响着国家经济的发展,威胁着国家的安全。为了保障机场的安全运行,机场设立了净空区,规定净空区内不得飞行无人机,为确保机场净空区的净空要求,需要对无人机进行检测,但是由于无人机大小不一、种类各异,很难找到一种通用的无人机检测技术,为了满足实际需要,本文设计了一种机场净空区基于YOLO的无人机识别算法并开发了一套无人机识别系统,提高了机场检测无人机的准确率,论文的主要内容如下:首先,论文介绍了数据集的构建和数据预处理的方式,主要介绍了数据标注的方法和原则,然后针对数据集图片数量不足的问题,介绍了数据增强的方法,以Mosaic法为例介绍了数据增强的具体步骤和功能。其次,论文研究了YOLO系列中的YOLOv3算法,首先介绍了YOLOv3算法网络结构,然后分别从特征提取、特征融合和分类预测部分介绍了网络的具体内容,针对YOLOv3网络实时性较差、准确率低等问题,论文进而研究了YOLOv4模型,首先介绍了YOLOv4的网络结构,依次介绍了空间金字塔池化结构、像素聚合网络结构和损失函数部分,YOLOv4网络提升了准确率,并且降低了模型大小,但是实时性方面没有明显提升,依然不能满足实际工程的需要,因而进行了进一步的研究。再次,论文研究了YOLOv5算法并从数据集方面进行了改进,首先介绍了YOLOv5算法网络结构,然后介绍了Focus和CSP结构,论文在此基础上又在数据集方面进行了一些创新,提出了数据质量评估算法和对多目标无人机数据集进行扩充,避免了非模型因素对网络的干扰以及提高了模型对多目标无人机的检测能力,实验结果表明,改进YOLOv5的准确率提升到88.28%;其权重文件仅为7.3MB;视频检测的每秒处理帧数可达每秒53帧,改进后的YOLOv5模型能较好地实现无人机的实时检测,在保证准确率的同时大幅度提升了推理速度。最后,开发了一套无人机识别系统,基于Flask框架实现了Web端对模型的调用,分析了系统的功能性需求和性能需求,从系统整体流程、视频流读取设计、模型配置设计和可视化界面设计方面对系统进行了介绍,最后给出了设计页面的展示结果。
基于监控视频的电梯轿厢内禁入目标检测算法研究与实现
这是一篇关于电梯轿厢,目标检测,栈式自编码器,YOLO,卷积神经网络的论文, 主要内容为箱式电梯的使用在生活中愈加普及,但电梯轿厢空间狭小,一些乘客携带劣犬等物体进入电梯可能会造成乘客的人身安全损失,或引起电梯运行安全问题。利用计算机视觉技术实现基于监控视频的禁入目标检测,在电梯安防领域具有较强的学术意义和工程意义。本文应江苏省特种设备安全检验监督研究院无锡分院要求,研究基于电梯监控视频的禁入目标检测算法,并设计了禁入目标检测子系统,提供检测数据给电梯监控平台。针对电梯监控视频的分析处理,先判断了电梯内是否有物体,再执行目标识别。本文以犬类为禁入目标的典型代表,对犬类目标识别开展实验,针对电梯轿厢环境,制作了本文所需的数据集,选用了三种不同类型的目标识别算法展开研究并改进。基于HOG特征和SVM分类器的算法比较了不同人工特征的识别效果;采用HOG结合栈式自编码器网络的改进算法相比原算法识别率有约10%的提升;基于YOLO卷积神经网络的算法在添加批规范化操作、改善损失函数等改进后识别效果较好,测试集下查全率达83%。最后比较了三个算法对电梯监控视频的检测效果,改进YOLO算法在GPU支持的条件下有较好的识别效果,并且能够满足在线检测的要求。本文采用B/S架构设计实现了基于电梯监控视频的禁入目标检测子系统,完成了禁入目标检测、目标检测数据存储以及检测结果展示网站。在实验轿厢中运行结果表明检测系统能够识别禁入目标,系统运行稳定。
基于机器视觉的高空灯诱害虫智能识别系统的研究与实现
这是一篇关于高空灯诱害虫,机器视觉,智能监测,YOLO,Android的论文, 主要内容为水稻迁飞害虫每年给水稻的生产造成严重的产量与经济损失,做好水稻迁飞害虫的种群动态监测对准确指导害虫防治工作具有重要的意义。高空测报灯是专为迁飞害虫测报研发的设备,它利用昆虫的趋光性诱捕在高空中飞行的昆虫,从而掌握其迁入时间、迁入量等信息用于指导防控工作。相比于监测迁飞昆虫的昆虫雷达,高空测报灯具有诱集昆虫量大、害虫消长曲线明显、应用成本低等优点。但是目前基于高空测报灯的测报工作需要人工对目标害虫进行识别计数,存在识别效率低、劳动强度大、数据不可追溯等问题,难以满足大范围水稻迁飞害虫实时测报的需求。为了替代水稻迁飞害虫的人工识别,本文设计并建立了高空测报灯的机器视觉模块,以稻纵卷叶螟(Cnaphalocrocis medinalis)、褐飞虱(Nilaparvata lugens)、白背飞虱(Sogatella furcifera)3种水稻迁飞害虫和非迁飞害虫二化螟(Chilo suppressalis)为研究对象,建立了基于机器视觉的高空灯诱害虫自动识别模型,开发了高空灯诱害虫智能识别系统,实现了高空迁飞害虫的自动化识别和实时监测。主要研究内容与结果如下:(1)设计并建立了高空测报灯的机器视觉模块。针对传统高空测报灯自动化程度低、需要人工进行识别计数的问题,本文在传统高空测报灯的基础上设计了带有多层散虫结构的机器视觉模块。该模块以Android工业平板为控制中枢,使用多层散虫结构分散昆虫,并调用工业相机对分散后的昆虫进行拍照。同时,使用基于机器视觉的高空测报灯采集灯诱害虫图像数据,并使用Label Img工具进行标注形成高空灯诱害虫图像数据集。(2)研究并比较了四种基于深度学习的高空灯诱害虫检测模型。为了选出适合高空灯诱害虫的检测模型,训练和测试了Faster R-CNN、YOLOv3、YOLOv4、YOLOv5四种目标检测算法。结果表明,YOLOv4综合性能优于其他三种模型,它的运行速度为0.95帧/秒,对二化螟、稻纵卷叶螟、白背飞虱和褐飞虱的识别准确率分别达到了77.73%,73.66%,66.72%和71.27%,展现出了识别速度较快,检测精度较高,移植性强的特点,更加贴合实际应用需求。因此,选取YOLOv4模型作为高空灯诱害虫识别的基础模型。(3)建立了基于YOLO-LPNet的高空灯诱害虫识别模型。为提高高空灯诱害虫识别模型的检测效果,本文以YOLOv4模型为基础进行改进,提出了高空灯诱害虫识别模型YOLO-LPNet。针对小目标害虫在图像中所占的面积比例较小,特征提取网络提取出有效特征效果较差的问题,在模型中引入了交叉滑窗取样方法,有效提高了小目标害虫特征显著性,改善了模型的漏检问题;同时,引入了SENet通道注意力机制改善目标害虫与干扰害虫之间的误检问题,提升了目标害虫检测的召回率与精确率。YOLO-LPNet对二化螟、稻纵卷叶螟、白背飞虱和褐飞虱的识别准确率分别达到了85.76%,90.94%,74.80%和71.67%,分别提升了8.03,17.28,8.08,0.40个百分点;召回率分别达到了90.80%,86.01%,73.28%,81.39%,分别提升了19.85,25.88,18.04,22.15个百分点。(4)建立并测试了基于机器视觉的高空灯诱害虫智能识别系统。针对基于传统高空测报灯的测报工作人工投入大、数据难以追溯的问题,本文建立了包括基于机器视觉的高空测报灯、服务器端和Android客户端三部分的高空灯诱害虫智能识别系统。使用Django框架进行服务端程序开发;创建My SQL数据库以存取信息;利用Android Studio开发Android客户端。系统开发完成后,在云服务器上部署了该系统并进行了测试,以验证其可靠性。结果显示,系统的功能完整性、Android端稳定性、运行速度等指标均符合预期效果。该系统识别图像FPS达0.65帧/秒,为实时、准确识别高空灯诱害虫提供了思路。
无人机检测跟踪及远程监控系统研究
这是一篇关于YOLO,KCF,目标检测跟踪,固定翼无人机,远程监控的论文, 主要内容为近些年来,小型固定翼无人机在治安巡查任务中得到了广泛运用。搭载智能视觉追踪算法的小型固定翼无人机已成为自主高效的完成隐蔽侦察、应急追踪、人员控制等急难险危任务的首选。然而,现有小型固定翼无人机基于视觉的目标捕获、监控,存在自主化程度低、设备成本高、应用场景固定、算法推理速度慢等问题,需要满足在有限的资源上实现高效的目标识别追踪技术。因此,本文通过搭建固定翼无人机实验平台,提出了高效的目标检测跟踪算法,并基于此方法,采用远程MQTT通信的方式,设计并实现了无人机目标远程监控系统,实现远程无人机自动目标检测跟踪及控制。通过现实场景下无人机飞行实验验证本文提出的可行的远程巡查方案,本文研究内容及研究成果有:(1)针对现有目标检测跟踪方法的不足,研究了目标检测跟踪方法的构建、改进、部署及应用。基于深度学习方法,提出了一种小型固定翼无人机高帧率与高精度的紧耦合目标检测跟踪方法即YOLO-KCF算法。首先,通过优化联合区域计算的,提高对检测成功率和准确率;其次,提出了一种双线程追踪机制,实现机载计算机性能的优化利用;最后,使用差帧校验的方式,提升跟踪响应速度和检测跟踪效果。实验证明在复杂背景下本文方法对地面静止或移动目标的自主检测精度可达85.7%,平均FPS为23.6,并能够达到毫秒级别的反应速度并实现跟踪控制,控制撞击精度可达0.95。提出的方法在目标检测跟踪领域具有一定的理论和实践意义,为固定翼无人机在实际应用中提供了有力的技术支持。(2)为实现目标检测跟踪紧耦合算法YOLO-KCF算法在远距离条件下的应用,研究设计了无人机远程监控的通信方法。在通信方式上,选择MQTT通信协议,对消息服务器框架进行设计,通过使用消息代理的方式,实现无人机与监控系统之间信息交互的发布-订阅模式。设计无人机自动通信机制实现无人机的消息与远程监控系统的内外场协同作业,从而保证本文方法需要的实时通讯能力。对实体对象的信息结构设计实现数据的高效存储和简洁的数据管理。(3)结合目标检测跟踪算法和远程通信手段,有针对性的设计了无人机远程监控系统软件。经过需求分析,对系统各个模块进行具体设计,设计了包括系统主界面模块、状态通信模块、图像显示模块、地图航点规划模块、数据管理系统模块、实时目标检测跟踪模块等功能模块,完整实现了本文远程监控系统各个模块的功能和对无人机的远程通信控制。
基于机器视觉的高空灯诱害虫智能识别系统的研究与实现
这是一篇关于高空灯诱害虫,机器视觉,智能监测,YOLO,Android的论文, 主要内容为水稻迁飞害虫每年给水稻的生产造成严重的产量与经济损失,做好水稻迁飞害虫的种群动态监测对准确指导害虫防治工作具有重要的意义。高空测报灯是专为迁飞害虫测报研发的设备,它利用昆虫的趋光性诱捕在高空中飞行的昆虫,从而掌握其迁入时间、迁入量等信息用于指导防控工作。相比于监测迁飞昆虫的昆虫雷达,高空测报灯具有诱集昆虫量大、害虫消长曲线明显、应用成本低等优点。但是目前基于高空测报灯的测报工作需要人工对目标害虫进行识别计数,存在识别效率低、劳动强度大、数据不可追溯等问题,难以满足大范围水稻迁飞害虫实时测报的需求。为了替代水稻迁飞害虫的人工识别,本文设计并建立了高空测报灯的机器视觉模块,以稻纵卷叶螟(Cnaphalocrocis medinalis)、褐飞虱(Nilaparvata lugens)、白背飞虱(Sogatella furcifera)3种水稻迁飞害虫和非迁飞害虫二化螟(Chilo suppressalis)为研究对象,建立了基于机器视觉的高空灯诱害虫自动识别模型,开发了高空灯诱害虫智能识别系统,实现了高空迁飞害虫的自动化识别和实时监测。主要研究内容与结果如下:(1)设计并建立了高空测报灯的机器视觉模块。针对传统高空测报灯自动化程度低、需要人工进行识别计数的问题,本文在传统高空测报灯的基础上设计了带有多层散虫结构的机器视觉模块。该模块以Android工业平板为控制中枢,使用多层散虫结构分散昆虫,并调用工业相机对分散后的昆虫进行拍照。同时,使用基于机器视觉的高空测报灯采集灯诱害虫图像数据,并使用Label Img工具进行标注形成高空灯诱害虫图像数据集。(2)研究并比较了四种基于深度学习的高空灯诱害虫检测模型。为了选出适合高空灯诱害虫的检测模型,训练和测试了Faster R-CNN、YOLOv3、YOLOv4、YOLOv5四种目标检测算法。结果表明,YOLOv4综合性能优于其他三种模型,它的运行速度为0.95帧/秒,对二化螟、稻纵卷叶螟、白背飞虱和褐飞虱的识别准确率分别达到了77.73%,73.66%,66.72%和71.27%,展现出了识别速度较快,检测精度较高,移植性强的特点,更加贴合实际应用需求。因此,选取YOLOv4模型作为高空灯诱害虫识别的基础模型。(3)建立了基于YOLO-LPNet的高空灯诱害虫识别模型。为提高高空灯诱害虫识别模型的检测效果,本文以YOLOv4模型为基础进行改进,提出了高空灯诱害虫识别模型YOLO-LPNet。针对小目标害虫在图像中所占的面积比例较小,特征提取网络提取出有效特征效果较差的问题,在模型中引入了交叉滑窗取样方法,有效提高了小目标害虫特征显著性,改善了模型的漏检问题;同时,引入了SENet通道注意力机制改善目标害虫与干扰害虫之间的误检问题,提升了目标害虫检测的召回率与精确率。YOLO-LPNet对二化螟、稻纵卷叶螟、白背飞虱和褐飞虱的识别准确率分别达到了85.76%,90.94%,74.80%和71.67%,分别提升了8.03,17.28,8.08,0.40个百分点;召回率分别达到了90.80%,86.01%,73.28%,81.39%,分别提升了19.85,25.88,18.04,22.15个百分点。(4)建立并测试了基于机器视觉的高空灯诱害虫智能识别系统。针对基于传统高空测报灯的测报工作人工投入大、数据难以追溯的问题,本文建立了包括基于机器视觉的高空测报灯、服务器端和Android客户端三部分的高空灯诱害虫智能识别系统。使用Django框架进行服务端程序开发;创建My SQL数据库以存取信息;利用Android Studio开发Android客户端。系统开发完成后,在云服务器上部署了该系统并进行了测试,以验证其可靠性。结果显示,系统的功能完整性、Android端稳定性、运行速度等指标均符合预期效果。该系统识别图像FPS达0.65帧/秒,为实时、准确识别高空灯诱害虫提供了思路。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码客栈 ,原文地址:https://m.bishedaima.com/lunwen/45317.html