面向图像分类的零代码平台的设计与实现
这是一篇关于图像分类,零代码平台,迁移学习,模型剪枝的论文, 主要内容为随着计算机视觉和深度学习技术的快速发展,图像分类技术在多个领域得到了广泛的应用,例如安防监控领域的人脸识别、物体识别,医学影像领域的病灶识别,自动驾驶领域的交通标志识别等。尽管图像分类技术得到了广泛应用,但仍面临诸多问题和挑战。针对这些问题与挑战,本论文的主要工作和创新点可以分为如下部分:(1)对于初学者和非技术人员来说,想要使用图像分类技术,需要具备一定的数学、计算机科学和统计学知识,使用特定的编程语言和框架,这是一个难以逾越的障碍。为了解决这一难题,本文设计了一种面向图像分类的零代码平台,该平台基于目前流行的微服务架构,根据业务需求将系统分为了数据集管理、多人协作、在线标注、模型管理四大模块,各个模块相互独立,实现了系统各个模块间的充分解耦。通过该平台,用户无需编码和掌握相关理论,只需要通过图形化操作就可以上传数据集、标记数据集、创建模型、训练模型、校验模型和部署模型,开发出满足个性化需求的图像分类应用。(2)图像分类开发往往需要大量的数据,但获取大量标记数据的成本高昂,模型复杂或训练数据集不足又容易导致过拟合。为了解决这一问题,该平台内置多个预训练模型,这些模型已在大规模数据集上进行了训练并具有良好的泛化能力,可用于迁移到新任务中。具体的,该平台采用迁移学习技术,使用预训练模型参数初始化特征提取网络,用户只需设置分类网络部分,从而满足图像分类应用需要。在微调阶段,对于模型过于复杂或训练数据集过少的情况,特征提取网络可以被冻结,仅对分类层进行优化;对于用户数据与预训练数据集相似度不高或训练数据集较多的情况,可选择微调整个模型,优化所有模型参数,包括特征提取网络,以提高模型在新任务下的特征提取能力。(3)由于图像分类模型需要大量的计算资源和内存来进行模型训练和推理,所以难以在边缘设备上部署和运行。为了解决这一问题,该平台采用了一种模型剪枝方法对模型进行压缩,该方法在卷积神经网络中每个通道分配一个缩放因子γ,并将其与通道输出相乘,然后对这些缩放因子施加简单的L1稀疏性正则化。在优化训练时,该算法将神经网络权重和这些分配的缩放因子一起进行训练,同时对缩放因子施加稀疏性正则化,以促进通道的稀疏化。最终,对于缩放因子趋近于零的通道,平台根据用户设置的压缩率进行裁剪,减少图像分类模型所需的计算资源和内存,从而使其适用于边缘设备。
基于模型剪枝的轻量化实例分割网络设计
这是一篇关于实例分割,边缘部署,模型剪枝,感知的论文, 主要内容为移动机器人常借助实例分割网络完成对周围环境的感知。然而现有的实例分割网络存在运算量大、实时性差等系列问题,无法在低算力的移动机器人平台上实时运行。本文首先提出了基于网络连接灵敏性的结构化剪枝方法(SPCS)。基于门变量连接灵敏性的神经元重要性评估模型能够更加准确地反应神经元的重要程度,实现高效准确的裁减。设计内循环算法,在动态剪枝过程中将剪除的重要的神经元恢复,减少了误剪除的可能性。同时融合知识迁移算法,将裁剪之前的大型网络习得的信息便捷地转移到裁剪后的结构紧凑的子网络之中,进一步提升剪枝后的网络性能。SPCS方法针对Res Net-101网络,实现削减40%浮点运算量的同时,精度反而拥有0.03%的提升,在解除网络过拟合方面有突出表现,其为大型网络的边缘部署提供了一种高效且通用性强的压缩与加速方法。其次构建高性能的单阶段实例分割网络(MADYNet)。构建基于多通道注意力分散机制的深度残差网络,并将其作为主干网络。采用步长为2的池化层以及步长为1的卷积层组建跨越连接,减少了3/4的空间语义信息损失。预测输出网络由基于FPN的实例掩膜生成网络以及基于双并行卷积网络的预测分类网络构成。所构建的单阶段实例分割网络在1080Ti硬件平台上实现了18.4的运行帧率,同时实现了33.36的分割精度,对比与YOLACT网络有51%的精度提升。最后运用SPCS算法对单阶段实例分割网络进行进一步的加速处理,并在移动平台进行部署测试其运行帧率及分割精度。本文所构建的轻量化网络MADYNet(tiny40%),在低算力的移动机器人平台TX2上首次实现了16.67 FPS的运行帧率,同时保留了29.57 m AP的分割精度。同YOLACT相比有304%的速度提升,以及38.4%的精度提升。
基于视频图像的驾驶员行为识别技术研究
这是一篇关于驾驶员行为识别,模型剪枝,深度学习,图像细粒度,视频理解的论文, 主要内容为随着社会主义现代化建设的深入,国民经济生活极大发展,截至目前,机动车保有量已位居世界第一。而交通事故的发生次数和伤亡人数也常年居高不下。据调查,80%以上的交通事故是驾驶员的不安全驾驶行为导致的,因此利用人工智能技术配备智能设备对驾驶员的驾驶行为进行实时监控和分析是十分必要的。本文将监控视频下驾驶员的行为做为研究对象,针对驾驶员行为识别的算法设计和软件设计展开研究,主要研究内容如下:(1)基于图像细粒度的驾驶员行为识别方法研究。针对现有的驾驶员行为识别算法存在特征表现能力不足、识别精度较低的问题,本文设计了一种基于图像细粒度的方法,结合注意力机制和细粒度判别模块,可以从全局角度自适应地发掘有效特征,抑制无效特征的表达,可以从局部角度,寻找具有代表性的判别块,该方法在保证较高精度的同时,计算量小,适用于后续的嵌入式平台部署。(2)基于时空建模的驾驶员行为识别方法研究。针对主流时空模型存在的时间和空间信息无法有效融合的问题,本文设计了特征激励模块捕捉动作在时间和空间之间的关系,提高时序动作建模能力;针对现有方法忽略了驾驶员场景下同一动作的速率具有多样性的问题,本文设计了特征调制模块可有效感知不同快慢的动作线索。本文的方法在驾驶员行为识别任务中,可实现有效算法精度提升,适合在高性能计算机平台部署。(3)驾驶员行为识别模型剪枝方法研究。针对现有方法在判断通道重要性时,只考虑当前需要裁剪的通道的范数,却忽略了与相邻层权重的依赖性问题,本文对通道的重要性评估时同时考虑了通道本身权重和与之相关的滤波器的权重。针对现有的通道剪枝方法只能对同层的通道排名、逐层裁剪的问题,本文采用了进化算法,学习各层的尺度因子和偏移因子,对所有层的通道进行排名,可实现全局统一剪枝。当前对多帧CNN模型的剪枝研究较少,本章的另一贡献是对多帧CNN模型的剪枝进行了实验研究。实验表明,本章提出的对通道剪枝的模型压缩算法适用于驾驶员行为识别的轻量化场景,可起到推理加速的效果,且造成的精度损失比现有的模型压缩方法更少。(4)嵌入式驾驶员行为识别软件设计。本文在Jetson TX2开发板上设计了嵌入式驾驶员行为识别软件。该软件的界面简洁美观,可以发挥开发板GPU的性能,通过模型解耦、多线程等技术,实现视频流下驾驶员行为的实时识别。
物流工业园区的异常行为检测系统的设计与实现
这是一篇关于异常行为检测,YOLO,目标检测,深度学习,模型剪枝的论文, 主要内容为随着互联网、电子商务的发展,目前我国的物流行业正处于蓬勃发展的阶段,但是在高速发展的同时又存在着许多容易被人们忽视的安全问题,如在工业园区违规使用手机、吸烟等的异常行为所产生的安全问题。采用实时监控与异常行为检测算法结合便是解决该问题的途径之一,即在不需要人力干预的前提下检测并记录物流园区所发生的异常行为。传统的基于数学方法的异常行为检测算法往往需要较大的时空复杂度,基于深度学习的异常行为检测算法可以简便地学习异常行为的特征以及较为快速地对异常行为进行识别。但是,目前已有的大多数据集只单独标注了一种异常行为,如果需要同时对多种异常行为进行识别则需要重新标注数据集,因而导致工作量以及模型识别时延的增加。因此本文提出基于YOLO的异常行为集成检测算法,该算法将YOLO的Backbone使用轻量级神经网络进行替换来提高速度,同时为增加普适性,将该Backbone进行结构调整并在所需要识别的异常行为开源数据集上进行训练来提高其特征提取能力,最后将该Backbone进行共享,将其提取到的特征输送到各自YOLO的Neck以及Head部分进行单独训练预测。为验证模型的性能,本文在四个开源数据集上与目前比较流行的异常行为检测算法进行比较。同时,本文设计并实现了一套前后端分离的异常行为检测系统。本系统将实时视频流传入检测模块,如果发生异常行为则会根据应用的异常行为检测算法进行标注并将该关键帧进行存储,便于后期进行责任划分,并且提供对所存储异常行为数据进行可视化分析的功能。本系统的前端是基于HTML的网页端应用,提供给用户简洁且易用的界面,后端采用Flask框架搭建Web服务,保证前端与后端数据的一致性。基于此完成了用户管理、实时检测、异常行为数据管理以及数据可视化功能模块的开发。
基于改进YOLOv5m的野生香菇检测研究
这是一篇关于野生香菇检测,YOLOv5m,轻量化改进,检测精度优化,模型剪枝的论文, 主要内容为野生香菇营养与药用价值高,是香菇产业的重要组成部分。传统人工采摘效率低下,且存在一定危险性。深度学习模型使得无人捡拾设备的应用成为可能,但经典目标检测模型往往参数量大,计算量多,不适用于低性能的嵌入式设备。为解决以上问题,提出了一种适用于野生香菇检测任务的改进YOLOv5m视觉检测模型,在保证精度前提下,缩减参数量,提升检测速率,以满足嵌入式设备的需求。主要研究内容如下:(1)构建野生香菇数据集:利用实地拍摄、网络引擎搜索等方式获取原始图片800张,通过数据集划分和扩增处理,得到训练集、测试集和补充测试集,数据量分别为1280、320、320。使用Label Img软件进行图像标注,K-means++算法针对标注信息进行锚框聚类。(2)基于比较实验选取YOLOv5m为基础框架,进行轻量化改进研究。主干结构采用Shuffle Netv2网络;在颈部网络中,设计BI-ASFF特征融合结构,在不降低特征提取效果的基础上,减少网络参数和计算量;针对卷积层,设计高效的Py-DWConv卷积块替代普通卷积以进行轻量化改进。实验结果表明,经过轻量化改进后,模型检测精度小幅下降,权重尺寸大幅减小,运行速率显著提升。(3)在轻量化模型基础上优化检测精度。在网络输出端引入SA注意力模块;改进训练损失函数,将GIo U Loss替换为αDIo U Loss作为定位损失,引入QFocal Loss作为置信度损失和分类损失;在后处理过程中,使用Weighted DIo U NMS算法优化预测框的选取过程。实验结果表明,经过精度优化改进后,模型检测精度提升,基本弥补模型轻量化造成的损失,检测速度与权重尺寸与轻量化模型相当。(4)检测模型应用研究,包含模型剪枝研究与野生香菇目标检测软件平台的开发。选用滤波器级结构化剪枝策略,经实验与分析,选择剪枝位置为颈部网络、剪枝率r=0.5的剪枝策略,在保证精确度的前提下进一步提高运行速率。为提高人机交互性,开发野生香菇检测软件平台:首先设计功能模块,其次依据功能设计进行软件开发,最后对检测页面控制子模块进行功能验证实验,结果显示软件平台可靠性高。改进的YOLOv5m模型相较于原始模型,权重尺寸深度压缩,检测速率显著提升,且在检测精度、运行速率等多方面优于其他轻量化检测模型,可为野生香菇嵌入式采摘设备的生产研发提供理论支持。
基于视频图像的驾驶员行为识别技术研究
这是一篇关于驾驶员行为识别,模型剪枝,深度学习,图像细粒度,视频理解的论文, 主要内容为随着社会主义现代化建设的深入,国民经济生活极大发展,截至目前,机动车保有量已位居世界第一。而交通事故的发生次数和伤亡人数也常年居高不下。据调查,80%以上的交通事故是驾驶员的不安全驾驶行为导致的,因此利用人工智能技术配备智能设备对驾驶员的驾驶行为进行实时监控和分析是十分必要的。本文将监控视频下驾驶员的行为做为研究对象,针对驾驶员行为识别的算法设计和软件设计展开研究,主要研究内容如下:(1)基于图像细粒度的驾驶员行为识别方法研究。针对现有的驾驶员行为识别算法存在特征表现能力不足、识别精度较低的问题,本文设计了一种基于图像细粒度的方法,结合注意力机制和细粒度判别模块,可以从全局角度自适应地发掘有效特征,抑制无效特征的表达,可以从局部角度,寻找具有代表性的判别块,该方法在保证较高精度的同时,计算量小,适用于后续的嵌入式平台部署。(2)基于时空建模的驾驶员行为识别方法研究。针对主流时空模型存在的时间和空间信息无法有效融合的问题,本文设计了特征激励模块捕捉动作在时间和空间之间的关系,提高时序动作建模能力;针对现有方法忽略了驾驶员场景下同一动作的速率具有多样性的问题,本文设计了特征调制模块可有效感知不同快慢的动作线索。本文的方法在驾驶员行为识别任务中,可实现有效算法精度提升,适合在高性能计算机平台部署。(3)驾驶员行为识别模型剪枝方法研究。针对现有方法在判断通道重要性时,只考虑当前需要裁剪的通道的范数,却忽略了与相邻层权重的依赖性问题,本文对通道的重要性评估时同时考虑了通道本身权重和与之相关的滤波器的权重。针对现有的通道剪枝方法只能对同层的通道排名、逐层裁剪的问题,本文采用了进化算法,学习各层的尺度因子和偏移因子,对所有层的通道进行排名,可实现全局统一剪枝。当前对多帧CNN模型的剪枝研究较少,本章的另一贡献是对多帧CNN模型的剪枝进行了实验研究。实验表明,本章提出的对通道剪枝的模型压缩算法适用于驾驶员行为识别的轻量化场景,可起到推理加速的效果,且造成的精度损失比现有的模型压缩方法更少。(4)嵌入式驾驶员行为识别软件设计。本文在Jetson TX2开发板上设计了嵌入式驾驶员行为识别软件。该软件的界面简洁美观,可以发挥开发板GPU的性能,通过模型解耦、多线程等技术,实现视频流下驾驶员行为的实时识别。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设向导 ,原文地址:https://m.bishedaima.com/lunwen/48681.html