多级嵌入式神经元网络仿真系统设计与实现
这是一篇关于类脑计算,神经元网络,映射方式,嵌入式实现,基底核-丘脑网络的论文, 主要内容为神经元在不同的空间尺度上连接成各种并行网络结构,使大脑拥有了高度复杂的结构和功能,类脑计算根据大脑工作机制采用非冯·诺依曼架构来模仿大脑的高速并行特性,进而实现复杂功能。如何仿照大脑神经元网络的结构和功能实现类脑计算是当前人工智能领域一个具有挑战性的科学问题,本文设计了一种多级嵌入式神经元网络仿真系统——EmPaas,采用高效的映射方式与混合拓扑结构提高仿真过程中的计算效率与通信效率,实现不同层次的神经元网络在线仿真和功能模拟。首先,根据大脑皮质神经元网络结构与功能特点,使用嵌入式仿真系统映射神经元网络的方法,建立EmPaas系统的整体映射方式。设计最小计算单元与大型计算单元相互协作的方式,完成大脑皮质结构与功能分区的模拟;根据神经元网络中信息传递特性,采用多级路由与复制多播拓展机制实现仿真系统中嵌入式处理器之间的数据传递,使整个系统能够支持大规模神经元网络的在线仿真。然后,根据所提出的映射思想,采用嵌入式处理器构建了EmPaas系统。为了实现硬件友好、计算高效的仿真系统,使用340个嵌入式处理器实现神经元网络的并行计算,采用改良的树形-二维网格状混合拓扑结构完成系统的整体搭建,提高了系统的计算效率与通信效率;同时,设计适用于该系统的供电-片选电路与104位可扩展路由数据包,制定串口数据传输协议,从而降低系统的整体功耗。最后,在EmPaas系统中,实现了基底核-丘脑网络的在线仿真。定制EmPaas系统通用的初始化配置流程,在不同工作状态下对其功耗、计算效率和通信效率等进行了分析;采用4′720个Izhikevich神经元模型构建基底核-丘脑网络,包括丘脑下核、苍白球外部、苍白球内部和丘脑四个核团,通过对该网络的在线仿真,验证了EmPaas系统优越的实时仿真能力。经过验证分析,本文构建的EmPaas系统具有低功耗、高计算效率与高通信效率等优良性能,为类脑计算与控制方面的研究提供了新的有效手段。
基于卷积神经网络的疲劳驾驶检测及嵌入式实现
这是一篇关于深度学习,人脸检测,疲劳驾驶检测,嵌入式实现的论文, 主要内容为疲劳驾驶会严重危害道路交通安全,现已和超载、超速并列为交通事故的三大成因。为有效预防疲劳驾驶的发生,本文采用基于卷积神经网络的疲劳驾驶检测方法,主要研究内容如下:(1)研究D-YOLOv4(Dense-YOLOv4)人脸检测算法。为加快检测速度,解决人脸检测中人脸形状不规则、尺寸不一致等问题,在YOLOv4模型的基础上改进:首先,在主干网络中增加密集卷积网络Dense Net(Dense Convolutional Network),优化特征传递和复用,提高检测精度;其次,为进一步提升模型性能,在模型的主干和颈部新增两个残差块,加强特征提取,采用空间金字塔池化SPP(Spatial Pyramid Pooling),增强感受野,显著分离上下文特征;最后,在路径聚合网络PANet(Path Aggregation Network)加入改进的SSH(Single Stage Headless)人脸检测模块,SSH模块中采用轻量级卷积块GSConv,大幅减少模型的参数量和计算量,为模型的嵌入式实现提供基础。实验表明,D-YOLOv4相比于YOLOv4,模型缩小约41.1%,平均精度提高约4%。(2)研究多指标融合的疲劳驾驶检测算法。首先,通过Dlib算法提取人脸关键点,根据关键点坐标计算出不同状态下眼嘴的特征向量,识别眼嘴的开闭状态;其次,通过计算单位时间内眼睛闭合时间占比与打哈欠次数,得出疲劳驾驶状态参数;最后,与疲劳驾驶状态阈值比较,判断驾驶员是否处于疲劳驾驶状态。(3)研究D-YOLOv4疲劳驾驶检测算法在嵌入式平台上的应用。将验证可行的疲劳驾驶检测模型D-YOLOv4部署到NVIDIA Jetson TX2开发板中。首先,通过基于Tensor RT的算法优化和推理加速,将D-YOLOv4模型部署到Jetson TX2上。其次,将D-YOLOv4与其他网络模型在Jetson TX2上进行性能对比。最后,在不同光照强度和眼镜遮挡情况下,将D-YOLOv4与YOLOv4进行对比实验。实验结果表明,在NUAA数据集上,D-YOLOv4的检测速度比YOLOv4、Mobile Net V3和YOLOv5分别加快了38.1%、6.5%和19.8%;在不同光照条件下,D-YOLOv4的疲劳驾驶平均检测准确率比YOLOv4提高了3.8%;在眼镜遮挡下的平均准确率比YOLOv4提高了3.7%。证明D-YOLOv4模型适合嵌入式实现。
基于CNN的航空目标检测算法优化与嵌入式实现
这是一篇关于目标检测,轻量化,嵌入式实现,加速器的论文, 主要内容为得益于卷积神经网络研究逐渐成熟,基于卷积神经网络的目标检测算法不断进步,航空目标检测算法作为目标检测算法的分支,因应用广泛而受到研究人员重视。但随着目标检测算法检测精度的提高,算法庞大的参数量和计算量使其在嵌入式设备上难以实现,应用于航空目标检测的无人机设备因自身能源限制,又对搭载其上的设备具有便携性和低功耗的要求。因此本文从算法可移植性和嵌入式设备加速实现两个方面出发,对基于卷积神经网络的目标检测算法进行轻量化且适合嵌入式设备实现的改进和优化,针对卷积神经网络在嵌入式设备上的加速实现,设计基于ZYNQ的卷积神经网络加速器,通过并行度和流水线优化实现目标检测算法在嵌入式设备上加速计算,主要完成工作如下:(1)首先针对目标检测算法网络模型参数多、计算量大的问题,选择以轻量型的YOLOv4-Tiny算法为基础,进一步对算法网络模型的参数量和计算量进行轻量化改进;其次针对网络模型参数量和计算量降低后导致检测精度下降的问题,参考PAN结构对网络模型结构中的特征增强部分进行改进,生成新的网络模型;最后,为使算法参数适合嵌入式设备计算,对改进后的网络模型进行量化训练,得到量化后的网络模型并进行实验。实验结果表明在检测精度损失有限的情况下,网络模型尺寸压缩89%,检测速度提高64%。(2)针对目标检测算法在嵌入式设备上的加速实现,本文设计基于ZYNQ的卷积神经网络加速器,根据ZYNQ平台设计卷积神经网络加速器架构,利用软硬件协同设计方式,使用Vivado系列工具分别对加速器软件和硬件所设计的各功能模块进行实现。最后,对加速器计算过程从并行度和流水线两个方面进行优化。(3)对加速器硬件功能模块进行仿真验证,使用上述卷积神经网络加速器设计方案实现本文改进后的目标检测算法,在ZCU104开发板上集成系统并实现算法推理过程。从检测效果、开发板的资源使用情况以及系统功耗多个方面对结果进行分析。结果表明,本文提出的算法优化方式在嵌入式设备实现所需功耗3.8W,能效比39.7GOPS/W,通过对比表明该方法具有一定优势。
海洋浮游生物图像识别方法研究与嵌入式系统实现
这是一篇关于图像识别,海洋浮游生物,YOLO-V4,轻量化网络,嵌入式实现的论文, 主要内容为海洋浮游生物是海洋生态系统的重要组成部分,与人类生活密切相关。在浮游生物的研究和监测中,利用计算机视觉技术对浮游生物图像进行自动识别提高了识别效率和准确率,因此成为了浮游生物监测的新趋势。近年来,深度卷积神经网络在图像分类、目标检测等计算机视觉任务中大放异彩,但是主流网络参数量巨大,难以应用到资源有限的嵌入式平台。针对以上问题,本文对浮游生物识别方法以及目标检测网络的轻量化及应用进行研究。主要工作内容如下:(1)通过对基于多特征融合+支持向量机的浮游生物识别研究,发现了该方法的不足,突出了基于深度学习浮游生物识别方法的优势。在研究中建立了相应的浮游生物图像数据集,采用基于多特征融合+支持向量机的识别算法对数据集进行训练、测试。(2)针对目标检测模型占用资源较多的问题,基于高精度模型YOLO-V4(You Only Look Once v4),提出一种轻量化检测模型Ghost-YOLO-V4,减少参数量和模型体积。首先使用轻量级神经网络Ghost Net替换YOLO-V4的主干特征提取网络CSPDark Net53,使用3×3的深度可分离卷积DSC(Depthwise Separable Convolution)替换PANet(Path Aggregation Network)结构中的3×3普通卷积,显著的减少模型的体积。其次在PANet结构后添加卷积注意力机制模块CBAM(Convolutional Black Attention Module),弥补模型轻量化导致的精度损失。经实验证明,该改进模型在保持检测精度的同时,模型体积减少到17.5%,更有利于部署在嵌入式平台上。(3)将经过实验验证的轻量化检测模型Ghost-YOLOv4应用到NVIDIA Jetson Nano嵌入式开发板上。使用Tensor RT框架对模型进行推理优化,并在嵌入式平台上对比了不同框架的执行效率和不同量化精度的识别效果。实验结果证明,本文的改进模型较好的平衡了检测精度和速度,能够在嵌入式平台对海洋浮游生物图像进行有效识别。
基于头肩检测的多人跟踪算法与嵌入式实现
这是一篇关于头肩检测,多人跟踪,表观特征提取,嵌入式实现的论文, 主要内容为随着信息化时代的高速发展,计算机视觉技术在众多领域发挥着重要的作用,其中行人检测及多行人跟踪作为计算机视觉的研究热点之一,近年来涌现许多优秀的研究成果。但行人检测在有遮挡、形变等情况下存在不足,而头肩检测则可以在一定程度下避免行人检测的不足。本文依据企业委托开发项目,考虑实际工程应用场景需求,研究基于头肩检测的多人跟踪算法及嵌入式实现,主要包含基于深度学习的头肩检测、人体头肩表观特征的提取、多人跟踪算法的研究、以及基于安卓的嵌入式实现。完成的主要工作如下:(1)构建了头肩检测数据集,该数据集包含8410个头肩目标,主要来源于校园拍摄、朋友相册和公开行人数据集。基于YOLOX-Nano网络结构,设计了一种学习率自适应调整方法,采用迁移学习的方式进行网络训练与优化,考虑嵌入式实现,挑选得到最合适的头肩检测模型YOLOX-Nano,该模型测试结果表明头肩检测的平均精确度为99.27%。与公开的行人检测模型就遮挡情况进行了对比实验,实验结果表明头肩检测模型对遮挡具有更好的鲁棒性。(2)构建了头肩表观特征提取数据集,设计了一种基于头肩检测和Sort算法自动构建数据集的方法,减少了大量的重复性工作。为了嵌入式实现,设计了基于Shuffle Net V2的轻量级表观特征提取网络,经过训练得到的特征提取模型测试精度达到97.5%,虽然精度略小于Deep Sort算法中提出的特征提取模型,但模型大小仅为3.8MB,与Deep Sort算法中的特征提取模型相比缩小了约12倍。(3)基于YOLOX-Nano头肩检测模型和轻量级头肩表观特征提取模型,结合Deep Sort多目标跟踪算法,构建了多人跟踪系统。对该系统进行有遮挡场景的测试,测试结果说明构建的多人跟踪系统具有好的鲁棒性。然后,利用高清摄像头在线监控行人流量,不仅可实现多人的同步跟踪,而且可统计行人流量,处理速度可达25帧/s。(4)基于安卓系统的嵌入式实现。本文使用的嵌入式主板型号为XY6762CA-C,由企业提供,外接IMX214型号摄像头模组。通过模型转换、加载与提取、以及安卓应用的开发,实现了多人跟踪系统的嵌入式应用,并进行了相应的实验测试,测试结果表明可实现速度达20帧/s的多人跟踪。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码货栈 ,原文地址:https://m.bishedaima.com/lunwen/54606.html