基于监控视频的行人检测跟踪算法研究
这是一篇关于监控视频,行人检测,行人跟踪,YOLOv5,DeepSORT的论文, 主要内容为随着深度学习的飞速发展,行人检测跟踪模型性能有了很大的提高。但是在复杂环境中,监控视频中容易出现目标尺寸小,行人被遮挡等情况,给目前的行人检测跟踪算法带来了巨大挑战。由于小目标的信息较少容易漏检,导致检测精度下降,从而使跟踪效果不佳。因此,需要在改善小目标检测效果的基础上,进一步提高跟踪性能。针对此问题,本论文研究监控视频中的行人检测跟踪算法,工作内容围绕行人检测算法和行人跟踪算法两方面展开,具体如下:(1)针对小目标检测难问题,以YOLOv5为基准模型,构建结合协同注意力机制和P2-Bi FPN(P2 Bidirectional Feature Pyramid Network)结构的行人检测模型。首先,在骨干网络的残差单元中添加协同注意力机制,提高对小目标定位的准确度,并将残差单元的对称卷积核3×3替换为并行的非对称卷积核3×1和1×3,从而减少模型参数量。然后,搭建P2-Bi FPN特征融合网络,将P2浅层的小目标信息通过特征增强模块引入到高层特征图,从而丰富小目标信息,进一步提高小目标的检测效率。最后,该算法在Wider Person行人检测数据集上进行训练和测试。实验结果表明,相比基准模型,本文构建的行人检测模型的m AP提升了1.7%,模型参数量减少了5.66M。(2)针对行人间的遮挡问题,在行人检测算法的基础上,设计增强数据关联的抗遮挡行人检测跟踪方法。利用结合协同注意力机制和P2-Bi FPN结构的行人检测模型作为检测器,对原Deep SORT跟踪算法做抗遮挡处理。首先,在该算法模型中引入本文搭建的Ghost Net-cot重识别网络,该网络结合了轻量化的Ghoset Net模型和引入上下文信息的Co T块网络,从而提取出更具有鉴别性的特征图,给予行人部分更高的关注度。然后,优化数据关联匹配方式,联合空间信息和外观信息对遮挡目标的检测框和确认态轨迹再次进行匹配,从而提高遮挡场景中行人跟踪模型的性能。最后,在MOT16跟踪数据集上对该算法进行训练和测试。分析实验结果可知,相比原Deep SORT算法,本文研究的抗遮挡Deep SORT跟踪算法的HOTA提高了3.61%,IDSW减少了33%,跟踪效果更好。相比于基准模型YOLOv5+Deep SORT算法,本文构建的基于监控视频的行人检测跟踪模型的HOTA提高了9.03%,说明对小目标和被遮挡行人的跟踪效果更好。
片段选择驱动学习的视频异常检测研究
这是一篇关于监控视频,视频异常检测,样本选择,多示例学习的论文, 主要内容为随着数字信息化、智能化的发展,视频监控技术在智能安防、智能家居和交通监测等领域的应用越来越广泛。视频异常检测是智能视频监控技术的重要组成部分,能够代替人工高效地检测监控视频中的异常片段,是目前学术界和工业界的研究热点。监控视频往往画面相似、场景重复,其中有价值的视频前景和背景片段存在分布不平衡的问题。如何有效地从这样的数据中发现和提取富有表现力和判别力的特征是目前视频异常检测领域的一大研究难点。本文围绕片段选择驱动学习对视频异常检测展开研究,通过选取训练视频中更有意义的片段来进行特征学习和模型优化,使得正常画面与异常画面更加可区分,提高异常检测的准确率。本文的主要工作包括两个部分:(1)针对无监督视频异常检测,提出了一种伪异常片段选择驱动学习的无监督视频异常检测方法。针对视频异常检测无监督训练数据量大、冗余度高等特点,提出了伪异常片段选择驱动学习的训练框架,从原始训练集中迭代地选取部分异常分数高的正常视频帧(记为伪异常帧)来构成新的训练池,用所选训练池优化模型,以精简训练集。在检测模型方面,设计了基于后继帧预测的双路U-Net,以不同采样节奏获取的视频段分别作为两个支路的输入,从而能够从多个粒度上更好地提取和利用视频的时空特征。此外,本文的双路U-Net中每层共享一个记忆模块,通过多层的记忆学习来强化正常模式的影响,抑制异常画面的预测能力。在视频异常检测基准数据集上的实验验证了所提方法在检测精度和训练效率上的有效性。(2)针对弱监督视频异常检测,提出了一种基于代表片段对比学习的弱监督视频异常检测方法。根据现有方法在弱监督设定下对正包中的异常片段定位不准确、使用效率不高的特点,本文提出了腐蚀-膨胀的异常片段选择算法,首先根据阈值大致定位异常片段,然后通过腐蚀操作过滤部分噪声异常片段,再经过膨胀操作保留典型异常片段,从而对异常定位更准确。在此基础上,本方法提出了一种片段对比损失,以典型的异常片段和正常片段来构建正、负匹配对,通过对比学习方法使正常片段和异常片段在特征空间中更加可区分。由于本方法更好地考虑了异常片段的影响,在视频异常检测基准数据集上的展现出优越的性能。值得注意的是,本方法在Shanghai Tech数据集上的误报率降低到了0.02%,超过了当前最优的弱监督视频异常检测方法。
基于GIS的视频综合管理系统
这是一篇关于地理信息系统,监控视频,要素聚合,编码,轮循播放的论文, 主要内容为论文以平安城市建设中的资源共享为背景,结合兰州市视频资源现状,运用地理信息系统(Geographic Information System简称GIS)技术,使用国产软件SuperMap作为GIS软件平台,使用J2EE企业架构开发系统后台,使用Flex富客户端技术结合SuperMap API for Flex开发客户端,建成了兰州市视频综合管理平台系统。系统以一张图的方式将所有的视频监控资源进行整合展示,实现了最短路径分析、缓冲区分析、快速定位、快速查找、地图浏览等GIS的相关功能;同时,将监控摄像头与地图结合,既展现了监控摄像头的空间分布特征,又体现出传统监控系统的优势,实现了在地图上直接点击监控摄像头调取实时视频内容、录像、抓拍、云台控制等功能。围绕着系统的设计与实现,论文对以下主要算法和内容进行分析和研究:(1)改进了摄像头视域分析算法,更加合理地计算出受云台控制的监控摄像头可视区域,并结合GIS地图直观的展示出兰州市监控摄像头的覆盖区域,为后续监控摄像头建设提供规划方案,为最终实现重点区域无盲区规划提供理论依据。(2)针对兰州市城市监控摄像头空间布局特点,根据国家视频监控命名标准,研究并制定了兰州市监控摄像头的编码规则。(3)将传统的监控摄像头轮循播放方式与GIS地图结合起来,实现联动效果。让其更加明显的突出摄像头的空间分布特征,克服了传统轮循播放只能显示局部实时图像信息、而空间位置感不强等缺点。(4)结合现有浏览器的渲染功能,在不影响展示效果的前提下,对地图符号进行了聚散显示,减轻浏览器负担,提高了系统运行效率。(5)最终实现了在线调阅视频、日常监控、轮循播放、视频资源共享、最短路径分析、缓冲区分析、快速定位、和地图浏览等功能。
基于时空信息融合与多尺度特征记忆增强的视频异常行为检测算法研究
这是一篇关于异常行为检测,监控视频,时空双维度特征,多尺度特征,记忆增强的论文, 主要内容为随着城镇化建设的迅猛发展和人民生活水平的提高,伴随着大量的社会治安问题出现。当前国家和人民对社会治安问题越来越关注,大多数公共场所已部署了大量摄像头,用于预防与监控公众场合中异常行为发生以保障公众安全。随着监控视频数据的指数级增长,传统的人工辅助的监控方式已无法满足视频监控的有效性要求,对监控视频的异常行为进行智能化检测分析具有重要的研究意义。近年来,深度学习技术在计算机视觉领域获得广泛应用,基于深度学习的视频异常行为检测算法研究也受到更多研究者的关注。由于异常样本和正常样本的不平衡导致了监督学习方法的应用受到了限制,而无监督学习方法正成为主流。其中,基于自动编码器和生成对抗网络的无监督学习方法是目前的研究热点课题。然而,此类方法仍存在一些不足之处:1)作为预测帧生成网络的自动编码器通常缺乏对连续视频帧之间的时间维度信息提取能力;2)由于异常行为通常发生在视频监控中的运动目标对象上,而现有的检测模型往往忽略了运动目标对象的空间维度信息;3)由于摄像机位置和视角原因导致运动目标对象空间尺寸的变化差异大;4)由于自动编码器网络强大的泛化能力,帧预测网络模型不但可以生成正常行为的预测帧,同时也能较好地生成异常行为的预测帧,导致预测误差较小而无法判别异常行为。为解决上述现有方法的不足之处,本文展开了如下的研究:(1)针对现有检测模型缺乏对连续视频帧之间的时间维度信息提取能力的问题,提出了一种将残差内部时间移位模块引入生成对抗网络生成器U-Net的改进方案。该改进措施通过将时间移位模块与2D CNN级联以此获得3D CNN的性能,并保持2D CNN低计算复杂度。同时,为了保持U-Net网络在学习时间维度特征的同时不造成空间特征学习能力退化,将时间移位模块添加至残差分支的内部形成残差内部时间移位模块以保持当前帧的激活,改进的预测模型能够有效地捕获连续视频帧之间的时间维度信息,进一步提升了检测算法的准确性。(2)为了解决网络模型忽略运动目标对象空间维度信息的问题,本文在U-Net的跳跃连接中引入注意力模块,对下采样前的特征图增加值得注意的特征通道和目标对象空间位置区域的权重,抑制其余无用的部分,能更有效地学习运动目标对象空间信息。引入注意力模块的网络模型能够有效提取运动目标的空间维度位置信息以及更关注前景中可能会出现异常行为的运动目标而淡化与异常行为发生情况无关的背景信息。改进的融合时空双维度特征的视频异常行为检测算法分别在UCSD Ped1、UCSD Ped2和CUHK Avenue数据集上进行实验验证,AUC值分别为83.8%、96.2%、85.5%,相较原模型分别提高了0.7%、0.8%和0.4%。此外,EER值分别为22.7%、11.2%和19.8%,比原模型下降了1.3%、0.8%和1.2%,进一步说明改进算法的有效性。(3)针对目标对象空间尺度变化大以及自动编码器网络过强的泛化能力等问题,提出一种基于多尺度特征记忆增强模块的视频异常行为检测改进算法,该算法能够有效地提取不同尺度特征信息的同时抑制自动编码器网络的泛化能力。首先,通过多尺度特征模块中多分支结构的空洞卷积在高级特征图上提取不同尺度的特征信息,其次将所得到的多尺度规则特征中的不同尺度正常行为特征通过记忆增强模块存储,在多尺度特征模块和记忆增强器模块的协同工作下能够有效地收集和记忆正常行为场景中的多尺度特征信息。在公开的真实场景数据集UCSD Ped1、UCSD Ped2和CUHK Avenue数据集上进行实验验证,AUC值分别达到了84.6%、97.1%和86.4%,EER值分别下降到了22.2%、10.6%和18.4%,通过与多个经典算法在AUC值和EER值等评估指标的横向比较下进一步说明改进方法的有效性。
基于GIS的视频综合管理系统
这是一篇关于地理信息系统,监控视频,要素聚合,编码,轮循播放的论文, 主要内容为论文以平安城市建设中的资源共享为背景,结合兰州市视频资源现状,运用地理信息系统(Geographic Information System简称GIS)技术,使用国产软件SuperMap作为GIS软件平台,使用J2EE企业架构开发系统后台,使用Flex富客户端技术结合SuperMap API for Flex开发客户端,建成了兰州市视频综合管理平台系统。系统以一张图的方式将所有的视频监控资源进行整合展示,实现了最短路径分析、缓冲区分析、快速定位、快速查找、地图浏览等GIS的相关功能;同时,将监控摄像头与地图结合,既展现了监控摄像头的空间分布特征,又体现出传统监控系统的优势,实现了在地图上直接点击监控摄像头调取实时视频内容、录像、抓拍、云台控制等功能。围绕着系统的设计与实现,论文对以下主要算法和内容进行分析和研究:(1)改进了摄像头视域分析算法,更加合理地计算出受云台控制的监控摄像头可视区域,并结合GIS地图直观的展示出兰州市监控摄像头的覆盖区域,为后续监控摄像头建设提供规划方案,为最终实现重点区域无盲区规划提供理论依据。(2)针对兰州市城市监控摄像头空间布局特点,根据国家视频监控命名标准,研究并制定了兰州市监控摄像头的编码规则。(3)将传统的监控摄像头轮循播放方式与GIS地图结合起来,实现联动效果。让其更加明显的突出摄像头的空间分布特征,克服了传统轮循播放只能显示局部实时图像信息、而空间位置感不强等缺点。(4)结合现有浏览器的渲染功能,在不影响展示效果的前提下,对地图符号进行了聚散显示,减轻浏览器负担,提高了系统运行效率。(5)最终实现了在线调阅视频、日常监控、轮循播放、视频资源共享、最短路径分析、缓冲区分析、快速定位、和地图浏览等功能。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码项目助手 ,原文地址:https://m.bishedaima.com/lunwen/54009.html