基于深度学习的脑部MRI图像分类算法研究
这是一篇关于图像分类,深度卷积网络,脑部MRI,半监督学习,生成对抗网络的论文, 主要内容为图像分类任务是通过对图像的特征信息进行提取来达到图像分类识别的图像处理方法。随着计算机技术的发展和医疗硬件性能的提升,大量的医学图像数据涌现,使计算机辅助诊断技术得到完善和加强。图像分类作为计算机视觉领域应用的基本和关键技术,许多分类网络模型应用于现代医学辅助诊断中,大程度得减少外在环境和操作人员对医学图像采集的影响。然而,对于帕金森病而言,目前的研究仍然存在一定的局限性。医学图像的宏观差异小,需要减少网络提取特征时对关键致病信息的损失。其次,医学图像的标注过程专业性和复杂性强,有标签的数据样本有限,而深度学习对数据的需求是很大的,这限制了深度学习在帕金森病领域的发展。针对以上问题,本文提出两种模型用于帕金森病脑部MRI图像的分类,具体研究内容如下:(1)提出了一种基于注意力机制的深度卷积网络应用于医学图像分类。选用经典的深度卷积网络模型Dense Net为基础,提出一个全局混合注意力模块,引入网络结构中使模型获取特征图的全局信息和通道信息,解决深度卷积网络由于局部感受野的限制在捕捉脑部组织位置和内容信息时的关键信息损失问题;对网络的连接方式进行剪枝,去除不必要的,保留更有用的快速连接方式,缓解由于图像特性和数据集规模小造成的过拟合现象。改进后的Dense Net网络模型在PPMI数据集上取得了85.44%的分类准确度,相比改进前准确度提升了8.99%。(2)从医学图像的实际应用场景角度出发,将大量无标记数据样本利用起来,并针对传统生成对抗网络中以随机噪声作为生成器起点生成样本,无法充分学习到真实样本的特征分布,使判别器提取数据特征与真实数据特征之间存在偏移问题,提出一种基于编码转换和流形正则化的深度卷积对抗网络模型。对生成对抗网络的网络结构进行改进,并引入编码器网络,将原始数据样本映射为具有原始样本图像特征信息的编码隐变量,并通过重参数化方法得到噪声隐变量代替随机噪声作为生成器的起点;在判别器中引入流形正则化,对数据流形方向上扰动保持不变并将距离较近的点进行相似性标注,提高模型的泛化能力。半监督分类任务下,改进后的模型在PPMI数据集上取得了87.18%的分类准确度。
基于深度学习的街道语义分割研究
这是一篇关于语义分割,深度卷积网络,编码解码器,深度学习,金字塔池化的论文, 主要内容为图像语义分割是十分火热的一个研究方向,它是对于场景理解来说具有及其重要的意义。近年来,以深度学习为基础的街道语义分割有了很大的进展,尤其是随着现在摄像头的快速发展,产生了很多道路街景的图像,如果计算机可以对这图像进行精准的语义分割,可以为自动驾驶,智能服务等城市应用打下坚实的基础。因此本文利用学校监控摄像头获取图像,对这些街景图片进行语义分割研究。首先详细介绍了街道语义分割的目的和意义,说明了目前它的难度在哪里;其次,将语义分割技术划分为深度学习出现之前的分割即传统分割,传统分割与以深度学习为基础的分割相结合,以深度学习为基础的分割,其中重点介绍了以深度学习为基础的分割,介绍了各类与深度卷积神经网络相关的各方面知识与,也介绍了主流的几个语义分割模型。谷歌公司发布了Deeplab系列,并以Deeplab V3+[1]作为终篇之作,本文便提出了一种以Deeplab V3+作为基础的网络模型。首先详细介绍一下Deeplab V3+,该网络包含两个部分:编码器和解码器。其中,编码器主要是由主干特征提取网路和ASPP模块一起组建而成,并且编码器中还将池化操作以步长为为2的空洞卷积来进行替换并且还大量使用了深度可分离卷积卷积来达到进行降低运算的操作。对比编码器而言,解码器相对而言比较简单,只是使用了一些简单的普通卷积。在解码器部分经过ASPP模块后首先经过了一个普通卷积再经过一个四倍的上采样模块与主干提取网络提取出来的特征图进行融合再经过一个普通卷积和四倍上采样模块恢复原始分辨率。本文将Deeplab V3+网络进行一些改进,将其主干网络进行替换并将其解码器部分进行替换改进。在对网络进行训练时发现Deeplab V3+的参数量过大,导致训练时间过长,针对这个问题,决定引进比较流行的迁移学习的思想,在网络训练过程中添加了预训练权重,这样不仅可以加速训练时间,并且还可以使得模型获取更多的特征,另外还将其原始Deeplab V3+网络以及其他主流网络进行对比,实验结果表明,无论是收敛速度还是精度都有显著提升。最后实验分为三个部分:(1)主干提取网络分别了使用Mobile Net-V2[2]和Xception[3],通过对比实验结果得出Mobile Net-V2的测试精度要远高于Xception的测试精度并且Mobile Net-V2的参数量远远小于Xception。(2)解码器的调整与更换,使用新的解码器与原网络的解码器进行对比实验,通过对比实验结果得出使用新的解码器比原始的解码器效果更佳。(3)分别对网络模型进行迁移训练,实验结果表明,使用迁移训练后的网络模型可以达到更高的MIoU值。
基于多特征融合的多目标跟踪算法研究及应用
这是一篇关于多目标追踪,人脸检测,多特征融合,深度卷积网络,数据匹配的论文, 主要内容为多目标追踪问题一直是计算机视觉研究的基础问题,为后续其他视觉任务提供支持。目前很多的多目标追踪以行人,车辆等为追踪对象,针对人脸的目标追踪研究相对稀少。本文针对南京地铁站入站口的安检监控视频,以人脸作为目标检测基础,提出了基于多特征融合的多目标追踪算法。本文主要工作如下:1、本文根据MTCNN人脸检测网络进行改进,提出了一种更加快速有效的人脸检测方法。为了解决在原网络结构上训练收敛缓慢问题,该方法在网络结构上引入更容易训练的Batch Norm结构在训练过程中对数据进行归一化,同时该方法根据实际情况,删除了原MTCNN网络中的回归特征点,进而提升前向速度。由于原MTCNN网络采用平方差损失函数,使得训练样本对于与真值相距较远的点收敛缓慢,该方法采用一阶损失函数,避免这个问题。在网络训练上,该方法采用蒸馏网络和目标阶梯检测方法,对网络进行进一步地压缩和性能提升。经过FDDB数据集评测,该方法在WIDER FACE数据集上的训练结果,对比同样在WIDER FACE数据集上训练的原MTCNN网络结果有8%的提升,并且平均速度达到30FPS,证明该方法可以快速准确地对人脸进行检测。2、基于改进的MTCNN人脸检测方法,本文提出了基于多特征融合的多目标追踪算法。对比传统手工特征,为了能更好地应对目标尺度变化,目标遮挡,变形旋转等不利条件,本文将MTCNN网络中的卷积特征做为表观特征,并融合卡尔曼滤波器得到状态特征和位置尺度特征作为融合特征进行数据匹配。同时,结合实际视频情况,提出了一种基于条件判断的数据匹配方法,分别针对连续追踪,追踪中断和目标重叠三种情况进行多目标追踪。实验证明,在实际检测过程中该方法对比采用单一特征以及一般数据匹配方法的多目标追踪算法有明显提升。3、设计了一款基于C++的多目标追踪的安防监控系统。该系统主要包含动态检索模块,检索查询模块,资源管理模块,参数管理模块,完成对地铁安检监控的查询检索、追踪统计功能。同时该系统拥有C/S和B/S两种架构,能够满足不同用户的多种需求。
基于深度学习的脑部MRI图像分类算法研究
这是一篇关于图像分类,深度卷积网络,脑部MRI,半监督学习,生成对抗网络的论文, 主要内容为图像分类任务是通过对图像的特征信息进行提取来达到图像分类识别的图像处理方法。随着计算机技术的发展和医疗硬件性能的提升,大量的医学图像数据涌现,使计算机辅助诊断技术得到完善和加强。图像分类作为计算机视觉领域应用的基本和关键技术,许多分类网络模型应用于现代医学辅助诊断中,大程度得减少外在环境和操作人员对医学图像采集的影响。然而,对于帕金森病而言,目前的研究仍然存在一定的局限性。医学图像的宏观差异小,需要减少网络提取特征时对关键致病信息的损失。其次,医学图像的标注过程专业性和复杂性强,有标签的数据样本有限,而深度学习对数据的需求是很大的,这限制了深度学习在帕金森病领域的发展。针对以上问题,本文提出两种模型用于帕金森病脑部MRI图像的分类,具体研究内容如下:(1)提出了一种基于注意力机制的深度卷积网络应用于医学图像分类。选用经典的深度卷积网络模型Dense Net为基础,提出一个全局混合注意力模块,引入网络结构中使模型获取特征图的全局信息和通道信息,解决深度卷积网络由于局部感受野的限制在捕捉脑部组织位置和内容信息时的关键信息损失问题;对网络的连接方式进行剪枝,去除不必要的,保留更有用的快速连接方式,缓解由于图像特性和数据集规模小造成的过拟合现象。改进后的Dense Net网络模型在PPMI数据集上取得了85.44%的分类准确度,相比改进前准确度提升了8.99%。(2)从医学图像的实际应用场景角度出发,将大量无标记数据样本利用起来,并针对传统生成对抗网络中以随机噪声作为生成器起点生成样本,无法充分学习到真实样本的特征分布,使判别器提取数据特征与真实数据特征之间存在偏移问题,提出一种基于编码转换和流形正则化的深度卷积对抗网络模型。对生成对抗网络的网络结构进行改进,并引入编码器网络,将原始数据样本映射为具有原始样本图像特征信息的编码隐变量,并通过重参数化方法得到噪声隐变量代替随机噪声作为生成器的起点;在判别器中引入流形正则化,对数据流形方向上扰动保持不变并将距离较近的点进行相似性标注,提高模型的泛化能力。半监督分类任务下,改进后的模型在PPMI数据集上取得了87.18%的分类准确度。
基于深度学习的图像纹理分类在三维重建中的应用
这是一篇关于深度卷积网络,三维重建,特征提取与匹配,图像纹理分类,虚拟展示的论文, 主要内容为基于多视点图像的三维重建技术是指将从普通相机获得的二维图像生成一个三维几何模型的过程。在这个过程中,特征点的提取与匹配是获取高精度三维几何模型的核心技术之一,获取足够数量的精确的匹配点是三维重建的前提条件。随着图像数量增加以及分辨率的提高,基于图像局部特征的特征点匹配很容易导致错误匹配,甚至可能在完全不同的图像之间建立对应关系。在以光束平差法(Bundle Adjustment)为代表的照相机标定或三维重建问题中,由于随着图像数量和分辨率的增加,方程式和未知数的数量爆发性增加,能够一次性处理的图像数量是有限的,通常为几十或几百,但是对于大规模场景原始图像通常可达数千张甚至数万张。同时,由于光照条件、照相机参数、拍摄角度、拍摄距离等因素,原始图像中难免有部分图像无法满足基本的处理条件,这些图像也需要去除。基于以上问题,本论文研究原始图像的有效分类、分割及分组方法。通过分析比局部特征更大的宏观特征,对原始图像进行分类、分组、分割等处理,在降低计算成本的同时提高特征匹配的准确率,提高三维重建系统的精度和鲁棒性。本文提出以下方法来解决图像纹理分类问题。首先,对图片进行合理切割,并对切割图像使用深度卷积神经网络进行特征提取与分类。然后汇聚各个切割图特征向量,使其成为原图的全局向量表达。最后使用传统聚类的分类方式来解决图像纹理分类问题。并在三维重建具体应用场景上验证了该策略的有效性。在特征提取方面,本论文首次尝试使用材质纹理数据集以及场景纹理数据集分别在神经网络上进行图像纹理分类训练,并与在ImageNet上训练好的神经网络进行特征提取的方法进行了比较。基于实验结果,采用在ImageNet上训练好的神经网络进行特征提取。本文主要研究内容包括:1)介绍基于图像的三维重建的主要步骤、相关技术及主要问题。由此提出对三维重建原始输入图片进行纹理分类预处理的合理性以及必要性。2)详细介绍本论文提案的图像纹理分类的方法及相关结论。并为深度学习在图像纹理分类以及图像相似度分类等领域提供了新思路。3)为了便于管理、浏览以及分享最终形成的三维模型,开发了三维展示平台web项目,采用SSM(Spring、SpringMVC和Mybits)框架。
基于多特征融合的多目标跟踪算法研究及应用
这是一篇关于多目标追踪,人脸检测,多特征融合,深度卷积网络,数据匹配的论文, 主要内容为多目标追踪问题一直是计算机视觉研究的基础问题,为后续其他视觉任务提供支持。目前很多的多目标追踪以行人,车辆等为追踪对象,针对人脸的目标追踪研究相对稀少。本文针对南京地铁站入站口的安检监控视频,以人脸作为目标检测基础,提出了基于多特征融合的多目标追踪算法。本文主要工作如下:1、本文根据MTCNN人脸检测网络进行改进,提出了一种更加快速有效的人脸检测方法。为了解决在原网络结构上训练收敛缓慢问题,该方法在网络结构上引入更容易训练的Batch Norm结构在训练过程中对数据进行归一化,同时该方法根据实际情况,删除了原MTCNN网络中的回归特征点,进而提升前向速度。由于原MTCNN网络采用平方差损失函数,使得训练样本对于与真值相距较远的点收敛缓慢,该方法采用一阶损失函数,避免这个问题。在网络训练上,该方法采用蒸馏网络和目标阶梯检测方法,对网络进行进一步地压缩和性能提升。经过FDDB数据集评测,该方法在WIDER FACE数据集上的训练结果,对比同样在WIDER FACE数据集上训练的原MTCNN网络结果有8%的提升,并且平均速度达到30FPS,证明该方法可以快速准确地对人脸进行检测。2、基于改进的MTCNN人脸检测方法,本文提出了基于多特征融合的多目标追踪算法。对比传统手工特征,为了能更好地应对目标尺度变化,目标遮挡,变形旋转等不利条件,本文将MTCNN网络中的卷积特征做为表观特征,并融合卡尔曼滤波器得到状态特征和位置尺度特征作为融合特征进行数据匹配。同时,结合实际视频情况,提出了一种基于条件判断的数据匹配方法,分别针对连续追踪,追踪中断和目标重叠三种情况进行多目标追踪。实验证明,在实际检测过程中该方法对比采用单一特征以及一般数据匹配方法的多目标追踪算法有明显提升。3、设计了一款基于C++的多目标追踪的安防监控系统。该系统主要包含动态检索模块,检索查询模块,资源管理模块,参数管理模块,完成对地铁安检监控的查询检索、追踪统计功能。同时该系统拥有C/S和B/S两种架构,能够满足不同用户的多种需求。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设向导 ,原文地址:https://m.bishedaima.com/lunwen/53284.html