果蔬类果实与果梗分割及采摘点定位
这是一篇关于果蔬,深度学习,组合模型,分割,采摘点的论文, 主要内容为我国是一个农业大国,果蔬类生产在自产自销及出口方面,拥有很大的经济效益以及无限的市场前景。依靠人力、成本高、效率低的非智能化果蔬采收逐渐向农业产业现代化发展已经是大势所趋,而准确识别果实采摘点定位恰恰是智能采摘机器人最重要的能力。本文研究的是在温室大棚环境下,通过深度学习技术,提出了利用Res Net骨干网络结合Annet、Deeplabv3、Gcnet模型的通用组合模型对所采集的青椒、草莓、番茄、葡萄四种果蔬的果实果梗分割与定位采摘点进行实验研究,在该方法中,首先建立了四种果蔬的数据集,然后人为对果蔬果实果梗进行多边形标记,最后通过组合模型对数据集进行建模实验,分析对比不同骨干网络同一模型和同一骨干网络不同模型的果实果梗分割能力,从而得到最优分割组合模型,配合采摘点定位步骤,实验结果表明,该方法能够有效对果蔬类果实与果梗进行分割及定位采摘点,研究内容可为农业智能化生产中的果蔬采摘提供夯实的理论基础及较高的技术支持。本文的主要内容:对果蔬类果实与果梗分割及采摘点进行了较详细的研究,对各个模型方法进行了充分的实验对比分析,使用含有空洞卷积的残差网络、颜色模型及优化后特征金字塔模块来对果蔬图像进行训练、图像分割,增加果梗部位质心点计算方法,实现在复杂的背景环境下,完成对四种果蔬的果实、果梗精确分割,采摘点精准定位,具体表现如下;(1)基于Annet模型和ResNet50骨干网络的组合模型在青椒果蔬果实与果梗分割中能够取得最优分割效果,其评价指标MPA为0.9720、mIoU为0.7687、Kappa值为0.9839;(2)基于Gcnet模型和ResNet101骨干网络的组合模型在草莓果蔬果实与果梗分割中能够取得最优分割效果,MPA是0.8997、mIoU为0.3809、Kappa值为0.8523;(3)基于Gcnet模型和ResNet50骨干网络的组合模型在番茄果蔬果实与果梗分割中能够取得最优分割效果,MPA是0.9706、mIoU为0.6881、Kappa值为0.9839;(4)基于Gcnet模型和ResNet50骨干网络的组合模型在葡萄果蔬果实与果梗分割中能够取得最优分割效果,MPA是0.9804、mIoU为0.7717、Kappa值为0.9356;(5)在四种果蔬的最优模型中配合采摘点定位步骤,可以较准确地发现采摘点及采摘区域。
基于深度学习的三维点云分类分割算法
这是一篇关于点云,空间编码,卷积神经网络,分类,分割,注意力的论文, 主要内容为点云作为一种重要的数据存储方式,在计算机视觉、自动驾驶和机器人技术等领域都有着广泛的应用。深度学习作为人工智能的主导技术也成功的用于解决各种二维视觉问题。然而,使用深度神经网络去处理点云仍旧面临着独特的挑战。由于点云存储的是物体表面的坐标信息,并不会受到存储顺序的影响,因此点云的输入地输入是具有无序性的。此外点云中的每个坐标都是一个信息点,而单个信息点并不具备结构信息。这些独特的结构性问题都使得常规的用于处理二维视觉的深度学习方法难以应用到点云上。针对上述存在的问题,本文主要展开了以下两部分工作。(1)针对点云的分类和分割任务提出了基于图Transformer网络的分类分割算法。图卷积网络通过构建局部结构的方式应对点云结构性问题,Transformer网络则在处理无序性信息时则有着天然的优势。因此本部分工作的主要目的是结合图卷积网络和Transformer网络独特优势,寻求一种方式融合图卷积特征和Transformer特征。除此之外,还针对点云的特性,在Transformer网络中加入了空间编码信息,用来提高Transformer网络空间表达能力。为了有效融合两种特征,还设计了差异性通道注意力网络,用来学习各个通道之间的差异性,降低信息冗余。在数据集Model Net40、Scan Object NN和Shape Net Part上的实验证明了该部分工作在分类和分割任务上的有效性。(2)针对点云的分类任务提出了基于特征关系卷积的分类算法。通过考虑局部结构的构建、全局特征聚合和损失函数改进三个方面,构造了一个有效的点云分类网络。首先,针对点云的不均匀性和非结构性,通过中心点与近邻点之间的特征关系,为不规则的近邻点分配不同的权重,以此构建局部结构。此外,使用注意力的思想,提出了加权平均池化,通过自注意力的方式,学习每个高维特征的注意力分数,在保证整体网络对称性的同时,可以有效地聚合冗余的高维特征。另外,针对分类任务,利用了交叉熵损失与中心损失之间的互补关系提出了联合损失,进一步提高了网络的分类性能。最后,在合成数据集Model Net40和Shape Net Core以及真实数据集Scan Object NN上进行实验,与其它先进网络的对比结果证明了整体网络结构的优越性。
基于深度学习的点云处理方法研究
这是一篇关于点云处理,注意力机制,Top-K,残差处理,深度学习,分类,分割的论文, 主要内容为点云是一种灵活的几何表示形式,在许多领域中都有重要应用,包括机器人视觉与导航、医学影像处理等。但是,对点云的处理一直存在较大的困难,这是因为点云数据具有不规则性、无序性的特点。这使得在图像中广泛使用的卷积神经网络无法直接应用于点云。以PointNet为代表的基于点的深度网络的提出使点云可以直接被处理,但是这些方法为了适应点云的不规则性、无序性,对局部三维点之间的关系的刻画较弱。针对上述问题,本文做了以下这些工作:1.引入Top-K算子取代广泛采用的最大池化来聚合点云局部特征,减少信息损失。Point Net最先提出采用最大池化聚合全局特征,同时,DGCNN网络中使用自适应平均池化增加全局特征的表征。但当被聚合的点具有多个显著特征时,则只保留一个最大值点会损失大量信息。针对这一问题本文提出引用Top-K算子替换最大池化操作,在有限度的增加存储开销情况,尽可能保留更多的显著特征,提升网络的鉴别能力。2.提出基于残差注意力机制的增强边缘卷积层,注意力机制增强了网络对重要的区域和关键特征通道的表达,残差结构的引入提升了网络深度,从而使网络具备更强的抽象刻画能力。3.提出一种基于切片法的点云处理网络,该网络将点云数据划分成具有上下文关系的切片,将点云数据由不规则变为规则,无序变为有序。由于点云的无序性,现有的方法往往采用对称函数来聚合邻域内的点云,这个过程丢失了大量的局部几何信息。本文对于这一问题,提出直接将三维物体沿着某一方向切割成连续区域,不更改原始点云数据,同时增加上下文分量,并通过两个网络分支分别学习原始点云几何局部特征和切片上下文关系特征。本文通过在点云形状分类和形状部件分割数据集上,依据分类成功率和部件分割m Io U两个标准,与其他点云处理算法进行对比试验、消融实验、网络深度实验和参数设置实验。同时,对点云数据的丢失进行了鲁棒性研究。实验结果表明,本文提出的方法能显著提高网络的形状分类和形状部件分割性能。
基于卷积神经网络的胎儿小脑超声影像分割算法研究
这是一篇关于超声影像,生物医学图像,深度学习,卷积神经网络,分割的论文, 主要内容为随着国家生育政策的调整,高龄产妇显著增多,出生缺陷的风险也随之增大,实现对胎儿发育状况的精准监测,提高胎儿先天畸形的检出率对优生优育、提高人口素质具有重要意义。超声检测是产前检查必不可少的一部分,但是超声图像伴随着噪声、伪影等因素的影响,给医生诊断带来挑战。为此,如何运用深度学习技术在噪声干扰的背景下实现胎儿器官组织的精准分割是亟待解决的关键问题,也是早筛早诊早治的前提。现有的基于深度学习的图像分割算法在胎儿小脑影像分割领域的应用较少,且分割精度不高,无法为医生诊断提供足够精准、可靠的依据。鉴于此,本文将开展基于卷积神经网络的胎儿小脑超声影像分割算法的研究。具体而言,本文的研究内容和创新性成果如下:(1)面向胎儿超声影像的FCRB U-Net(Fully Connected Residual Block U-Net)小脑分割算法。针对卷积神经网络中特征信息丢失的问题,构建出一个能够保留丰富语义信息的分割算法FCRB U-Net,用于胎儿小脑超声影像分割。该算法从网络模块入手,采用全连接残差块替换了原始网络中的双卷积模块,弥补了卷积过程中特征信息丢失的问题。此外,FCRB U-Net在解码器端添加了特征重用模块,实现了深层语义信息的传播与复用。同时,面对超声图像中特有的背景噪声和组织伪影的干扰,FCRB U-Net嵌入了有效通道注意力机制ECA模块,对不同通道的特征加权,增强有效特征表示。在ECA模块的监督下,该算法在胎儿小脑超声影像分割上取得了更高的分割精度。(2)面向生物医学图像的DA-Net(Deep Attention Network)分割算法。针对网络的泛化能力问题,搭建出能够在广泛生物医学图像分割任务中具有普适性作用的图像分割算法DA-Net。该算法在原始U-Net的基础上增加了一层,形成了一个六层的U形网络,增加了网络的深度,使得网络获得了更大的接受域。从注意力机制方面,提出了一种改进的三重注意力模块,充分利用通道维度与空间维度之间的跨维交互作用,增强有价值信息的特征表示。然后将改进的三重注意力模块与残差级联块封装成一个复合模块,使用该复合模块替换原始U-Net中的双卷积模块,帮助DA-Net获得更强大的特征提取能力。最后,使用像素位置感知损失训练网络模型,训练得到的DANet模型不仅获得了较高的分割精度,而且具有良好的泛化能力和鲁棒性。
基于改进U-Net的肝脏CT图像自动分割方法研究
这是一篇关于肝脏,分割,U-Net,残余连接,深度监督机制的论文, 主要内容为肝癌是癌症致死的主要原因之一,精准的肝脏分割是癌症诊断和治疗的重要前提。传统上,分割任务通常是由放射科专家手动完成的。然而,该过程通常枯燥乏味、费时费力、且很容易受到医生主观意识的影响,因此临床上迫切需要精准的肝脏自动分割方法来实现计算机辅助诊断。为了解决这个问题,本文将以当下非常流行的并且适用于医学图像分割的深度学习网络框架U-Net为基础,并根据肝脏图像输入维度的不同(2D、3D和2.5D),来依次探讨该网络结构对肝脏分割的影响。主要研究工作如下:(1)针对肝脏CT图像一些如小肝脏区域、肝脏不连续区域和肝脏边界含有肿瘤等难分割示例,本文提出了一种基于2D自适应的多尺度U-Net肝脏自动分割方法。在该方法中主要提出了一个SAR-U-Net模型。该模型在传统UNet编码区的每次卷积操作之后,引入注意力模块:压缩与激励模块(Squeeze and Excitation Block,SE),使其自适应地提取影像特征,抑制无关区域,突出分割任务的相关特征;其次,将连接U-Net编码器与解码器的过渡层和解码器的输出层,替换为空洞空间金字塔池(Atrous Spatial Pyramidal Pooling,ASPP),该模块可以提取不同层次的图像信息,通过使用不同比例大小的空洞采样率来构建具有不同感知领域的卷积核而获得的;然后,将传统的卷积块替换成残差块,来缓解梯度爆炸问题,并促使网络提取更加复杂的特征;接着,为了解决肝脏图像类别不平衡的现象,本文提出了一种改进的交叉熵损失函数;最后,通过大量的实验来验证了该方法的有效性。(2)针对2D分割模型无法充分利用3D医学图像z轴上的空间信息的难点,本文提出了一种基于3D深度监督的多尺度U-Net肝脏自动分割方法。在该方法中主要提出了一个3DSAI-U-Net模型。该模型首先使用3D卷积代替2D卷积来充分利用医学图像切片之间的信息;其次,同样也使用残余连接替换标准卷积;然后,将连接网络编码区与解码器的桥梁替换成带有残余连接的空洞Inception模块;然后,在网络的解码区域引入深度监督机制,使网络能够充分利用图像在浅层的信息,确保顶层输出的合理性与高精准性。此外,为了更好平衡分割区域与非分割区域,降低假阳性与假阴性出现的比例,在网络训练和验证过程中使用Tversky损失函数,并且通过不断调整损失函数中的超参数可以使得网络朝着更高的精准性或鲁棒性方向调整。最后,通过大量的试验来验证该模型的有效性。(3)针对3D网络参数量大、耗费大量计算资源导致训练困难的问题,本文提出了一种基于2.5D轻量级的多尺度U-Net肝肿瘤自动分割方法。在该方法中主要提出了一个RIU-Net模型。该方法既可以精准的分割肝脏也可以高效的分割出肝肿瘤。该方法首先将2.5D的训练方式应用在CNN网络中,即网络的输入采用切片间相邻的形式,与此同时生成与这些切片数中中心片相对应的分割图;所提出的模型结合了残差与Inception模块的优势,相较于其他2D和3D网络,网络参数大幅减少,加快了模型收敛速度,节省了内存;之后,为了加快模型收敛速度,本文采用了交叉熵与Dice损失相结合的损失函数组合;最后,通过大量的试验证明了该方法既轻量也高效。
基于图神经网络的3D视觉研究
这是一篇关于3D计算机视觉,点云,图神经网络,分类,分割的论文, 主要内容为3D视觉在工业领域,建筑领域,军事领域,医疗卫生领域,数字娱乐领域等领域都有着广泛的应用。经典算法Point Net存在鲁棒性较差、编码器提取特征能力有限、缺乏局部性特征等问题。针对这些问题,本文基于图神经网络提出了利用卷积的思想动态创建邻域图并将提取到不同层级的特征进行拼接的方案,最后通过物体分类、部件分割、语义分割三个实验结果数据验证了本文算法的可行性与创新性。本文取得的主要创新点如下:(1)针对鲁棒性较差问题,本文采用了动态构建动态图的方式,进行部件分割实验在大量缺失点的物体上得到的m Io U(交并比)高于基于Point Net得到的实验结果10%以上,而在完整的物体上得到的m Io U仅高于基于Point Net得到的实验结果1.4%,对比得出在数据点大量缺失的情况下,本文算法性能并没有和Point Net一样出现明显的下降,证明了本文提出的算法具有较强的鲁棒性。(2)针对编码器瓶颈问题,本文将卷积的思想应用到点云处理上对特征进行更有效的提取,本文算法在物体分类实验得到的平均准确率高于基于Point Net得到的平均准确率0.57%,在部件分割实验得到的每类物体的m Io U均高于基于Point Net得到的实验结果1%以上,证明了本文提出的编码器对特征的提取能力更强。(3)针对局部特征能力差问题,本文采用对不同级别的特征进行分别提取然后拼接到一起的方法得到一系列不同尺寸的感受野。Point Net没法进行语义分割实验,而本文在语义分割实验结果可视化之后预测值与真实值比较接近,大部分物体得到的Io U都高于70%,其中地板的Io U高达95.7%,证明了本文提出的算法解决了Point Net局部特征能力差的问题以及本文提出的算法在语义分割任务上的可行性。
基于改进U-Net的肝脏CT图像自动分割方法研究
这是一篇关于肝脏,分割,U-Net,残余连接,深度监督机制的论文, 主要内容为肝癌是癌症致死的主要原因之一,精准的肝脏分割是癌症诊断和治疗的重要前提。传统上,分割任务通常是由放射科专家手动完成的。然而,该过程通常枯燥乏味、费时费力、且很容易受到医生主观意识的影响,因此临床上迫切需要精准的肝脏自动分割方法来实现计算机辅助诊断。为了解决这个问题,本文将以当下非常流行的并且适用于医学图像分割的深度学习网络框架U-Net为基础,并根据肝脏图像输入维度的不同(2D、3D和2.5D),来依次探讨该网络结构对肝脏分割的影响。主要研究工作如下:(1)针对肝脏CT图像一些如小肝脏区域、肝脏不连续区域和肝脏边界含有肿瘤等难分割示例,本文提出了一种基于2D自适应的多尺度U-Net肝脏自动分割方法。在该方法中主要提出了一个SAR-U-Net模型。该模型在传统UNet编码区的每次卷积操作之后,引入注意力模块:压缩与激励模块(Squeeze and Excitation Block,SE),使其自适应地提取影像特征,抑制无关区域,突出分割任务的相关特征;其次,将连接U-Net编码器与解码器的过渡层和解码器的输出层,替换为空洞空间金字塔池(Atrous Spatial Pyramidal Pooling,ASPP),该模块可以提取不同层次的图像信息,通过使用不同比例大小的空洞采样率来构建具有不同感知领域的卷积核而获得的;然后,将传统的卷积块替换成残差块,来缓解梯度爆炸问题,并促使网络提取更加复杂的特征;接着,为了解决肝脏图像类别不平衡的现象,本文提出了一种改进的交叉熵损失函数;最后,通过大量的实验来验证了该方法的有效性。(2)针对2D分割模型无法充分利用3D医学图像z轴上的空间信息的难点,本文提出了一种基于3D深度监督的多尺度U-Net肝脏自动分割方法。在该方法中主要提出了一个3DSAI-U-Net模型。该模型首先使用3D卷积代替2D卷积来充分利用医学图像切片之间的信息;其次,同样也使用残余连接替换标准卷积;然后,将连接网络编码区与解码器的桥梁替换成带有残余连接的空洞Inception模块;然后,在网络的解码区域引入深度监督机制,使网络能够充分利用图像在浅层的信息,确保顶层输出的合理性与高精准性。此外,为了更好平衡分割区域与非分割区域,降低假阳性与假阴性出现的比例,在网络训练和验证过程中使用Tversky损失函数,并且通过不断调整损失函数中的超参数可以使得网络朝着更高的精准性或鲁棒性方向调整。最后,通过大量的试验来验证该模型的有效性。(3)针对3D网络参数量大、耗费大量计算资源导致训练困难的问题,本文提出了一种基于2.5D轻量级的多尺度U-Net肝肿瘤自动分割方法。在该方法中主要提出了一个RIU-Net模型。该方法既可以精准的分割肝脏也可以高效的分割出肝肿瘤。该方法首先将2.5D的训练方式应用在CNN网络中,即网络的输入采用切片间相邻的形式,与此同时生成与这些切片数中中心片相对应的分割图;所提出的模型结合了残差与Inception模块的优势,相较于其他2D和3D网络,网络参数大幅减少,加快了模型收敛速度,节省了内存;之后,为了加快模型收敛速度,本文采用了交叉熵与Dice损失相结合的损失函数组合;最后,通过大量的试验证明了该方法既轻量也高效。
基于深度神经网络的宫颈癌智能辅助诊断方法研究
这是一篇关于深度学习,卷积神经网络,多分类,分割,宫颈癌,阴道镜图像的论文, 主要内容为宫颈癌是一种原发于子宫颈的恶性肿瘤。其早期治愈率极高,所以通过早期筛查确定子宫颈上皮内瘤变和宫颈癌对于及时预防和治疗宫颈癌具有重要意义。阴道镜检查是临床上筛查宫颈癌最常用的方法之一,用于指导宫颈癌筛查前的活检,但其准确率、敏感度和特异度受临床医生的经验水平影响,不同的阴道镜医师之间病变的检出率存在显著差异,易导致漏诊、误诊等问题。同时,目前我国的患者数量与有经验的阴道镜医生数量不匹配,导致部分患者无法及时就诊。基于深度学习的图像分类和分割技术在计算机辅助诊断上表现良好,能够有效缓解当前宫颈癌筛查的压力。本文针对阴道镜下宫颈病变特征不明显、多尺度和不规则的识别难点,研究并实现了分类和分割两种模型在宫颈病变检测中的应用,具体研究内容包括:(1)针对性地构建了两个类型的宫颈病变数据集:多分类数据集和分割数据集。在多分类数据集的构建中,将图像分为LSIL、HSIL、宫颈癌、宫颈赘生物和正常五个类别,按照训练集:验证集:测试集=9:1:1的比例将图像分为三部分。在分割数据集的构建中,以病理结果作为金标准用Labelme软件对阴道镜图像中的病变部位进行标注,按照训练集:测试集:验证集=4:1:1的比例将图像分为三部分。两种数据集都进行了图像增广处理,可有效提升训练模型的泛化能力。(2)提出了一种基于改进ShuffleNet-V2的轻量化宫颈病变多分类模型。分别加入了通道注意力机制SKNet和SENet,让网络提高对病变区域的关注,抑制不重要的背景信息。实验结果显示,两种改进的网络比原网络的分类准确率分别提升了0.86%和1.01%,加入SENet对网络性能的提升更为显著。此外,通过对比改进网络和其它网络的分类准确率及模型尺寸,证明改进后的网络综合性能达到最优。(3)提出了一种基于改进U-Net的宫颈病变区域分割模型。与基础网络U-Net相比,改进后的网络加入了特征金字塔结构,提取了多尺度信息,可以更好地识别点状血管等细小特征,并且针对宫颈病变区域大小形状不规则的问题,加入了动态感受野模块,提升了模型捕捉边界信息的能力。实验结果显示,改进后的模型的分割准确率比原网络提高了3.4%,证明了对模型的改进可有效提高宫颈病变区域分割的性能,实现了分割病变区域的任务。
基于图神经网络的3D视觉研究
这是一篇关于3D计算机视觉,点云,图神经网络,分类,分割的论文, 主要内容为3D视觉在工业领域,建筑领域,军事领域,医疗卫生领域,数字娱乐领域等领域都有着广泛的应用。经典算法Point Net存在鲁棒性较差、编码器提取特征能力有限、缺乏局部性特征等问题。针对这些问题,本文基于图神经网络提出了利用卷积的思想动态创建邻域图并将提取到不同层级的特征进行拼接的方案,最后通过物体分类、部件分割、语义分割三个实验结果数据验证了本文算法的可行性与创新性。本文取得的主要创新点如下:(1)针对鲁棒性较差问题,本文采用了动态构建动态图的方式,进行部件分割实验在大量缺失点的物体上得到的m Io U(交并比)高于基于Point Net得到的实验结果10%以上,而在完整的物体上得到的m Io U仅高于基于Point Net得到的实验结果1.4%,对比得出在数据点大量缺失的情况下,本文算法性能并没有和Point Net一样出现明显的下降,证明了本文提出的算法具有较强的鲁棒性。(2)针对编码器瓶颈问题,本文将卷积的思想应用到点云处理上对特征进行更有效的提取,本文算法在物体分类实验得到的平均准确率高于基于Point Net得到的平均准确率0.57%,在部件分割实验得到的每类物体的m Io U均高于基于Point Net得到的实验结果1%以上,证明了本文提出的编码器对特征的提取能力更强。(3)针对局部特征能力差问题,本文采用对不同级别的特征进行分别提取然后拼接到一起的方法得到一系列不同尺寸的感受野。Point Net没法进行语义分割实验,而本文在语义分割实验结果可视化之后预测值与真实值比较接近,大部分物体得到的Io U都高于70%,其中地板的Io U高达95.7%,证明了本文提出的算法解决了Point Net局部特征能力差的问题以及本文提出的算法在语义分割任务上的可行性。
果蔬类果实与果梗分割及采摘点定位
这是一篇关于果蔬,深度学习,组合模型,分割,采摘点的论文, 主要内容为我国是一个农业大国,果蔬类生产在自产自销及出口方面,拥有很大的经济效益以及无限的市场前景。依靠人力、成本高、效率低的非智能化果蔬采收逐渐向农业产业现代化发展已经是大势所趋,而准确识别果实采摘点定位恰恰是智能采摘机器人最重要的能力。本文研究的是在温室大棚环境下,通过深度学习技术,提出了利用Res Net骨干网络结合Annet、Deeplabv3、Gcnet模型的通用组合模型对所采集的青椒、草莓、番茄、葡萄四种果蔬的果实果梗分割与定位采摘点进行实验研究,在该方法中,首先建立了四种果蔬的数据集,然后人为对果蔬果实果梗进行多边形标记,最后通过组合模型对数据集进行建模实验,分析对比不同骨干网络同一模型和同一骨干网络不同模型的果实果梗分割能力,从而得到最优分割组合模型,配合采摘点定位步骤,实验结果表明,该方法能够有效对果蔬类果实与果梗进行分割及定位采摘点,研究内容可为农业智能化生产中的果蔬采摘提供夯实的理论基础及较高的技术支持。本文的主要内容:对果蔬类果实与果梗分割及采摘点进行了较详细的研究,对各个模型方法进行了充分的实验对比分析,使用含有空洞卷积的残差网络、颜色模型及优化后特征金字塔模块来对果蔬图像进行训练、图像分割,增加果梗部位质心点计算方法,实现在复杂的背景环境下,完成对四种果蔬的果实、果梗精确分割,采摘点精准定位,具体表现如下;(1)基于Annet模型和ResNet50骨干网络的组合模型在青椒果蔬果实与果梗分割中能够取得最优分割效果,其评价指标MPA为0.9720、mIoU为0.7687、Kappa值为0.9839;(2)基于Gcnet模型和ResNet101骨干网络的组合模型在草莓果蔬果实与果梗分割中能够取得最优分割效果,MPA是0.8997、mIoU为0.3809、Kappa值为0.8523;(3)基于Gcnet模型和ResNet50骨干网络的组合模型在番茄果蔬果实与果梗分割中能够取得最优分割效果,MPA是0.9706、mIoU为0.6881、Kappa值为0.9839;(4)基于Gcnet模型和ResNet50骨干网络的组合模型在葡萄果蔬果实与果梗分割中能够取得最优分割效果,MPA是0.9804、mIoU为0.7717、Kappa值为0.9356;(5)在四种果蔬的最优模型中配合采摘点定位步骤,可以较准确地发现采摘点及采摘区域。
基于深度神经网络的宫颈癌智能辅助诊断方法研究
这是一篇关于深度学习,卷积神经网络,多分类,分割,宫颈癌,阴道镜图像的论文, 主要内容为宫颈癌是一种原发于子宫颈的恶性肿瘤。其早期治愈率极高,所以通过早期筛查确定子宫颈上皮内瘤变和宫颈癌对于及时预防和治疗宫颈癌具有重要意义。阴道镜检查是临床上筛查宫颈癌最常用的方法之一,用于指导宫颈癌筛查前的活检,但其准确率、敏感度和特异度受临床医生的经验水平影响,不同的阴道镜医师之间病变的检出率存在显著差异,易导致漏诊、误诊等问题。同时,目前我国的患者数量与有经验的阴道镜医生数量不匹配,导致部分患者无法及时就诊。基于深度学习的图像分类和分割技术在计算机辅助诊断上表现良好,能够有效缓解当前宫颈癌筛查的压力。本文针对阴道镜下宫颈病变特征不明显、多尺度和不规则的识别难点,研究并实现了分类和分割两种模型在宫颈病变检测中的应用,具体研究内容包括:(1)针对性地构建了两个类型的宫颈病变数据集:多分类数据集和分割数据集。在多分类数据集的构建中,将图像分为LSIL、HSIL、宫颈癌、宫颈赘生物和正常五个类别,按照训练集:验证集:测试集=9:1:1的比例将图像分为三部分。在分割数据集的构建中,以病理结果作为金标准用Labelme软件对阴道镜图像中的病变部位进行标注,按照训练集:测试集:验证集=4:1:1的比例将图像分为三部分。两种数据集都进行了图像增广处理,可有效提升训练模型的泛化能力。(2)提出了一种基于改进ShuffleNet-V2的轻量化宫颈病变多分类模型。分别加入了通道注意力机制SKNet和SENet,让网络提高对病变区域的关注,抑制不重要的背景信息。实验结果显示,两种改进的网络比原网络的分类准确率分别提升了0.86%和1.01%,加入SENet对网络性能的提升更为显著。此外,通过对比改进网络和其它网络的分类准确率及模型尺寸,证明改进后的网络综合性能达到最优。(3)提出了一种基于改进U-Net的宫颈病变区域分割模型。与基础网络U-Net相比,改进后的网络加入了特征金字塔结构,提取了多尺度信息,可以更好地识别点状血管等细小特征,并且针对宫颈病变区域大小形状不规则的问题,加入了动态感受野模块,提升了模型捕捉边界信息的能力。实验结果显示,改进后的模型的分割准确率比原网络提高了3.4%,证明了对模型的改进可有效提高宫颈病变区域分割的性能,实现了分割病变区域的任务。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计工坊 ,原文地址:https://m.bishedaima.com/lunwen/54210.html