基于深度学习的舌象特征识别算法研究与应用
这是一篇关于舌诊,深度学习,神经网络,目标检测,分割的论文, 主要内容为目的:为了解决传统中医诊断方法高度依赖医者经验与治病思路问题,突破中医传承与发展困难的局面,将深度学习技术与传统中医舌诊理论结合,研究标准化、客观化、智能化的现代中医舌诊技术。以语义分割、目标检测等深度学习神经网络搭建计算机诊断模型,探索自动化舌诊在慢病管理等方面的临床应用。方法:使用舌诊仪器采集临床舌面数据,经过数据清洗、数据预处理,将处理后的舌面图片数据随机分为70%训练集和30%测试集,进行后续舌象分割、分类实验。舌象分割实验:使用训练集数据完成算法模型训练,再使用测试集数据验证U-Net、Seg-Net、Deeplab V3和PSPNet4种算法的分割精度,通过对比4种舌象分割算法性能指标数据,得出较优算法。舌象分类实验:将舌诊图像按照疾病证型进行分类标记,使用目标检测算法对舌象进行特征提取和分类,以达到输入图片,输出证型的结果,实现舌诊智能化、客观化。结果:1.舌象分割实验U-Net模型MIo U结果84.00%,MPA为89.38%,Precision为91.90%,Recall为89.38%。Seg-Net模型MIo U结果80.09%,MPA为87.14%,Precision为88.53%,Recall为87.14%。Deeplab V3模型MIo U结果59.68%,MPA为61.33%,Precision为84.21%,Recall为61.33%。PSPNet模型MIo U结果67.80%,MPA为72.56%,Precision为82.71%,Recall为72.56%。根据MIo U、MPA、Recall、Precision四项指标结果对比可得出,U-Net模型在分割准确度方面明显优于其他3种算法。证明在本研究实验环境下,U-Net算法的分割性能较为优秀。2.舌象分类实验本研究选用Yolo V5模型进行舌象分类实验。由于标记后的图片证型分类准确率不高,仅根据舌象无法准确判断证型,因此第一次使用Yolo V5算法模型进行舌象分类结果较差,分类精确率39%。第二次实验重新标记数据集,并删除低质量数据,保持数据均匀分布,使用Yolo V5算法进行舌象分类,在新数据集上有良好的表现,精确率提升至62%。第三次实验将Yolo V5模型中的随机梯度下降换成小批量梯度下降,精确率提升至76%。结论:本研究完成了从数据采集、数据预处理到舌象分割、舌象分类等舌诊客观化流程中的环节,实现了以舌象图片为输入端,高血压证型为输出端的目标,分类精确率达76%,为舌诊客观化在临床的应用提供了思路。同时研究发现,舌诊数据种类复杂,与证型关联性较强,数据处理过程中易被其他疾病信息干扰,可直接影响处理结果,因此后续舌诊客观化研究需要建立舌象数据处理标准,减少因缺少标准、数据质量不高导致的舌象处理效果不佳问题。
基于改进U-Net的肝脏CT图像自动分割方法研究
这是一篇关于肝脏,分割,U-Net,残余连接,深度监督机制的论文, 主要内容为肝癌是癌症致死的主要原因之一,精准的肝脏分割是癌症诊断和治疗的重要前提。传统上,分割任务通常是由放射科专家手动完成的。然而,该过程通常枯燥乏味、费时费力、且很容易受到医生主观意识的影响,因此临床上迫切需要精准的肝脏自动分割方法来实现计算机辅助诊断。为了解决这个问题,本文将以当下非常流行的并且适用于医学图像分割的深度学习网络框架U-Net为基础,并根据肝脏图像输入维度的不同(2D、3D和2.5D),来依次探讨该网络结构对肝脏分割的影响。主要研究工作如下:(1)针对肝脏CT图像一些如小肝脏区域、肝脏不连续区域和肝脏边界含有肿瘤等难分割示例,本文提出了一种基于2D自适应的多尺度U-Net肝脏自动分割方法。在该方法中主要提出了一个SAR-U-Net模型。该模型在传统UNet编码区的每次卷积操作之后,引入注意力模块:压缩与激励模块(Squeeze and Excitation Block,SE),使其自适应地提取影像特征,抑制无关区域,突出分割任务的相关特征;其次,将连接U-Net编码器与解码器的过渡层和解码器的输出层,替换为空洞空间金字塔池(Atrous Spatial Pyramidal Pooling,ASPP),该模块可以提取不同层次的图像信息,通过使用不同比例大小的空洞采样率来构建具有不同感知领域的卷积核而获得的;然后,将传统的卷积块替换成残差块,来缓解梯度爆炸问题,并促使网络提取更加复杂的特征;接着,为了解决肝脏图像类别不平衡的现象,本文提出了一种改进的交叉熵损失函数;最后,通过大量的实验来验证了该方法的有效性。(2)针对2D分割模型无法充分利用3D医学图像z轴上的空间信息的难点,本文提出了一种基于3D深度监督的多尺度U-Net肝脏自动分割方法。在该方法中主要提出了一个3DSAI-U-Net模型。该模型首先使用3D卷积代替2D卷积来充分利用医学图像切片之间的信息;其次,同样也使用残余连接替换标准卷积;然后,将连接网络编码区与解码器的桥梁替换成带有残余连接的空洞Inception模块;然后,在网络的解码区域引入深度监督机制,使网络能够充分利用图像在浅层的信息,确保顶层输出的合理性与高精准性。此外,为了更好平衡分割区域与非分割区域,降低假阳性与假阴性出现的比例,在网络训练和验证过程中使用Tversky损失函数,并且通过不断调整损失函数中的超参数可以使得网络朝着更高的精准性或鲁棒性方向调整。最后,通过大量的试验来验证该模型的有效性。(3)针对3D网络参数量大、耗费大量计算资源导致训练困难的问题,本文提出了一种基于2.5D轻量级的多尺度U-Net肝肿瘤自动分割方法。在该方法中主要提出了一个RIU-Net模型。该方法既可以精准的分割肝脏也可以高效的分割出肝肿瘤。该方法首先将2.5D的训练方式应用在CNN网络中,即网络的输入采用切片间相邻的形式,与此同时生成与这些切片数中中心片相对应的分割图;所提出的模型结合了残差与Inception模块的优势,相较于其他2D和3D网络,网络参数大幅减少,加快了模型收敛速度,节省了内存;之后,为了加快模型收敛速度,本文采用了交叉熵与Dice损失相结合的损失函数组合;最后,通过大量的试验证明了该方法既轻量也高效。
果蔬类果实与果梗分割及采摘点定位
这是一篇关于果蔬,深度学习,组合模型,分割,采摘点的论文, 主要内容为我国是一个农业大国,果蔬类生产在自产自销及出口方面,拥有很大的经济效益以及无限的市场前景。依靠人力、成本高、效率低的非智能化果蔬采收逐渐向农业产业现代化发展已经是大势所趋,而准确识别果实采摘点定位恰恰是智能采摘机器人最重要的能力。本文研究的是在温室大棚环境下,通过深度学习技术,提出了利用Res Net骨干网络结合Annet、Deeplabv3、Gcnet模型的通用组合模型对所采集的青椒、草莓、番茄、葡萄四种果蔬的果实果梗分割与定位采摘点进行实验研究,在该方法中,首先建立了四种果蔬的数据集,然后人为对果蔬果实果梗进行多边形标记,最后通过组合模型对数据集进行建模实验,分析对比不同骨干网络同一模型和同一骨干网络不同模型的果实果梗分割能力,从而得到最优分割组合模型,配合采摘点定位步骤,实验结果表明,该方法能够有效对果蔬类果实与果梗进行分割及定位采摘点,研究内容可为农业智能化生产中的果蔬采摘提供夯实的理论基础及较高的技术支持。本文的主要内容:对果蔬类果实与果梗分割及采摘点进行了较详细的研究,对各个模型方法进行了充分的实验对比分析,使用含有空洞卷积的残差网络、颜色模型及优化后特征金字塔模块来对果蔬图像进行训练、图像分割,增加果梗部位质心点计算方法,实现在复杂的背景环境下,完成对四种果蔬的果实、果梗精确分割,采摘点精准定位,具体表现如下;(1)基于Annet模型和ResNet50骨干网络的组合模型在青椒果蔬果实与果梗分割中能够取得最优分割效果,其评价指标MPA为0.9720、mIoU为0.7687、Kappa值为0.9839;(2)基于Gcnet模型和ResNet101骨干网络的组合模型在草莓果蔬果实与果梗分割中能够取得最优分割效果,MPA是0.8997、mIoU为0.3809、Kappa值为0.8523;(3)基于Gcnet模型和ResNet50骨干网络的组合模型在番茄果蔬果实与果梗分割中能够取得最优分割效果,MPA是0.9706、mIoU为0.6881、Kappa值为0.9839;(4)基于Gcnet模型和ResNet50骨干网络的组合模型在葡萄果蔬果实与果梗分割中能够取得最优分割效果,MPA是0.9804、mIoU为0.7717、Kappa值为0.9356;(5)在四种果蔬的最优模型中配合采摘点定位步骤,可以较准确地发现采摘点及采摘区域。
基于深度学习的舌象特征识别算法研究与应用
这是一篇关于舌诊,深度学习,神经网络,目标检测,分割的论文, 主要内容为目的:为了解决传统中医诊断方法高度依赖医者经验与治病思路问题,突破中医传承与发展困难的局面,将深度学习技术与传统中医舌诊理论结合,研究标准化、客观化、智能化的现代中医舌诊技术。以语义分割、目标检测等深度学习神经网络搭建计算机诊断模型,探索自动化舌诊在慢病管理等方面的临床应用。方法:使用舌诊仪器采集临床舌面数据,经过数据清洗、数据预处理,将处理后的舌面图片数据随机分为70%训练集和30%测试集,进行后续舌象分割、分类实验。舌象分割实验:使用训练集数据完成算法模型训练,再使用测试集数据验证U-Net、Seg-Net、Deeplab V3和PSPNet4种算法的分割精度,通过对比4种舌象分割算法性能指标数据,得出较优算法。舌象分类实验:将舌诊图像按照疾病证型进行分类标记,使用目标检测算法对舌象进行特征提取和分类,以达到输入图片,输出证型的结果,实现舌诊智能化、客观化。结果:1.舌象分割实验U-Net模型MIo U结果84.00%,MPA为89.38%,Precision为91.90%,Recall为89.38%。Seg-Net模型MIo U结果80.09%,MPA为87.14%,Precision为88.53%,Recall为87.14%。Deeplab V3模型MIo U结果59.68%,MPA为61.33%,Precision为84.21%,Recall为61.33%。PSPNet模型MIo U结果67.80%,MPA为72.56%,Precision为82.71%,Recall为72.56%。根据MIo U、MPA、Recall、Precision四项指标结果对比可得出,U-Net模型在分割准确度方面明显优于其他3种算法。证明在本研究实验环境下,U-Net算法的分割性能较为优秀。2.舌象分类实验本研究选用Yolo V5模型进行舌象分类实验。由于标记后的图片证型分类准确率不高,仅根据舌象无法准确判断证型,因此第一次使用Yolo V5算法模型进行舌象分类结果较差,分类精确率39%。第二次实验重新标记数据集,并删除低质量数据,保持数据均匀分布,使用Yolo V5算法进行舌象分类,在新数据集上有良好的表现,精确率提升至62%。第三次实验将Yolo V5模型中的随机梯度下降换成小批量梯度下降,精确率提升至76%。结论:本研究完成了从数据采集、数据预处理到舌象分割、舌象分类等舌诊客观化流程中的环节,实现了以舌象图片为输入端,高血压证型为输出端的目标,分类精确率达76%,为舌诊客观化在临床的应用提供了思路。同时研究发现,舌诊数据种类复杂,与证型关联性较强,数据处理过程中易被其他疾病信息干扰,可直接影响处理结果,因此后续舌诊客观化研究需要建立舌象数据处理标准,减少因缺少标准、数据质量不高导致的舌象处理效果不佳问题。
果蔬类果实与果梗分割及采摘点定位
这是一篇关于果蔬,深度学习,组合模型,分割,采摘点的论文, 主要内容为我国是一个农业大国,果蔬类生产在自产自销及出口方面,拥有很大的经济效益以及无限的市场前景。依靠人力、成本高、效率低的非智能化果蔬采收逐渐向农业产业现代化发展已经是大势所趋,而准确识别果实采摘点定位恰恰是智能采摘机器人最重要的能力。本文研究的是在温室大棚环境下,通过深度学习技术,提出了利用Res Net骨干网络结合Annet、Deeplabv3、Gcnet模型的通用组合模型对所采集的青椒、草莓、番茄、葡萄四种果蔬的果实果梗分割与定位采摘点进行实验研究,在该方法中,首先建立了四种果蔬的数据集,然后人为对果蔬果实果梗进行多边形标记,最后通过组合模型对数据集进行建模实验,分析对比不同骨干网络同一模型和同一骨干网络不同模型的果实果梗分割能力,从而得到最优分割组合模型,配合采摘点定位步骤,实验结果表明,该方法能够有效对果蔬类果实与果梗进行分割及定位采摘点,研究内容可为农业智能化生产中的果蔬采摘提供夯实的理论基础及较高的技术支持。本文的主要内容:对果蔬类果实与果梗分割及采摘点进行了较详细的研究,对各个模型方法进行了充分的实验对比分析,使用含有空洞卷积的残差网络、颜色模型及优化后特征金字塔模块来对果蔬图像进行训练、图像分割,增加果梗部位质心点计算方法,实现在复杂的背景环境下,完成对四种果蔬的果实、果梗精确分割,采摘点精准定位,具体表现如下;(1)基于Annet模型和ResNet50骨干网络的组合模型在青椒果蔬果实与果梗分割中能够取得最优分割效果,其评价指标MPA为0.9720、mIoU为0.7687、Kappa值为0.9839;(2)基于Gcnet模型和ResNet101骨干网络的组合模型在草莓果蔬果实与果梗分割中能够取得最优分割效果,MPA是0.8997、mIoU为0.3809、Kappa值为0.8523;(3)基于Gcnet模型和ResNet50骨干网络的组合模型在番茄果蔬果实与果梗分割中能够取得最优分割效果,MPA是0.9706、mIoU为0.6881、Kappa值为0.9839;(4)基于Gcnet模型和ResNet50骨干网络的组合模型在葡萄果蔬果实与果梗分割中能够取得最优分割效果,MPA是0.9804、mIoU为0.7717、Kappa值为0.9356;(5)在四种果蔬的最优模型中配合采摘点定位步骤,可以较准确地发现采摘点及采摘区域。
基于深度学习的三维点云分类分割算法
这是一篇关于点云,空间编码,卷积神经网络,分类,分割,注意力的论文, 主要内容为点云作为一种重要的数据存储方式,在计算机视觉、自动驾驶和机器人技术等领域都有着广泛的应用。深度学习作为人工智能的主导技术也成功的用于解决各种二维视觉问题。然而,使用深度神经网络去处理点云仍旧面临着独特的挑战。由于点云存储的是物体表面的坐标信息,并不会受到存储顺序的影响,因此点云的输入地输入是具有无序性的。此外点云中的每个坐标都是一个信息点,而单个信息点并不具备结构信息。这些独特的结构性问题都使得常规的用于处理二维视觉的深度学习方法难以应用到点云上。针对上述存在的问题,本文主要展开了以下两部分工作。(1)针对点云的分类和分割任务提出了基于图Transformer网络的分类分割算法。图卷积网络通过构建局部结构的方式应对点云结构性问题,Transformer网络则在处理无序性信息时则有着天然的优势。因此本部分工作的主要目的是结合图卷积网络和Transformer网络独特优势,寻求一种方式融合图卷积特征和Transformer特征。除此之外,还针对点云的特性,在Transformer网络中加入了空间编码信息,用来提高Transformer网络空间表达能力。为了有效融合两种特征,还设计了差异性通道注意力网络,用来学习各个通道之间的差异性,降低信息冗余。在数据集Model Net40、Scan Object NN和Shape Net Part上的实验证明了该部分工作在分类和分割任务上的有效性。(2)针对点云的分类任务提出了基于特征关系卷积的分类算法。通过考虑局部结构的构建、全局特征聚合和损失函数改进三个方面,构造了一个有效的点云分类网络。首先,针对点云的不均匀性和非结构性,通过中心点与近邻点之间的特征关系,为不规则的近邻点分配不同的权重,以此构建局部结构。此外,使用注意力的思想,提出了加权平均池化,通过自注意力的方式,学习每个高维特征的注意力分数,在保证整体网络对称性的同时,可以有效地聚合冗余的高维特征。另外,针对分类任务,利用了交叉熵损失与中心损失之间的互补关系提出了联合损失,进一步提高了网络的分类性能。最后,在合成数据集Model Net40和Shape Net Core以及真实数据集Scan Object NN上进行实验,与其它先进网络的对比结果证明了整体网络结构的优越性。
一种基于ResU-Net深度网络的前列腺MR图像分割方法研究
这是一篇关于分割,深度学习,前列腺,MR图像的论文, 主要内容为前列腺疾病(例如前列腺癌,前列腺肥大,前列腺炎,前列腺增生等)是一类常见的男性疾病。对这些疾病的诊断、治疗及预后方案十分依赖前列腺的MR图像分析,准确地将前列腺MR图像中的前列腺区域分割出来是以上流程中的关键步骤。然而,由于前列腺组织形变大、周围轮廓模糊,由影像学医生手动地分割图像是费时费力的,并且伴随着有限的可复现性。因此,临床上非常需要高效精确的自动分割方法。近年来,随着深度学习的发展,深度学习已经在图像分类领域取得了重大的进展,目前已有将深度学医应用在前列腺MR图像分割上的例子,但是受限于训练样本过少,类别不平衡的问题,导致训练过程不稳定,并且设计的网络没有针对前列腺MR图像进行优化,导致精度不够高,同时缺少针对前列腺MR图像的预处理步骤,给在前列腺MR图像分割问题中发展深度学习方法带来了困难。针对这些问题,本文提出了一种基于深度学习的前列腺MR图像分割方法。通过将前列腺MR图像的分割问题分解为3个阶段:图像预处理阶段、网络训练阶段、网络推理阶段,实现了整体算法的低耦合和高内聚。在图像预处理阶段,本文将把焦点放在图像本身,通过分析图像的模态、体素间距、尺寸大小等属性,对图像执行格式统一、尺寸裁剪、体素值截断、重采样、归一化等操作,并以此为依据设计分割网络超参数;在网络训练阶段,本文使用U-Net与Res Net结合的网络Res U-Net,实现网络的加速收敛;同时针对类别不平衡的问题,在数据源层面设计了过采样策略,平衡了正负样本的比例,缓解了网络输入中类别不平衡的问题;在损失函数层面,使用了交叉熵加上Dice系数的损失函数,使得网络更加关注前景区域;在网络推理阶段,通过改进原有的滑动窗口策略,将原来的三层循环减少为两层循环,提高GPU利用率,进而加快了推理速度,并且设计了一种高斯模板用于与网络输出相乘,减少了由于网络内部零填充过多导致的边缘分割不准确的问题。本文在多个数据集上和该领域的其他方法进行了对比,并对自身做了充分的消融分析,通过实验论证,证实了所提出方法的有效性。
基于图神经网络的3D视觉研究
这是一篇关于3D计算机视觉,点云,图神经网络,分类,分割的论文, 主要内容为3D视觉在工业领域,建筑领域,军事领域,医疗卫生领域,数字娱乐领域等领域都有着广泛的应用。经典算法Point Net存在鲁棒性较差、编码器提取特征能力有限、缺乏局部性特征等问题。针对这些问题,本文基于图神经网络提出了利用卷积的思想动态创建邻域图并将提取到不同层级的特征进行拼接的方案,最后通过物体分类、部件分割、语义分割三个实验结果数据验证了本文算法的可行性与创新性。本文取得的主要创新点如下:(1)针对鲁棒性较差问题,本文采用了动态构建动态图的方式,进行部件分割实验在大量缺失点的物体上得到的m Io U(交并比)高于基于Point Net得到的实验结果10%以上,而在完整的物体上得到的m Io U仅高于基于Point Net得到的实验结果1.4%,对比得出在数据点大量缺失的情况下,本文算法性能并没有和Point Net一样出现明显的下降,证明了本文提出的算法具有较强的鲁棒性。(2)针对编码器瓶颈问题,本文将卷积的思想应用到点云处理上对特征进行更有效的提取,本文算法在物体分类实验得到的平均准确率高于基于Point Net得到的平均准确率0.57%,在部件分割实验得到的每类物体的m Io U均高于基于Point Net得到的实验结果1%以上,证明了本文提出的编码器对特征的提取能力更强。(3)针对局部特征能力差问题,本文采用对不同级别的特征进行分别提取然后拼接到一起的方法得到一系列不同尺寸的感受野。Point Net没法进行语义分割实验,而本文在语义分割实验结果可视化之后预测值与真实值比较接近,大部分物体得到的Io U都高于70%,其中地板的Io U高达95.7%,证明了本文提出的算法解决了Point Net局部特征能力差的问题以及本文提出的算法在语义分割任务上的可行性。
基于深度学习的舌象特征识别算法研究与应用
这是一篇关于舌诊,深度学习,神经网络,目标检测,分割的论文, 主要内容为目的:为了解决传统中医诊断方法高度依赖医者经验与治病思路问题,突破中医传承与发展困难的局面,将深度学习技术与传统中医舌诊理论结合,研究标准化、客观化、智能化的现代中医舌诊技术。以语义分割、目标检测等深度学习神经网络搭建计算机诊断模型,探索自动化舌诊在慢病管理等方面的临床应用。方法:使用舌诊仪器采集临床舌面数据,经过数据清洗、数据预处理,将处理后的舌面图片数据随机分为70%训练集和30%测试集,进行后续舌象分割、分类实验。舌象分割实验:使用训练集数据完成算法模型训练,再使用测试集数据验证U-Net、Seg-Net、Deeplab V3和PSPNet4种算法的分割精度,通过对比4种舌象分割算法性能指标数据,得出较优算法。舌象分类实验:将舌诊图像按照疾病证型进行分类标记,使用目标检测算法对舌象进行特征提取和分类,以达到输入图片,输出证型的结果,实现舌诊智能化、客观化。结果:1.舌象分割实验U-Net模型MIo U结果84.00%,MPA为89.38%,Precision为91.90%,Recall为89.38%。Seg-Net模型MIo U结果80.09%,MPA为87.14%,Precision为88.53%,Recall为87.14%。Deeplab V3模型MIo U结果59.68%,MPA为61.33%,Precision为84.21%,Recall为61.33%。PSPNet模型MIo U结果67.80%,MPA为72.56%,Precision为82.71%,Recall为72.56%。根据MIo U、MPA、Recall、Precision四项指标结果对比可得出,U-Net模型在分割准确度方面明显优于其他3种算法。证明在本研究实验环境下,U-Net算法的分割性能较为优秀。2.舌象分类实验本研究选用Yolo V5模型进行舌象分类实验。由于标记后的图片证型分类准确率不高,仅根据舌象无法准确判断证型,因此第一次使用Yolo V5算法模型进行舌象分类结果较差,分类精确率39%。第二次实验重新标记数据集,并删除低质量数据,保持数据均匀分布,使用Yolo V5算法进行舌象分类,在新数据集上有良好的表现,精确率提升至62%。第三次实验将Yolo V5模型中的随机梯度下降换成小批量梯度下降,精确率提升至76%。结论:本研究完成了从数据采集、数据预处理到舌象分割、舌象分类等舌诊客观化流程中的环节,实现了以舌象图片为输入端,高血压证型为输出端的目标,分类精确率达76%,为舌诊客观化在临床的应用提供了思路。同时研究发现,舌诊数据种类复杂,与证型关联性较强,数据处理过程中易被其他疾病信息干扰,可直接影响处理结果,因此后续舌诊客观化研究需要建立舌象数据处理标准,减少因缺少标准、数据质量不高导致的舌象处理效果不佳问题。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码港湾 ,原文地址:https://m.bishedaima.com/lunwen/48594.html