基于深度卷积神经网络的苹果栽培品种识别研究
这是一篇关于苹果叶片图像,图像识别,残差学习,上下文变换层,λ函数层的论文, 主要内容为随着苹果种质资源的不断开发和新品种的选育,苹果已成为保障我国水果市场周年稳定供应最重要的大宗水果之一。但由于缺乏快速准确鉴定栽培品种的信息技术,使得苹果品种混杂,苗木市场管理混乱,严重影响了我国苹果产业的可持续健康发展。目前,果农主要凭生产经验从果树农艺特征等形态学方面对苹果栽培品种进行识别,该方法无法量化,效率低、工作强度大,精度无法保证,不适用于现代标准化规模种植作业的生产实践。近年来,深度学习算法在计算机视觉领域得到广泛应用,其在大规模识别任务中表现出色,逐渐成为品种识别领域的首选方案。为此,本论文基于深度学习算法,探索了一种利用自然环境下拍摄的栽培品种苹果叶片图像实现苹果品种识别的方法。该方法能够对自然环境下的苹果幼叶、展开叶和成熟叶进行快速、准确地识别。为果树品种的科学布局、苗木的精准化管理、果园作业速度和精度的提高、人工成本的降低、苹果产业的升级以及打赢苹果产业高质量发展攻坚战提供重要技术支撑。本文以我国西北地区主要栽培的苹果品种为研究对象,对其叶片图像进行分类识别实验。本论文的主要工作包括:(1)构建了两套不同场景下苹果叶片图像数据集。自然环境理想化背景下的苹果叶片图像数据集(Apple Leaf Image Dataset with Idealized Background in Natural Environment,ALIDS-IBNE):该数据集包括14个苹果品种的叶片图像,总共14394张,剔除不符合实验条件的图像后,总共14000张图像,并对其进行标签标记,最终构建出ALIDS-IBNE数据集。自然环境下苹果叶片图像数据集(Apple Leaf Image Dataset in Natural Environment,ALIDS-NE):该数据集中包含了30个苹果品种的叶片图像,总共5496张图像;筛选掉不符合实验要求的图像,共计4800张图像;通过图像增强技术进行扩增,最终ALIDS-NE数据集包含24000张苹果叶片图像。(2)针对现有的苹果品种识别方法存在识别条件严苛、精度较低以及鲁棒性不强等问题,优化了一种基于上下文变换的残差卷积神经网络(Contextual Transformer Residual Convolutional Neural Network,Co TRes Net)的苹果叶片识别方法。该网络在Res Net网络模型的基础上引入了上下文变换(Contextual Transformer,Co T)层,并定义了基于上下文变换的残差卷积模块。该模型可以更好地利用背景信息指导动态注意力矩阵的学习,从而实现增强网络特征表达能力的效果,达到高效提取苹果叶片特征的目的。该模型在ALIDS-IBNE的独立测试集上进行预测实验,结果显示,优化后的Co TRes Net网络对14个品种的苹果叶片图像的平均识别精度达到了98.60%,优于VGG16、Efficient-B5和Res Net50等经典卷积神经网络的识别性能,证明其能够利用苹果叶片图像精确地鉴别苹果品种。(3)针对在自然环境下拍摄的苹果叶片图像背景复杂、光源多变、叶片样本生长周期多样而导致模型识别精度低以及泛化性不强等问题,提出了一种基于λ函数和上下文变换的残差卷积神经网络方法(Lambda and Contextual Transformer Residual Convolutional Neural Network,La CTRes Net)。La CTRes Net方法在Co TRes Net方法的基础上引入了λ函数层,定义了基于λ函数的残差卷积模块,并讨论了四组不同残差卷积模块的位置分布以及数量配比对网络识别性能的影响。λ函数层采用一种全新的函数式编程方法来定义网络中的层,能显著减少注意力图大量占用内存的情况。该计算层对输入的特征进行平滑化和升维,使网络能够有效地学习细粒度特征,从而提高模型的识别精度。La CTRes Net模型在ALIDS-NE的独立测试集上的平均识别精度达98.72%,对比基准模型Res Net50和(2)中的最优模型Co TRes Net26在ALIDS-NE的独立测试集上的表现,识别准确率分别高了9.07%、1.89%,且模型的参数量分别减少了5.57M、0.56M。证明了引入λ函数层后的残差卷积神经网络在自然环境下拍摄的苹果叶片图像上的特征提取具有较大优势,能够实现模型高精度和强泛化性识别。
X光片图像分类及医学报告自动生成算法研究
这是一篇关于X光片,图像分类,报告生成,注意力机制,残差学习的论文, 主要内容为X光片检查是常用的医学影像检查手段之一,因其经济、快捷的优势常被应用于各类胸部疾病的诊断。在临床诊疗过程中,不同疾病X光片图像相似度高,医生人工阅片压力大,费时费力,且不同医生诊断存在一致性差的问题,容易出现误诊、漏诊现象。随着人工智能技术的发展,利用深度学习方法实现基于X光片的胸部疾病辅助诊断算法的研究,可减轻临床医生工作量,提高诊断效率和精度,缩短患者等待时间,具有重要的研究意义和临床实际应用价值。当前,X光片辅助诊断算法通常存在对图像特征提取较不充分,未考虑不同层次空间特征之间关联性,语义特征融合不完全以及报告生成算法准确率较低等问题。本文针对X光片病理图像的相似度较高、模型特征提取能力不充分、语义信息特征之间关联性低等问题,重点对X光片图像智能分类算法及医学报告自动生成算法做了研究。(1)基于多空间注意力的X光片智能分类算法研究。针对X光片图像相似度较高及特征提取能力较为不充分等问题,为提高计算机辅助X光片诊断质量,提出一种基于多维空间特征提取及跳连接的多空间注意力机制网络(Multi-space attention network,MSA-Net)。将图像输入特征通过多层较小卷积组进行卷积分组映射,并通过跳连接特征加和操作,实现多维空间特征提取及融合,以充分提取更丰富的X光片细粒度特征;特征提取过程中,采用空间注意力和通道注意力,保留了特征在空间与通道之间的关联信息,将其进行加权处理,有效提高了X光片图像的智能分类准确率。在胸部X光片公开数据集Chest X-ray Images上实验研究表明,该算法二分类(正常、肺炎)准确率可达到97.21%,三分类(正常、细菌性肺炎、病毒性肺炎)准确率可达86.24%,分类识别性能较为突出,并通过对所提模块的消融实验证明了模型结构的有效性。(2)基于MSA-Net和共同注意力的医学报告自动生成算法研究。针对医生临床手动撰写医学报告费时费力、语义特征融合不完全及医学报告自动生成算法准确性较低等问题,为缓解临床压力,辅助医生诊疗,提高诊断效率,本文在编码器-解码器架构基础上,提出一种基于MSA-Net、共同注意力机制及LSTM方法的注意力多任务学习模型(Attention Multitasking learning network,AML-Net)。该模型可分为三个部分:首先,通过对MSA-Net进一步优化进行X光片图像多维空间特征提取,有效提取图像特征局部、全局特征,并通过MLC(多标签分类)进行了标签预测;然后,将医学报告文本及预测标签进行嵌入式融合,使用一种平行分层共同注意力机制通过相似矩阵,进行平行分层重点关注图像和文本中相似、相近的语义特征,进行加权处理,有效提高了生成报告的准确性;最后,通过报告生成网络分级LSTM(句子LSTM、单词LSTM),逐词生成医学报告。本文在IU X-Ray胸片报告数据集上做了对比、消融实验,实验结果表明,AML-Net在多个自然语言处理评估指标上获得了很好提升,其中BLUE-1达到0.466,具有良好的医学报告自动生成性能。本文在X光片图像分类及胸部医学报告自动生成算法研究中,分别设计和提出了MSA-Net算法及AML-Net架构,得到了较高的诊断准确率。本文所提两种算法,具有潜在的临床应用价值,预期不仅可以帮助临床医生提高工作效率,还为其他疾病X光片图像的临床筛查、诊断提供可借鉴的辅助诊断方法。
基于残差时空深度学习模型的土壤湿度预测
这是一篇关于土壤湿度,深度学习,LSTM,残差学习,环境变量的论文, 主要内容为在生态系统管理以及精准农业等多个领域,土壤湿度预测在许多实际应用中发挥重要作用,由于土壤湿度的远期变化具有很大的不确定性,因此对土壤湿度的预测尤其是长期预测存在着巨大的困难与挑战,因此,本文开发了基于长短期记忆的具有残差学习的新型编解码MCR-LSTM深度学习模型以及捕捉环境变量关系信息的ECs-LSTM深度学习模型,作为一种数据智能替代工具强化土壤湿度的预测效果。MCR-LSTM模型主要包括两个层:编解码卷积LSTM层和具有完全连接层的LSTM层,残差学习用于通过考虑输入时间步和预测时间步之间的中间时间序列数据来增强预测能力。ECs-LSTM以卷积LSTM为内核进行改进,用于捕捉土壤湿度、降雨量、土壤温度等时序数据环境变量之间关系从而进一步提升预测效果。本文使用FLUX NET站点数据,在以1、5和10天的提前天数测试了MCR-LSTM用于土壤湿度预测,结果表明,基于LSTM为基础对比模型的R2指标,MCR-LSTM带来的改进平均约为6.93%(1天)、3.22%(5天)、和6.4%(10天);同时,ECs-LSTM模型与以单环境变量以及多环境变量的普通LSTM模型为对比,取得了良好的效果,相比单环境变量LSTM,R2平均提升了14.9%,RMSE平均降低了12.0%,MAE平均降低了39.6%。此外,本文还广泛讨论了不同条件下土壤湿度的可预测性,即在MCR-LSTM中调整不同的超参数、不同的预测模型、不同的气候区域以及不同的地点对结果的影响,以及ECs-LSTM中不同协变量对于土壤湿度预测结果影响的重要程度,以进一步理解模型的表现,具体研究内容如下:基于编解码结构提升预测效果研究。编解码循环神经网络,由两个递归神经网络(RNN)组成。本文涉及编解码结构的实验分别使用两个LSTM用作编码器与解码器。第一个编码器网络将输入数据转换成另一种规格的向量表示,第二个解码器网络则继续将该向量作为输入,输出序列为预测模型最终输出。两个网络之间的连接就是中间的一个向量,模型中的编解码层是共同训练的,令原始输入序列数据与预测序列数据之间的损失函数最小化,再将使用编解码计算的输出序列与原始输入结合的条件概率作为现有非线性模型的一个额外特征,同时伴随编解码结构的引入,深度学习预测模型的网络深度得到有效拓展,模型的性能得到了改善。基于残差学习提升预测效果研究。通常来讲,越深层的神经网络越难训练,由于未来数据的不确定性和复杂性,时间序列数据的长期预测比短期预测困难,并且深度学习模型神经网络的层次深度对模型性能起到非常重要的影响,伴随着网络层数的增加,深度学习网络可以提取更为复杂的特征模式,所以当深度学习网络模型的层次更深时,直觉上可以取得更好的结果,但实际上却并非如此。因此我们提出了一种带残差学习的编解码模型,用以精细化网络的训练,解决深度学习模型的长期预测精度以及网络退化等问题,进一步提升预测模型效果。基于卷积LSTM研发的ECs-LSTM捕捉动态环境协变量关系研究。我们将土壤湿度预测表述为一个时空序列预测问题,通过考虑多个动态协变量输入,以及考虑多个环境变量间关系信息,从数据横向关系上讲其模型的多维度输入可理解为一种横向拓展的时空序列。通过调整全连接LSTM(FC-LSTM)单元结构,使其在输入到状态的转换以及状态到状态转换中都应用卷积算法,在此基础上我们提出了ECs-LSTM深度学习网络模型,针对土壤湿度预测问题建立了一种端到端的可训练模型,实验结果表明,我们的ECs-LSTM深度学习神经网络可以更好地捕捉土壤湿度,降雨量,以及土壤温度等动态环境协变量的时空相关性信息。关于土壤湿度预测协变量重要性研究。每个预测变量对机器学习算法生成的模型都有影响,可以使用变量重要性来测量统计效果的显著性。将不同基于LSTM的模型以RMSE增加的形式计算模型内部变量重要性,并以百分比形式确定变量重要性。另一方面,也可以将变量重要性作为预测变量对土壤湿度的相对贡献。平均绝对误差损失(MAE)可以表征所生成模型中预测变量的影响,并显示出如果在预测模型中不考虑该环境变量的所带来影响的程度。
融合并联卷积神经网络与矢量分离的InSAR干涉图滤波方法
这是一篇关于干涉合成孔径雷达,InSAR干涉仿真,卷积神经网络,残差学习,干涉相位滤波,矢量滤波的论文, 主要内容为干涉合成孔径雷达技术(Interferometry Synthetic Aperture Radar,InSAR)广泛应用于大范围地表监测,具有全天时、全天候不间断工作的特点,是长期观测地表沉降与灾害预测的主要技术手段。在InSAR测量过程中,干涉图滤波的作用巨大,是直接影响相位解缠结果和InSAR测量精度的主要因素之一。传统干涉图滤波方法多为空间域或频率域滤波,这些方法能在一定程度上抑制InSAR干涉图的噪声,但仍有很多缺点,例如,滤波参数选择较为随机和滤波自适应能力较差等,这些不足会导致干涉相位滤波结果容易失真、噪声抑制不佳和密集条纹区的信息缺失等问题;近几年,很多卷积神经网络在干涉图滤波中得以应用,但它们的结构复杂、参数量大且受限于数据集的质量,导致相位滤波效果不佳。为此,本文开展了如下工作内容:(1)研究了一种基于DEM与InSAR系统平台的干涉数据仿真方法。为了能够给予深度学习模型更有效的训练数据集与有效的仿真数据滤波对照,本文结合实际地形的DEM与相关InSAR系统平台参数进行干涉数据仿真。利用InSAR干涉原理,构建干净的仿真干涉相位图;依据InSAR系统平台的诸多去相干因素与噪声分布统计特性,构建噪声仿真算法模型,并计算出实际包含相位噪声的仿真干涉图。相较于简单的在干涉相位中添加随机噪声或高斯噪声而言,该方法更符合干涉相位噪声的分布,提高了深度学习模型的滤波质量。(2)提出一种并联卷积神经网络与矢量分离的干涉图滤波方法。传统滤波方法不仅在密集条纹区抑噪不佳,而且在因噪声导致的相位丢失区域完全丧失了相位恢复能力,而深度学习方法可以依靠数据集的优势,解决以上问题。因此,本文提出了一种融合并联卷积神经网络与矢量分离的干涉图滤波方法,该方法结合矢量滤波算法的优势,运用密集连接的卷积神经网络结构与残差学习方法,搭建了并联卷积结构的特征提取层与传统卷积结构的相位滤波层,用于自动、智能地进行噪声相位的提取;通过与两种经典的卷积神经网络Seg Net与UNet对比,本文网络使用了密集连接与尺度不变的卷积模块,使得结构更简单、参数量更小,在网络的训练与迭代中梯度下降更迅速,拟合损失值更低(达到了0.010937,相较于Seg Net与UNet网络分别下降了0.056316与0.00141)。(3)采用多种滤波方法和评价指标进行滤波效果评价,验证了本文滤波方法的优势。选用了Boxcar、NL-mean、Goldstein三种传统滤波方法和Seg Net、UNet两种深度学习方法与本文滤波方法进行对比。在仿真实验中,本文滤波方法均方误差更小(分别下降了25%~50%)、密集条纹区的结构相似性更高(分别提高了17%~52%)、相位残差点数量最少(分别减少了90%~99%)、相位间平滑度更好。在实测实验中,本文方法可以有效减少相位残差点的数量(分别减少了70%~98%),其他指标也在几种滤波方法中表现最佳。该论文有图39幅,表6个,参考文献73篇。
X光片图像分类及医学报告自动生成算法研究
这是一篇关于X光片,图像分类,报告生成,注意力机制,残差学习的论文, 主要内容为X光片检查是常用的医学影像检查手段之一,因其经济、快捷的优势常被应用于各类胸部疾病的诊断。在临床诊疗过程中,不同疾病X光片图像相似度高,医生人工阅片压力大,费时费力,且不同医生诊断存在一致性差的问题,容易出现误诊、漏诊现象。随着人工智能技术的发展,利用深度学习方法实现基于X光片的胸部疾病辅助诊断算法的研究,可减轻临床医生工作量,提高诊断效率和精度,缩短患者等待时间,具有重要的研究意义和临床实际应用价值。当前,X光片辅助诊断算法通常存在对图像特征提取较不充分,未考虑不同层次空间特征之间关联性,语义特征融合不完全以及报告生成算法准确率较低等问题。本文针对X光片病理图像的相似度较高、模型特征提取能力不充分、语义信息特征之间关联性低等问题,重点对X光片图像智能分类算法及医学报告自动生成算法做了研究。(1)基于多空间注意力的X光片智能分类算法研究。针对X光片图像相似度较高及特征提取能力较为不充分等问题,为提高计算机辅助X光片诊断质量,提出一种基于多维空间特征提取及跳连接的多空间注意力机制网络(Multi-space attention network,MSA-Net)。将图像输入特征通过多层较小卷积组进行卷积分组映射,并通过跳连接特征加和操作,实现多维空间特征提取及融合,以充分提取更丰富的X光片细粒度特征;特征提取过程中,采用空间注意力和通道注意力,保留了特征在空间与通道之间的关联信息,将其进行加权处理,有效提高了X光片图像的智能分类准确率。在胸部X光片公开数据集Chest X-ray Images上实验研究表明,该算法二分类(正常、肺炎)准确率可达到97.21%,三分类(正常、细菌性肺炎、病毒性肺炎)准确率可达86.24%,分类识别性能较为突出,并通过对所提模块的消融实验证明了模型结构的有效性。(2)基于MSA-Net和共同注意力的医学报告自动生成算法研究。针对医生临床手动撰写医学报告费时费力、语义特征融合不完全及医学报告自动生成算法准确性较低等问题,为缓解临床压力,辅助医生诊疗,提高诊断效率,本文在编码器-解码器架构基础上,提出一种基于MSA-Net、共同注意力机制及LSTM方法的注意力多任务学习模型(Attention Multitasking learning network,AML-Net)。该模型可分为三个部分:首先,通过对MSA-Net进一步优化进行X光片图像多维空间特征提取,有效提取图像特征局部、全局特征,并通过MLC(多标签分类)进行了标签预测;然后,将医学报告文本及预测标签进行嵌入式融合,使用一种平行分层共同注意力机制通过相似矩阵,进行平行分层重点关注图像和文本中相似、相近的语义特征,进行加权处理,有效提高了生成报告的准确性;最后,通过报告生成网络分级LSTM(句子LSTM、单词LSTM),逐词生成医学报告。本文在IU X-Ray胸片报告数据集上做了对比、消融实验,实验结果表明,AML-Net在多个自然语言处理评估指标上获得了很好提升,其中BLUE-1达到0.466,具有良好的医学报告自动生成性能。本文在X光片图像分类及胸部医学报告自动生成算法研究中,分别设计和提出了MSA-Net算法及AML-Net架构,得到了较高的诊断准确率。本文所提两种算法,具有潜在的临床应用价值,预期不仅可以帮助临床医生提高工作效率,还为其他疾病X光片图像的临床筛查、诊断提供可借鉴的辅助诊断方法。
基于残差时空深度学习模型的土壤湿度预测
这是一篇关于土壤湿度,深度学习,LSTM,残差学习,环境变量的论文, 主要内容为在生态系统管理以及精准农业等多个领域,土壤湿度预测在许多实际应用中发挥重要作用,由于土壤湿度的远期变化具有很大的不确定性,因此对土壤湿度的预测尤其是长期预测存在着巨大的困难与挑战,因此,本文开发了基于长短期记忆的具有残差学习的新型编解码MCR-LSTM深度学习模型以及捕捉环境变量关系信息的ECs-LSTM深度学习模型,作为一种数据智能替代工具强化土壤湿度的预测效果。MCR-LSTM模型主要包括两个层:编解码卷积LSTM层和具有完全连接层的LSTM层,残差学习用于通过考虑输入时间步和预测时间步之间的中间时间序列数据来增强预测能力。ECs-LSTM以卷积LSTM为内核进行改进,用于捕捉土壤湿度、降雨量、土壤温度等时序数据环境变量之间关系从而进一步提升预测效果。本文使用FLUX NET站点数据,在以1、5和10天的提前天数测试了MCR-LSTM用于土壤湿度预测,结果表明,基于LSTM为基础对比模型的R2指标,MCR-LSTM带来的改进平均约为6.93%(1天)、3.22%(5天)、和6.4%(10天);同时,ECs-LSTM模型与以单环境变量以及多环境变量的普通LSTM模型为对比,取得了良好的效果,相比单环境变量LSTM,R2平均提升了14.9%,RMSE平均降低了12.0%,MAE平均降低了39.6%。此外,本文还广泛讨论了不同条件下土壤湿度的可预测性,即在MCR-LSTM中调整不同的超参数、不同的预测模型、不同的气候区域以及不同的地点对结果的影响,以及ECs-LSTM中不同协变量对于土壤湿度预测结果影响的重要程度,以进一步理解模型的表现,具体研究内容如下:基于编解码结构提升预测效果研究。编解码循环神经网络,由两个递归神经网络(RNN)组成。本文涉及编解码结构的实验分别使用两个LSTM用作编码器与解码器。第一个编码器网络将输入数据转换成另一种规格的向量表示,第二个解码器网络则继续将该向量作为输入,输出序列为预测模型最终输出。两个网络之间的连接就是中间的一个向量,模型中的编解码层是共同训练的,令原始输入序列数据与预测序列数据之间的损失函数最小化,再将使用编解码计算的输出序列与原始输入结合的条件概率作为现有非线性模型的一个额外特征,同时伴随编解码结构的引入,深度学习预测模型的网络深度得到有效拓展,模型的性能得到了改善。基于残差学习提升预测效果研究。通常来讲,越深层的神经网络越难训练,由于未来数据的不确定性和复杂性,时间序列数据的长期预测比短期预测困难,并且深度学习模型神经网络的层次深度对模型性能起到非常重要的影响,伴随着网络层数的增加,深度学习网络可以提取更为复杂的特征模式,所以当深度学习网络模型的层次更深时,直觉上可以取得更好的结果,但实际上却并非如此。因此我们提出了一种带残差学习的编解码模型,用以精细化网络的训练,解决深度学习模型的长期预测精度以及网络退化等问题,进一步提升预测模型效果。基于卷积LSTM研发的ECs-LSTM捕捉动态环境协变量关系研究。我们将土壤湿度预测表述为一个时空序列预测问题,通过考虑多个动态协变量输入,以及考虑多个环境变量间关系信息,从数据横向关系上讲其模型的多维度输入可理解为一种横向拓展的时空序列。通过调整全连接LSTM(FC-LSTM)单元结构,使其在输入到状态的转换以及状态到状态转换中都应用卷积算法,在此基础上我们提出了ECs-LSTM深度学习网络模型,针对土壤湿度预测问题建立了一种端到端的可训练模型,实验结果表明,我们的ECs-LSTM深度学习神经网络可以更好地捕捉土壤湿度,降雨量,以及土壤温度等动态环境协变量的时空相关性信息。关于土壤湿度预测协变量重要性研究。每个预测变量对机器学习算法生成的模型都有影响,可以使用变量重要性来测量统计效果的显著性。将不同基于LSTM的模型以RMSE增加的形式计算模型内部变量重要性,并以百分比形式确定变量重要性。另一方面,也可以将变量重要性作为预测变量对土壤湿度的相对贡献。平均绝对误差损失(MAE)可以表征所生成模型中预测变量的影响,并显示出如果在预测模型中不考虑该环境变量的所带来影响的程度。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设助手 ,原文地址:https://m.bishedaima.com/lunwen/48566.html