基于机器学习的视觉SLAM闭环检测算法研究
这是一篇关于视觉SLAM,闭环检测,DBOW,Parc_Net,CBAM的论文, 主要内容为现如今在自主机器人和无人驾驶领域中视觉同步定位与地图构建(Vision Simultaneous Localization and Mapping,VSLAM)技术是前沿的核心技术之一。在视觉SLAM中前一帧的计算误差会延续到当前帧的计算中,在长时间运行后就会造成误差的累积,导致系统的预测值与真实值存在较大的误差。针对此问题,闭环检测技术通过建立当前帧与历史帧的帧间关系,有效的消除累积误差。常用闭环检测算法都是通过提取图像的局部或全局特征,根据相似度匹配判断是否发生闭环。闭环检测主要有基于词袋模型的方法和基于深度学习的方法。本文对两种方法分别进行研究,研究内容如下:(1)通过对基于ORB特征和离线词袋的闭环检测研究,发现使用离线的词袋在系统运行过程中会出现不同关键帧误匹配的现象,这种现象会影响闭环检测的效果。首先离线词袋模型的数据是固定不变的,但在实际应用场景是不断变化的,固定的词袋模型不能很好的反应场景下的图像特征,会造成大量误匹配发生。因此,本文针对DBo W2词袋模型,设计了一种在线更新词袋模型的闭环检测算法,使词袋模型能够包含应用场景的特征,使闭环检测更加准确。将改进后的算法应用于ORB-SLAM3系统并在公开数据集上进行测试,实验结果显示,系统预测轨迹与真实轨迹的误差减小。为了验证改进算法的实际效果,将算法移植到扫地机器人上进行测试,结果显示改进后的误差比原模型降低了17.58%,并且稳定性更好。(2)通过对Net VLAD网络的研究,发现该网络在提取图像特征时不能充分的提取图像位置、通道和空间等信息,这将导致闭环检测时图像匹配率降低。因此,本文提出将Par C_Net网络、Conv Ne Xt-Tiny网络以及CBAM注意力机制相结合的特征提取网络模型并将该网络结合Net VLAD网络用于闭环检测中的图像匹配。通过将改进的网络与多个图像匹配网络进行对比实验,结果显示本文所提出的网络在召回数N相同的情况下,准确率更高。综上所述,本文针对基于词袋模型和深度学习的两种闭环检测方法中的关键问题进行研究并提出改进,改进后的方法在数据集和实际应用中基本达到了较好的匹配准确度,优化效果更好,能够有效提升视觉SLAM系统的优化效果。
基于深度学习的脑肿瘤分类检测算法研究
这是一篇关于脑肿瘤,ECA,EfficientNet,CBAM,分类的论文, 主要内容为脑肿瘤,当今世界最致命的癌症之一,据世界卫生组织临床研究发现,脑肿瘤患者尽早的发现和准确地判断肿瘤类别和病变程度能够大大提高脑瘤的治愈率。但由于人脑器官复杂,脑肿瘤种类繁多,转移不可预测,使得脑肿瘤的分类极具依赖医生的专业知识和临床经验。虽然人工检查准确率高,但是面对海量的影像数据,医生难免会出现误诊,并且人工诊断耗时较长,同时具有相关知识的医生的短缺,因此开展脑肿瘤自动分类检测方法的研究具有重要的应用价值。目前,随着医疗技术的发展,医学成像在医疗领域发挥着越来越重要的作用,由于人的大脑是一个极其复杂又脆弱的组织,而MRI具有无侵害,不暴露于电离辐射的特点而常用于脑肿瘤的分类和检测。近年来,在医学成像领域,出现了各式各样的神经网络模型和算法来辅助医生进行医疗决策。本文在此背景下开展了基于深度学习的脑肿瘤分类检测算法的研究,完成了如下工作:(1)提出了一种基于多模型深度学习算法的脑肿瘤图像分类方法。该方法通过Mobile Net V2+Bi LSTM、VGG19+CNN和Efficient Net+Bi GRU三种多模型神经网络架构在脑肿瘤MRI图像上进行多分类。实验结果显示,组合模型比单模型分类效果提高0.08~1.4%,最优模型分类平均准确率比现有方法提高约0.02%~3.9%。(2)提出了一种基于CBAM(Convolutional Block Attention Module)和改进通道注意力机制的Efficient Net神经网络(IC+IEffx Net)的新型混合脑肿瘤分类方法。该方法分为两个阶段,第一阶段将由基于改进空间注意力机制的CBAM模型提取特征。第二阶段将Efficient Net架构中的Squeeze and Excitation(SE)块替换成Efficient Channel Attention(ECA)块,将第一阶段的组合特征输出作为第二阶段的输入。实验展示了在混合脑肿瘤MRI数据集下,神经胶质瘤患者,脑膜瘤患者,脑垂体瘤患者与正常患者图像的四分类结果,实验结果显示分类平均准确率比现有方法提高约0.6%及以上。实验结果证明了该方法的有效性,为医疗专家能够准确判断脑肿瘤种类提供了新的参考。
基于改进U-Net的机翼结冰冰形识别技术研究
这是一篇关于机翼结冰,图像分割,神经网络,U-Net,残差模块,CBAM的论文, 主要内容为结冰是影响飞机飞行安全的重要因素之一,飞机从设计制造到投入运营,都必须关注飞机结冰问题,对飞机关键部位的结冰探测也尤为重要。目前,常用的单点结冰探测器只能提供结冰信号,难以给出飞机某一区域整体的结冰状态;目视探测又往往存在一些经验上的判断,只能作为飞机结冰的辅助探测装置。为了实现机翼结冰的精确化、具体化识别,本文提出一种基于改进U-Net的机翼结冰冰形识别方法,完成对机翼结冰冰形的像素级识别。首先,针对机翼结冰图像样本采集困难、成本高昂的问题,本文设计并搭建了简易冰风洞结冰实验平台模拟风速0~18.5m/s;平均过冷水滴直径26.3~32.5 m;水滴含量0.8~0.9g/m3;温度-15~0℃的机翼结冰环境条件,进行机翼结冰实验并采集机翼模型结冰图像样本。结合高斯噪声、HSV变换等图像处理方法实现样本增强,构建机翼结冰图像样本集,用于机翼结冰冰形识别的神经网络训练。其次,针对结冰透明度高、冰形边界模糊的问题,本文在U-Net网络模型跳跃连接通道加入CBAM,搭建了Att U-Net网络模型,通过对下采样过程特征图进行通道和空间注意力处理,提高网络模型对冰形边界的识别能力。对比实验得出,引入CBAM的Att U-Net网络模型对机翼结冰测试集图像样本中的识别查全率达到了93.48%,相较于U-Net网络模型提高了8.69个百分点。针对机翼结冰图像样本存在多因素的干扰,图像样本背景复杂,导致U-Net网络模型识别精确率低下的问题。本文引入残差模块构建RU-Net网络模型,以防止训练过程中出现梯度消失的问题,更进一步挖掘结冰区域特征,区分背景干扰,以提高U-Net网络模型识别精度。对比实验结果表明,引入残差模块的RU-Net网络模型对机翼结冰测试集图像样本识别精确率达91.49%,远高于78.32%的U-Net识别效果。为了U-Net网络模型能够同时具备对复杂背景的抗干扰能力和冰形模糊边界的精确识别能力,将CBAM和残差模块进行整体融合并入U-Net结构,同时在网络模型的输出端加入形态学处理算法,构建针对机翼结冰冰形识别的改进U-Net网络模型。在相同软硬件平台进行U-Net、Att U-Net、RU-Net以及改进U-Net网络模型的性能对比实验,结果与U-Net网络模型相比,识别查全率和精确率分别提升11.98、17.00个百分点,验证了改进模块对网络模型性能的提升。利用改进U-Net网络模型对蓝天、阴天背景以及不同翼面logo的机翼结冰图像样本进行识别测试,精确率均在90%以上,验证了网络模型的泛化能力。最后,利用改进U-Net网络模型对机翼结冰过程第5min、10min和20min的图像样本进行识别,结果表明,在机翼结冰初期,机翼前缘区域会迅速与过冷水滴碰撞并在整个区域内形成薄冰,随着时间的推移,翼面结冰面积变化较小。通过统计改进U-Net网络模型识别结果中结冰区域所占像素个数的方法,直观的反映出机翼结冰过程中结冰区域面积的变化,充分的验证了改进U-Net网络模型对机翼结冰区域面积变化的感知能力。
基于深度学习的微表情时序定位与识别研究
这是一篇关于微表情时序定位,深度学习,微表情识别,CBAM的论文, 主要内容为微表情是指极短暂(通常为1/25s~1/3s)的面部表情变化,通常是由个体情感或认知上的刺激引起的,对人际交往、情感识别、心理疾病诊断等方面具有重要的意义。近年来,随着人工智能技术的迅猛发展,微表情分析受到越来越多的关注和研究,也取得了许多突破性进展,但同时也面临着一个难题:微表情数据集小样本问题。针对该问题,本文提出了微表情时序定位任务,通过加速微表情编码者的编码速度,加快数据集的构建。此外,本文还对微表情分析中的热门领域微表情识别进行了研究,设计了Inception-CBAM+深度学习神经网络,以解决其特征复杂、分布不均匀的问题。本文主要贡献如下:(1)提出了微表情时序定位任务,旨在借助较小的人工开销的前提下,实现微表情片段的开始帧、峰值帧和结束帧的精确定位。首先详细介绍了该任务的定义,然后针对该任务设计了一个解决方案,即微表情对比识别标注算法(Micro-Expression Contrastive Identification Annotation,MECIA)。该算法由一个深度神经网络MECIA-Net和一个帧扩展算法组成。MECIA-Net网络受到人工标注的启发,包含识别模块、对比模块和标注模块,分别对应人工标注的不同步骤。帧扩展算法通过比较帧与帧之间的网络分数,实现自动化的微表情/非微表情标注。最后,本文设计了消融实验以及心理学实验,证明了微表情时序定位的可行性和MECIA算法的有效性。(2)设计了一种结合Inception与注意力机制的微表情识别网络Inception-CBAM+。针对原始图像中的身份信息占比大、动作信息占比小的问题,该网络以微表情片段的光流特征作为输入;针对普通卷积网络难以提取多样化特征的问题,利用Inception模块提取人脸的多尺度特征;针对人脸中微表情信息分布不均匀的问题,引入并行的通道注意力与空间注意力机制CBAM+,提取识别任务更感兴趣的特征。该算法在混合数据集MEGC2019上的未加权F1分数和未加权平均召回率分别为0.7420和0.7435。消融实验表明:相较于未添加Inception模块与CBAM+模块的网络,Inception-CBAM+提高了0.0643和0.0686,可见其有效性。
基于机器学习的视觉SLAM闭环检测算法研究
这是一篇关于视觉SLAM,闭环检测,DBOW,Parc_Net,CBAM的论文, 主要内容为现如今在自主机器人和无人驾驶领域中视觉同步定位与地图构建(Vision Simultaneous Localization and Mapping,VSLAM)技术是前沿的核心技术之一。在视觉SLAM中前一帧的计算误差会延续到当前帧的计算中,在长时间运行后就会造成误差的累积,导致系统的预测值与真实值存在较大的误差。针对此问题,闭环检测技术通过建立当前帧与历史帧的帧间关系,有效的消除累积误差。常用闭环检测算法都是通过提取图像的局部或全局特征,根据相似度匹配判断是否发生闭环。闭环检测主要有基于词袋模型的方法和基于深度学习的方法。本文对两种方法分别进行研究,研究内容如下:(1)通过对基于ORB特征和离线词袋的闭环检测研究,发现使用离线的词袋在系统运行过程中会出现不同关键帧误匹配的现象,这种现象会影响闭环检测的效果。首先离线词袋模型的数据是固定不变的,但在实际应用场景是不断变化的,固定的词袋模型不能很好的反应场景下的图像特征,会造成大量误匹配发生。因此,本文针对DBo W2词袋模型,设计了一种在线更新词袋模型的闭环检测算法,使词袋模型能够包含应用场景的特征,使闭环检测更加准确。将改进后的算法应用于ORB-SLAM3系统并在公开数据集上进行测试,实验结果显示,系统预测轨迹与真实轨迹的误差减小。为了验证改进算法的实际效果,将算法移植到扫地机器人上进行测试,结果显示改进后的误差比原模型降低了17.58%,并且稳定性更好。(2)通过对Net VLAD网络的研究,发现该网络在提取图像特征时不能充分的提取图像位置、通道和空间等信息,这将导致闭环检测时图像匹配率降低。因此,本文提出将Par C_Net网络、Conv Ne Xt-Tiny网络以及CBAM注意力机制相结合的特征提取网络模型并将该网络结合Net VLAD网络用于闭环检测中的图像匹配。通过将改进的网络与多个图像匹配网络进行对比实验,结果显示本文所提出的网络在召回数N相同的情况下,准确率更高。综上所述,本文针对基于词袋模型和深度学习的两种闭环检测方法中的关键问题进行研究并提出改进,改进后的方法在数据集和实际应用中基本达到了较好的匹配准确度,优化效果更好,能够有效提升视觉SLAM系统的优化效果。
基于U-NET的砂型铸件凝固过程温度场预测方法的研究
这是一篇关于U-Net,CBAM,砂型铸造,模拟仿真的论文, 主要内容为铸件的缺陷、组织、性能、质量等都和铸件的凝固过程有关,研究铸件凝固过程的温度场可以预测缩松、缩孔、热裂等缺陷,也可以预测晶粒取向、铸件的力学性能等。数值模拟方法需要数理建模,运算量大,耗时较长。为节约计算时间,缩短研发周期,本文利用深度学习方法、基于U-Net网络结构建立了砂型铸件凝固过程的温度场快速预测模型,可以实现不同形状、不同时刻和不同材质的砂型铸件凝固过程温度场的快速预测。(1)利用大量铸件形状及其数值模拟温度场结果,构建U-Net网络的训练集和测试集。采用随机方法以少量的基础模型衍生出大量的二维铸件模型,并为模型添加冒口和冷铁。基于有限差分方法编写传热计算程序,输入砂型铸件模型进行传热计算模拟。构建了两种典型铸件材质(铝合金和铸钢)、900个的铸件模型多时刻的砂型铸件温度场。(2)建立卷积神经网络模型Unet-3,以实现不同形状的砂型铸件凝固过程温度场预测。以砂型铸件模型作为输入,经有限差分法计算得到浇筑后10min的温度场作为标签,将数据集按9:1划分为训练集和测试集。比较不同网络层数的预测效果,其中Unet-3表现最优,温度场预测的平均准确率为可达0.97以上,皮尔逊相关系数可达0.9999以上。(3)为解决不同时刻的铸件温度场预测问题,提出了CBAM-I-Unet模型。以Unet-3网络为基础,在模型编码器和解码器连接处添加了CBAM(Convolutional Block Attention Module)注意力机制,赋予模型权值自适应优化能力,并在编码器子模块中添加了Inception block,提高了模型对不同尺度特征的提取能力。以t时刻温度场矩阵和砂型铸件模型矩阵作为输入,以+?后的温度场作为标签构建数据集进行训练,预测结果显示,CBAM-I-Unet模型分段预测和连续预测的平均准确率均达到0.95以上,个别异常点的误差也控制在7.5%以内。(4)为实现不同材质的砂型铸件温度场预测,提出了M-CBAM-I-Unet网络模型。同时进行铝合金和铸钢两种铸件材质的凝固过程温度场预测。多任务学习方式能减少训练参数,提高网络的泛化能力,实验数据表明,使用M-CBAM-IUnet网络后,铝合金铸件的温度场预测准确率从0.98提高到了0.9875。本文建立的深度学习网络模型实现了二维铸件凝固过程中不同形状、不同时刻、不同材质的温度场预测问题。可以在一定程度上替代传统的数值模拟方法。
基于语义分割的煤岩界面预先感知识别研究
这是一篇关于煤岩识别,主动红外,语义分割,PSPNet,MobileNetV2,CBAM的论文, 主要内容为煤岩界面预先精准识别是实现煤矿综采工作面采煤机智能化开采和煤矿井下安全高效生产的关键技术。近年来,随着开采深度的不断增加,煤矿井下煤岩分布日益复杂,采煤机在开采过程中一旦截割到硬度较大的岩石,将导致采煤机截齿磨损甚至损坏,影响采煤机截割效率,而随着煤矿开采环境日益恶劣,传统的煤岩界面识别方法已不能满足煤岩界面精准识别和预先感知。针对上述问题,本文通过研究煤岩界面中煤层和岩层的分布、走向以及煤岩界面在主动红外激励下的红外表征,研究一种基于语义分割的煤岩界面红外图像预先感知识别算法,论文具体工作如下:(1)分析煤矿综采工作面开采环境及基于主动红外热激励的煤岩识别影响因素,得到影响煤岩界面主动红外激励识别的影响因素及边界条件。(2)根据分析得到的影响因素及边界条件搭建实验平台,浇筑走向随机的煤岩试件,制定相应的实验方案后进行实验,获取大量煤岩界面红外图像样本数据。并通过数据增强方法增加样本数据集,最后对数据集进行标注及划分,构建完成用于煤岩界面红外图像识别的数据集。(3)构建用于煤岩界面红外图像识别的网络模型,对选取的Pyramid Scene Parsing Network(简称PSPNet)网络模型进行改进。将Mobile Net V2作为主干特征提取网络替换原始的Visual Geometry Group Network(简称VGG网络)和Residual Network(Res Net网络),通过添加Convolutional Block Attention Module(简称CBAM模块)进一步提高识别精度和识别速度。(4)将传统图像分割算法应用于煤岩界面红外图像分割识别,对改进后的网络模型进行参数的设置并训练,并通过语义分割评价指标对改进后的网络模型和对比模型进行定性分析,最后进行随机实验验证改进后的网络模型的识别效果。由实验结果可知,基于改进后的PSPNet网络模型,煤和岩的交并比(简称Io U)分别为98.07%和98.38%,煤和岩的像素精确度(简称PA)分别为98.68%和99.50%,相比于改进前的PSPNet网络模型均有明显提高;改进后的网络模型预测速度为38.46ms/张,所占内存为9.12MB,与改进前的PSPNet网络模型预测速度提升了30.78%,所占内存降低了94.88%。与其他网络模型相比,改进后的网络模型在识别性能上明显更优。实验结果表明,改进后的网络模型具有良好的普适能力和稳定性,能够实现煤岩界面的预先感知和精准识别。
基于语义分割的高分辨率遥感影像道路提取研究
这是一篇关于语义分割,道路提取,深度可分离卷积,DeepLabv3+,CBAM的论文, 主要内容为随着卫星技术的发展,获取到的遥感卫星图像的清晰度也在相应提高,高分辨率遥感影像具备覆盖面积广、分辨率高、地物信息多样的优势。道路信息在城市规划、数字地图更新等领域都具有很重要的应用价值,对于复杂环境下道路提取会受到植物、阴影、建筑物的干扰,使得道路提取成为高分辨率遥感影像数据应用的难点之一,语义分割模型在图像分割领域应用较为广泛,将其应用于高分辨率遥感影像中具有重要的现实意义。本文针对现有方法中对于被遮挡或阻断的道路存在错误提取或漏提的现象以及模型复杂、计算量大的问题,对现有语义分割模型进行深入研究。并基于语义分割模型Deep Labv3+的原始网络模型进行改进:首先,使用轻量化网络Mobile Net V2替换掉原始模型中的Xception主干特征提取网络;其次,使用深度可分离卷积DSC替换掉ASPP模块中的普通标准卷积;再次,引入注意力机制CBAM模块;最后,为了解决遥感图像中道路提取类别不均衡的问题,对Dice Loss与二元交叉熵损失函数分配不同的权重,并将两者相叠加作为最终的损失函数。并使用精确率、召回率和F1-score等指标对改进效果进行评价。将优化的Deep Labv3+模型在Massachusetts Roads数据集上进行实验,原始Deep Labv3+算法的精确率、召回率及F1-score分别为84.05%、82.45%、83.70%,改进后的Deep Labv3+模型的精确率、召回率及F1-score分别为85.46%、85.27%、86.42%,实验表明了本文方法的有效性。与其它语义分割模型进行对比,FCN-8s算法的精确率、召回率及F1-score分别为80.30%、78.72%、79.66%,U-Net算法的精确率、召回率及F1-score分别为82.26%、82.58%、81.13%,实验表明了本文方法与其它方法相比,兼顾提取速度和提取精度,更加适合遥感影像中的道路提取任务。
基于语义分割的煤岩界面预先感知识别研究
这是一篇关于煤岩识别,主动红外,语义分割,PSPNet,MobileNetV2,CBAM的论文, 主要内容为煤岩界面预先精准识别是实现煤矿综采工作面采煤机智能化开采和煤矿井下安全高效生产的关键技术。近年来,随着开采深度的不断增加,煤矿井下煤岩分布日益复杂,采煤机在开采过程中一旦截割到硬度较大的岩石,将导致采煤机截齿磨损甚至损坏,影响采煤机截割效率,而随着煤矿开采环境日益恶劣,传统的煤岩界面识别方法已不能满足煤岩界面精准识别和预先感知。针对上述问题,本文通过研究煤岩界面中煤层和岩层的分布、走向以及煤岩界面在主动红外激励下的红外表征,研究一种基于语义分割的煤岩界面红外图像预先感知识别算法,论文具体工作如下:(1)分析煤矿综采工作面开采环境及基于主动红外热激励的煤岩识别影响因素,得到影响煤岩界面主动红外激励识别的影响因素及边界条件。(2)根据分析得到的影响因素及边界条件搭建实验平台,浇筑走向随机的煤岩试件,制定相应的实验方案后进行实验,获取大量煤岩界面红外图像样本数据。并通过数据增强方法增加样本数据集,最后对数据集进行标注及划分,构建完成用于煤岩界面红外图像识别的数据集。(3)构建用于煤岩界面红外图像识别的网络模型,对选取的Pyramid Scene Parsing Network(简称PSPNet)网络模型进行改进。将Mobile Net V2作为主干特征提取网络替换原始的Visual Geometry Group Network(简称VGG网络)和Residual Network(Res Net网络),通过添加Convolutional Block Attention Module(简称CBAM模块)进一步提高识别精度和识别速度。(4)将传统图像分割算法应用于煤岩界面红外图像分割识别,对改进后的网络模型进行参数的设置并训练,并通过语义分割评价指标对改进后的网络模型和对比模型进行定性分析,最后进行随机实验验证改进后的网络模型的识别效果。由实验结果可知,基于改进后的PSPNet网络模型,煤和岩的交并比(简称Io U)分别为98.07%和98.38%,煤和岩的像素精确度(简称PA)分别为98.68%和99.50%,相比于改进前的PSPNet网络模型均有明显提高;改进后的网络模型预测速度为38.46ms/张,所占内存为9.12MB,与改进前的PSPNet网络模型预测速度提升了30.78%,所占内存降低了94.88%。与其他网络模型相比,改进后的网络模型在识别性能上明显更优。实验结果表明,改进后的网络模型具有良好的普适能力和稳定性,能够实现煤岩界面的预先感知和精准识别。
面向汉字图像生成的部件检索与变形方法研究
这是一篇关于汉字部件检索,汉字部件变形,CBAM,EfficientNet,层次分析法的论文, 主要内容为汉字是由部件构成的,同一部件在不同形态下可以组成不同的汉字,因此通过对现有汉字部件变形生成具有构字功能的新部件是汉字生成的一种常用方式。本文针对现有方法在查找所需部件和选择变形控制点时人工工作量过大的问题,对基于注意力机制的汉字部件检索模型和基于层次分析法的汉字部件变形方法进行研究,用以提高汉字图像生成的效率。具体进行了以下工作:(1)设计了基于CBAM注意力机制的汉字部件检索模型。CBAM用于解决传统特征提取网络对汉字图像的空间特征关注不足的问题,整体模拟人的视觉注意力机制,从全局到局部,先通过通道注意力对汉字图像的整体信息进行特征提取,再使用空间注意力加强对汉字部件的结构和位置等空间信息的关注,使提取到的特征更加完善准确。因此本文将该注意力机制与Efficient Net-B7网络相结合,构造CBAM-Efficient Net特征提取模型,并将其作为Faster RCNN的特征提取模块,通过目标检测算法完成汉字部件检索任务。(2)提出一种基于层次分析法的汉字部件图像变形算法。层次分析法用于解决汉字部件变形过程中控制点选择困难的问题,主要包括建立层次架构图,构造判断矩阵和权重计算以及一致性检验等步骤,可以将选择变形控制点的决策过程数学化,从而达到减少人工工作量,提高工作效率的目的。实验中,首先通过汉字部件图像的骨架信息进行部件特征点提取,再根据邻域信息对提取到的特征点进行匹配,然后对特征点分组并使用层次分析法计算每组特征点的权重,根据权重确定变形的控制点,最终通过仿射变换实现部件变形。(3)实验结果对比分析,用以检验本文方法在实际应用中是否有效。在汉字部件图像检索过程中,分别将本文提出的CBAM-Efficient Net模型、VGG-16、Res Net-50、Mobile Net V2、Mobile Net V3和原始Efficient Net-B7模型作为Faster RCNN的特征提取模块对汉字部件进行检索,结果显示,本文模型的检索效果与其他方法相比都有一定提升,说明本文设计的针对汉字部件图像的特征提取方法是合理且有效的。在汉字部件图像变形实验中,将本文算法与移动最小二乘法进行对比,先在多种不同的简体汉字图像数据集上进行了测试,通过比较变形后部件与真实部件的结构相似度,证明本文提出的算法可以有效完成部件变形任务,随后将本文方法在书法字图像和古籍汉字图像中进行测试,进一步说明本文提出的汉字部件检索与变形方法可以很好地应用于汉字研究的实践中。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码货栈 ,原文地址:https://m.bishedaima.com/lunwen/54170.html