基于深度学习的服装钉纽质量检测研究
这是一篇关于纽扣质量检测,区域生长法,生成对抗网络,Faster RCNN,迁移学习的论文, 主要内容为服装生产中钉纽工序的质量检测目前还依赖人工,速度慢,效率低下。论文结合服装企业的实际生产需求,设计并研究基于深度学习的钉纽质量机器视觉检测系统和方法。论文的主要工作如下:1.基于机器视觉系统、控制系统设计等技术,结合服装生产特点,设计了一套钉纽质量机器视觉检测系统。依据服装生产现场环境特点和现有钉纽设备结构特点,设计合适的相机安装方案;通过组合光源设计提升带纹理特征面料上获取的纽扣图像质量;根据现有钉纽设备内置信号端口设计与PLC的通讯方式;通过四轴联动系统实现图像获取节拍与钉纽生产节拍一致,准确获取待检测图像数据。2.针对原始图像数据存在的问题,设计图像预处理方案。通过数据降维,简化图像处理的运算量;非线性增强凸显钉纽与背景的纹理面料之间的差异;中值滤波过滤图像增强带来的椒盐噪声和高斯噪声;基于区域生长法分割图像,实现了纽扣区域与背景纹理区域的图像分割,减少后续训练时的冗余数据,提升训练效率。3.基于生成对抗网络扩充原始数据集,解决实际服装生产过程中纽扣图像数据量过少的问题。通过对WGAN-GP的判别器D增加一个训练调整倍数Ts,让生成器G和判别器D的训练保持相近速度;将WGAN-GP的判别器D的Sigmoid输出层替换为全连接层提高模型训练效率;在MI值和HD值两项图像评价标准上,该网络模型生成的纽扣图像数据质量优于DCGAN,WGAN-GP生成的纽扣图像数据。4.设计了基于Faster RCNN的改进质量检测算法。首先通过将特征提取部分更换成Res Net50,缓解网络过深带来的梯度消失;通过残差单元有效提高网络训练速度和训练敏感性;依据纽扣的特点设计RPN网络,增加有效候选框数量,降低运算量;通过消融实验验证了不同模块的改进对整体网络性能的影响,并选定最优方案;在两种新的纽扣图像数据上构建小样本数据集进行迁移学习,验证了所提出的模型在小样本数据集下具备良好的训练效率和检测准确率。
基于机器视觉的垃圾识别轻量化网络研究
这是一篇关于机器视觉,垃圾识别,轻量化网络,迁移学习,注意力机制的论文, 主要内容为垃圾分类作为垃圾处理系统的初始环节,在打造美丽、可持续发展的居住环境过程中,其重要性不言而喻。而工业自动化时代已经到来,关于垃圾识别分拣机械控制系统的研究如火如荼,发展迅速。结合机器视觉技术,通过卷积神经网络搭建识别算法模型,实现正确垃圾分类的自动化、智能化,能帮助民众解决难以正确分类的问题,高效便捷而又准确,具有很强的现实意义。本文主要针对垃圾分类自动化的识别算法展开研究。为解决高运行、高存储的硬件设备要求难题,以长沙市的垃圾四分类准则为本文的分类标准,基于机器视觉,对轻量型卷积神经网络进行一系列对比实验,选定主干分类模型并对之展开进一步的优化,设计一款更高效、更准确的轻量化垃圾分类识别网络模型。本文主要研究内容与成果如下:(1)本文自行构建了CS-Trash Net数据集,其垃圾样本图像分别来自华为云杯比赛数据集与Trash Net数据集的部分图像、自行拍摄图像以及通过网络爬虫技术获取的部分图像。构建后对其进行了图像尺寸归一化、图像滤波、图像增强增广等一系列图像预处理操作,将样本图像数量扩充至12508张。(2)研究学习了CNN的结构与作用、轻量化方法和几种常见的轻量型神经网络架构与策略。同时分析选定Softmax、交叉熵损失、Adam分别作为本文的分类器、Loss函数和优化器,为本文模型框架的搭建与后续的优化奠定了基础。(3)为确定主干分类模型,本文设置了三组对照实验。第一、二组设置为同样的轻量化模型,区别为第二组进行迁移学习,加载该模型在Image大型数据集上的预训练权重,而第一组不加载。第三组实验配置则以是否为轻量化模型为变量与第二组进行比照,其他实验条件相同。结果证明,基于迁移学习的轻量级神经网络Mobile Net V1表现最好,被选定为本文实验研究的主干分类模型。(4)基于主干模型,本文提出了网络结构优化、超参数改进、添加注意力机制三个方向的优化思路,具体为:设计了深度可分离卷积模块DWCS,应用了loss自适应的学习率动态衰减策略,调整了batch_size,引入了SE与CBAM注意力模块。消融实验证明了三个优化角度的有效性。将三个优化方式融合后,根据混淆矩阵评估体系,实验选出了轻量化角度综合性能最好的实验组合Mobile Net+DWCS-add+lr-64+SE,相比初始模型,分类准确率、平均精准率和查全率分别提升至97.2%、97.19%、97.14%。同时,在公开数据集Trash Net上也验证了本文优化方法带来的显著提升性能效果。
基于主动迁移学习的多网络关系预测及推荐研究
这是一篇关于迁移学习,主动学习,冷启动,多网络关系预测,协同过滤,系统推荐的论文, 主要内容为传统的机器学习通常要求有大量的有标签数据,然而这在一些场景中常常无法满足。例如,在多网络关系预测和推荐任务中存在冷启动(Cold Start)问题,即新网络中存在较少的边和关系数据,这使得普通的监督学习框架难以获得很好的训练效果。迁移学习和主动学习是两种解决标注数据不足的重要方法。在多网络关系预测中,迁移学习利用源网络中的关系信息帮助目标网络的关系预测任务,主动学习用于查询目标网络中有价值的节点对样本的真实标签,将其加入数据集中迭代训练。在多源数据推荐系统中,采用辅助数据的协同推荐(Collabrative Recommendation with Auxiliary Data,简称CRAD)综合用户的社交网络以及浏览记录提高系统的推荐效果,迁移学习利用辅助数据学习用户偏好信息,主动学习用于查询更能体现用户偏好的物品评价。本文针对上述任务提出以下两个独立的方法:(1)基于主动迁移学习的多网络关系预测方法TAQIL;(2)基于主动迁移学习的推荐系统TACF。第一个工作将源网络中的节点信息迁移到目标网络中,训练得到一个初始模型,然后从目标网络的无标签数据中选择信息量最大的数据进行标注,将其加入数据集再次训练,重复上述步骤直到查询代价用完。第二个工作使用迁移学习从用户的浏览记录中学习用户的偏好信息,并将这些信息用于协同过滤学习获得初始模型,同时允许系统查询用户对某些物品的评价,将其加入评分矩阵中,根据最新添加的评价信息更好地学习用户偏好特征。关于多网络关系预测的实验结果表明,TAQIL方法在非网络数据、网络数据上,比现有的方法具有更高的分类准确率。关于多源推荐系统的实验结果表明在MAE和RMSE两种评价指标中,TACF方法在推荐数据集MovieLens和MovieRating上具有更好的推荐效果。
基于GCN/HGNN和3D U-Net的肺结节分类多任务模型研究
这是一篇关于肺结节诊断,迁移学习,多任务学习,图神经网络,超图神经网络,特征融合的论文, 主要内容为肺癌是发病率和致死率最高的癌症,肺癌早期有相当部分表现为肺部结节。肺部结节是胸科常见又较难确诊的疾病,其诊治一直是临床上的难点。由于我国的医疗资源较为紧张,且人工诊断高度依赖医生的工作经验,利用人工智能技术进行肺结节诊断引起了众多研究者的关注。在肺结节分类、检测和分割等任务中,人工智能技术已经取得了实质性的进展。但大多数研究工作并没有充分利用肺结节特征间的相关性,导致了诊断结果的可解释性较差,实际应用前景受到限制。本文首先获取肺结节特征之间的相关性,之后利用该相关性建立图邻接矩阵和超图关联矩阵,随后分别构建图卷积神经网络和超图神经网络,最终设计了两个肺结节分类多任务模型。主要的工作成果如下。(1)开展如何有效地获取肺结节特征之间的相关性研究针对如何有效获取肺结节特征间相关性的问题,本文首先对LIDC-IDRI数据集进行分析,提取了数据集中专家标注的9种肺结节特征。通过对每种特征的等级标注情况进行分析,排除在不同肺结节之间没有显著差异的内部结构特征,最终选择了细致度、圆形度、边缘、分叶征、毛刺征、纹理、恶性度和钙化8种特征进行相关性研究。相关性研究主要工作有:通过求取肺结节特征间相关系数的方法,给出肺结节特征两两之间的相关性大小;构建多阶迁移学习模型,找到每个肺结节特征评分任务的最佳源任务集,分析特征与特征组合之间的相关性。(2)应用肺结节特征间的相关性构建肺结节分类多任务模型针对如何应用肺结节特征间相关性的问题,本文提出了两个多任务模型,分别为基于图卷积神经网络和3D U-Net的肺结节分类多任务模型、基于超图神经网络和3D U-Net的肺结节分类多任务模型。i)构建基于图卷积神经网络和3D U-Net的肺结节分类多任务模型首先使用全连接神经网络获取包含肺结节特征相关关系的初始标签嵌入。之后通过数据驱动、多阶迁移学习和自适应三种方法分别构建能反映肺结节特征相关关系的图邻接矩阵,并设计了融合标签嵌入和图像特征的特征融合模块以及代替U-Net跳跃连接的交叉通道注意力模块,最后提出了基于图卷积神经网络和3D U-Net的肺结节分类多任务模型。实验结果表明,相比于其他现有的模型,提出的基于图卷积神经网络和3D U-Net的肺结节分类多任务模型可以充分利用肺结节特征间的相关关系以及肺结节不同任务间的相似性,更好地完成肺结节的良恶性分类、特征评分和三维分割任务,并且模型同时输出这些任务的诊断结果,为医生提供全面、可信的诊断依据。ⅱ)构建基于超图神经网络和3D U-Net的肺结节分类多任务模型基于图卷积神经网络和3D U-Net的肺结节分类多任务模型存在一些不足之处,在临床诊断中,医生进行肺结节良恶性判别诊断往往是根据多个肺结节特征而不是单独一个特征。然而,图卷积神经网络无法对肺结节特征之间的复杂关系进行建模。为此,进一步提出了使用超图神经网络来对肺结节特征间的高阶相关性进行提取的方法,并通过欧几里得距离、岭回归和多阶迁移学习三种方法分别构建能反映肺结节特征高阶相关性的超图关联矩阵。最终设计基于超图神经网络和3D U-Net的肺结节分类多任务模型。实验结果表明,基于超图神经网络和3D U-Net的肺结节分类多任务模型进一步提高了肺结节分类多任务模型在肺结节良恶性分类、特征评分和三维分割任务上的性能,验证了使用肺结节特征间高阶相关性提高肺结节分类多任务模型性能的有效性。
基于多模态融合的情感识别技术研究与实现
这是一篇关于多模态,情感识别,注意力机制,迁移学习的论文, 主要内容为情感识别是人工智能的关键应用,在服务型机器人、教育、医疗、商业服务等诸多方面,都需要通过计算机的帮助来获得人类准确的情感,因此具有重要研究价值。同时,情感识别也颇具挑战性,因为人类多样化的表达情感方式增加了它的复杂性,如自然语言、面部表情和声学信息。这种多样化的情感表达方式凸显了传统的单模态情感识别存在信息利用率低、识别准确率低的缺点,因此很多学者将目光转移到多模态情感识别,如何利用好这些来自不同模态的信息成为多模态情感识别研究中的关键任务。目前在多模态情感识别任务中仍存在以下普遍问题:一是传统的特征提取方法表征能力不足,而深度学习方法受限于可用训练的多模态数据不足,难以充分挖掘各个模态数据自身包含的情感信息;二是不同模态信息存在模态内关联性以及模态间关联性,单一模型难以捕获这些潜在的互信息;三是多模态信息的协同参与在提高情感识别效果的同时,也会导致过度依赖贡献度更高的模态信息,一旦数据缺失会严重影响鲁棒性。从以上几个问题出发,本文做了以下几个方面的工作:(1)针对传统特征提取方法表征能力不足的问题,引入基于知识迁移的深度特征提取方法:在文本模态,采用具有强大的文本语义表达能力的BERT预训练模型对文本进行词嵌入表示;在视频模态上,采用在大型面部数据集上预训练的面部识别模型FAb-Net和ResNet50提取深度视觉特征;在音频模态上,采用VGGish和wav2vec2.0深度学习算法来获得音频信号的高级表示。通过多种方法加强对语言、视觉和音频模态的表示学习,提高情感分析系统的性能。(2)针对单一模型难以挖掘并平衡各模态中潜在互信息的问题,提出了一种基于Transformer协同注意力机制、Mogrifier门控循环单元以及EmbraceNet融合方式的多层次跨模态感知情感识别模型,旨在发现多源异构信息之间的模态交叉和时间交互,有效的提升了不同特征空间在全局范围内的特征聚合能力,在公开数据集上进行的与多种方法的对比实验中,验证了提出的模型兼具情感识别的有效性与鲁棒性。(3)本文在研究情感识别算法基础上,按照软件工程的设计流程,基于B/S架构开发了网页版多模态情感识别系统,将本文算法模型应用。构建了一个集用户管理、数据采集、多媒体可视化展示、情感结果反馈等多功能为一体情感识别系统。
基于重采样算法与迁移学习的直线振动筛故障诊断研究
这是一篇关于振动筛,不平衡故障,重采样,迁移学习,数据存储的论文, 主要内容为振动筛作为工业中重要的物料筛分机械,广泛用于各行各业。然而,由于振动筛工作环境恶劣,一旦出现故障会对企业效益造成不小的损失。目前针对振动筛的故障诊断方法仅针对单台设备的诊断,实际工程应用性较差,因此提出一种泛化性强、识别精度高的振动筛故障诊断方法对于维持企业生产的安全有效运行具有重要意义。本文以ZS2468C型振动筛为研究对象,搭建了可靠的振动筛信号采集实验平台,完成了三个批次同种型号振动筛激振力不平衡、单电机停机和共振三种故障信号采集实验。引入了迁移学习理论,选择了针对本研究的迁移学习效果评估指标,用于精准筛选最优诊断模型。引入了Borderline-SMOTE、KMeans SMOTE等八种重采样理论,结合决策边界,探究了八种重采样算法采样机理和对不平衡数据的采样效果,为不平衡故障诊断提供理论基础。引入了最大均值差异理论(MMD),对三个批次对应标签的故障类别数据进行了最大均值差异计算,结果均不超过0.2,说明三个批次数据分布非常相近,证明可迁移性好。在八种重采样算法利用近邻思想扩充少数类样本的基础上,结合迁移学习理论,对Alex Net、VGG16等四种深度学习模型进行微调,将批次一数据集预训练模型权重载入批次二、批次三诊断模型中,实现ZS2468C型振动筛不同批次迁移学习故障诊断。由此提出四种诊断方案,结果表明:Kmeans SMOTE结合四种迁移学习模型均能实现不低于96%识别率的故障诊断,组合算法泛化性较强;三种故障的原始数据下Alexnet-Kmeans SMOTE模型组合的诊断准确率最高,达98.77%;Image Net预训练模型的诊断效果较差,最高仅为84.68%;此外,所提诊断方法在信噪比为20db时可达到92%的识别准确率,鲁棒性较强。通过分析振动筛故障监测系统数据存储需求,分别对TDMS、SQL Server等四种数据存储方式和两种数据库的存储极限、写入速率等存储特性进行了研究,确定了采用TDMS三文件夹存储结构的存储方案,该方案不仅存储效率高,而且空间占用小,将其部署在振动筛监测系统上,长期测试未有异常。所提故障诊断算法能够有效实现对同种型号不同批次振动筛不平衡故障诊断,且所提存储方案有效解决振动筛监测系统大容量、高效率的数据存储问题,有较强的工程应用价值。
基于DNA序列的转录因子结合位点预测
这是一篇关于转录因子结合位点,自注意力机制,深度残差网络,迁移学习,长短时记忆网络,在线预测服务,序列分析的论文, 主要内容为了解DNA-蛋白质结合的特异性对于理解基因表达、调控机制和基因治疗有着重要的意义,而转录因子是一种常见的DNA结合蛋白。转录因子通过与DNA结合调控位于其下游基因的表达,增强或者抑制下游基因的活性,对蛋白质的翻译也起着至关重要的调控作用。因此,从DNA序列中精准地识别出转录因子结合位点是一项重要的任务。基于分子生物学实验来识别转录因子结合位点的方法存在耗时长、成本高等缺点。近年来,随着高通量测序技术的出现、计算机性能的提升与算法的发展,为构建转录因子结合位点预测模型从海量生物数据中挖掘出有价值的知识提供了可能。然而,现有基于机器学习、深度学习的转录因子结合位点预测模型的预测精度还有待提高。因此,进一步提高转录因子结合位点预测模型的性能十分有必要。本文对基于DNA序列的转录因子结合位点预测问题进行了深入研究,主要工作如下:(1)本文将自注意力机制与残差网络相结合,提出了名为SARes Net的转录因子结合位点预测模型。自注意力机制能很好地捕捉序列的远程依赖关系,将空间信息集成到网络中,同时与卷积得到的局部信息相互补充,使网络能够有效地学习空间位置信息和局部信息。同时,SARes Net采用了迁移学习,提高了网络的泛化性能,加快了模型微调阶段的收敛速度。实验结果表明SARes Net模型在转录因子结合位点预测的基准数据集上表现良好,与目前最先进的方法相比有进一步地提升,且具备良好的预测性能与泛化能力。(2)本文考虑到LSTM网络具有处理序列数据的强大特性,并且能够处理长期依赖的问题,基于LSTM网络提出了名为LSTM-Net的结合位点预测模型。实验结果表明LSTM-Net具备较好的预测性能。(3)考虑到SARes Net与LSTM-Net都具备相近的预测性能,本文还提出了名为SARes Net-LSTM的自注意力残差网络与LSTM网络相结合的转录因子结合位点预测模型。并通过在不同规模的数据集、不同细胞系的数据集上对比了LSTM-Net、SARes Net和SARes Net-LSTM的预测性能,还与其他现有预测模型在基准数据集上进一步对比,表明了本文提出的三种模型预测的准确性与稳定性。(4)为了方便生物医学研究者的使用,我们基于Spring Cloud微服务框架开发了一个预测平台用于提供在线的结合位点预测服务。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码项目助手 ,原文地址:https://m.bishedaima.com/lunwen/46200.html