面向准确性和数据稀疏的推荐方法研究
这是一篇关于知识图谱,自注意力机制,图神经网络,特征解耦,自监督学习的论文, 主要内容为随着全球数字经济蓬勃发展,数据呈几何指数式增长,海量的信息超过了个体用户的信息处理阈值从而导致信息过载问题。推荐系统作为解决信息过载问题的有效手段,在各大主流平台、应用中都受到了高度关注。现有推荐系统仍然存在诸多问题亟待解决,一方面,推荐系统在多特征因素共同干扰决策时的准确性仍存在提升空间;另一方面,现有方法在解决数据稀疏问题时通常需要消耗大量人力成本且牺牲一定准确率。针对上述问题,本文分别针对准确性问题和数据稀疏问题提出了循环解耦的知识图谱卷积神经网络模型和基于知识图谱和自监督学习的图神经网络模型。本文的创新点和主要工作如下:(1)针对真实世界中多特征因素共同干扰决策导致推荐系统准确性不高的问题,本文提出一种循环解耦的知识图谱卷积神经网络模型(Recurrent Disentangled Knowledge Graph Convolutional Networks,RDKGCN)。该算法首先采用特征提取模块对知识图谱进行表征学习,随后通过循环特征解耦模块对多特征因素进行深度解耦捕捉关键特征,根据评分预测模块计算实体评分,最后经过模型训练得到推荐结果,从而提高模型的准确性。本文在Movie Lens-20M、BookCrossing和Last.FM数据集上进行多组仿真实验,并综合召回率、F1-score、AUC等评价指标验证本文提出模型的有效性。实验结果证明,RDKGCN模型在Movie Lens-20M数据集上的召回率达到了34.48%,相较次优模型提高了约2.22%。(2)针对海量数据带来的数据稀疏问题,本文提出一种基于知识图谱和自监督学习的图神经网络模型(Self-supervised Knowledge Graph Neural Network,Self-KGNN)。该算法首先采用自监督学习模块对原始数据集进行数据增强,通过负采样方法构造正负样本对和相对相似性度量(Relative Similarity Measure,RSM)对样本进行区分,然后建立基于知识图谱的图神经网络模型并融合多头注意力机制获得实体特征,经过动态评分模块使得模型贴近真实世界环境,从而提升推荐系统的性能,缓解数据稀疏问题带来的影响。本文在Sports、Toys、Yelp数据集上进行对比实验,根据命中率、NDCG和MRR在多个维度验证本文提出模型的有效性。实验结果证明,Self-KGNN模型在Toys和Yelp数据集上的命中率达到了12.76%和7.12%,相较对比模型的最优命中率提升了约12.92%和15.02%,并通过稀疏性实验证明本方法应对数据稀疏问题的有效性。
基于图卷积特征迁移和解耦的跨领域推荐算法研究
这是一篇关于跨领域推荐,图卷积神经网络,特征迁移,特征解耦的论文, 主要内容为大数据时代剧增的信息量带来了信息过载的困扰。推荐系统作为缓解信息过载的重要手段,能分析用户-项目交互建模用户偏好,主动提供用户感兴趣的信息。但大数据背景下的数据稀疏和冷启动成为了传统推荐算法长期面临的难题,跨领域推荐通过不同领域间数据的相互补充和知识迁移,能在一定程度上缓解这些问题。本文通过对跨领域研究现状进行总结,发现当前跨领域研究还存在以下不足:基于完全重叠的场景来单向提升目标域性能存在场景的局限性、预训练单域嵌入进行迁移信息容易忽略领域间偏差、未能兼顾跨域多种特征进行充分学习等。因此本文针对部分用户重叠的场景,从特征迁移和特征学习的角度开展跨领域推荐研究。主要的工作和取得的成果如下:(1)针对现有模型的不足,本文选择部分用户重叠的场景,构建了基于多图卷积特征迁移的跨领域推荐模型MGCDR。该模型利用领域间的重叠用户信息构造残差图并进行共性特征的预训练,然后将预训练的共性嵌入迁移到领域特定图中作为重叠用户节点的初始化嵌入表示,再进一步利用图卷积神经网络聚合信息获取个性化特征。最后训练注意力权重来融合不同的特征,并在双域联合训练的框架下开展双目标推荐,以同时提升源领域和目标领域的性能。(2)进一步地,针对MGCDR模型对共性特征的预训练提取可能耦合个性特征的情况,本文基于MGCDR模型提出了特征解耦的跨领域推荐模型FDCDR。通过设计自编码器训练方式下的解耦学习框架,来分离域间共性特征与领域个性特征,在MGCDR基础上进行细粒度的特征解耦。采用轻量化图卷积神经网络聚合基础表示,设计领域特定编码器进一步提取重叠用户基础表示中的个性特征,域间共性编码器提取不变的共性特征。同时,使用领域标签作为监督信号训练领域判别器,设计对抗性损失监督域间共性特征的提取;设计正交损失监督域内特征的分离,以减少特征的冗余和干扰。此外,设计解码器对聚合的解耦特征进行重构维护了数据的完整性。针对领域的非重叠用户,设计注意力网络聚合其交互项目的特征信息,进一步提取个性特征并融合。最终联合训练优化解耦特征以提供双域推荐。(3)在Amazon的三个类别数据集下进行了跨域推荐的对比实验和相关分析。与单域和跨域的多个基线算法相比,本文提出的MGCDR模型利用预训练共性特征和多图卷积的学习方式,能在少量重叠的稀疏双目标域推荐任务中带来4.34%-27.23%的性能提升。FDCDR模型通过自编码器的解耦框架对特征进一步解耦,能在MGCDR模型基础上实现域间共性特征的对齐与域内特征的分离,避免特征的负迁移,并在MGCDR模型基础上带来一定的性能提升。
基于轻量级网络的遮挡人脸检测与识别算法研究
这是一篇关于轻量级网络,遮挡人脸检测,特征增强,遮挡人脸识别,特征解耦的论文, 主要内容为身处大数据时代,人工智能技术为我们生活带来诸多便捷,身份认证便是其中之一。人脸检测与识别作为身份认证最重要的支撑技术,一直以来都备受关注。特别是近年来,深度学习的发展极大提升了人脸检测与识别的性能。在疫情的大背景下,出行佩戴口罩是自我保护的重要方式,口罩带来了人脸遮挡问题,而遮挡带来的人脸信息丢失以及遮挡物信息干扰给现有的人脸检测与识别算法带来极大挑战。如何弥补因遮挡而丢失的特征信息以及如何剔除因遮挡所带来的干扰信息,从而提升遮挡人脸检测与识别的性能是本文的研究重点。针对遮挡人脸检测问题,本文基于特征增强技术提出具有遮挡鲁棒性的人脸检测模型。该模型使用轻量级卷积神经网络Mobile Net-0.25作为主干网络提取图像特征,提升模型的推理速度。对于遮挡所带来的信息丢失,提出一种全局与局部特征融合模块,利用特征金字塔网络自上而下的连接方式,将全局特征融入到每个特征元素中,为遮挡人脸提供更多额外信息。同时,还提出一种特征图增强方法,在原有三个学习任务分支的基础上,增加一个弱监督区域分割分支,通过在人脸的遮挡区域与非遮挡区域设置一样的监督信息,强化人脸遮挡区域的特征,从而进一步弥补因遮挡而丢失的特征信息。使用遮挡人脸检测数据集MAFA和通用人脸检测数据集Wider Face进行实验,在MAFA数据集上的AP值达到90.8%,比基线模型提升2.1%,验证了本文所提方法对遮挡人脸检测的有效性。针对遮挡人脸识别问题,本文提出一种三元组特征解耦网络用于遮挡人脸身份验证。对于遮挡带来的干扰信息,提出的特征解耦网络通过解耦权值向量对轻量级特征提取网络Mobile Face Net提取的人脸特征进行分解,去除遮挡相关信息的同时获取更具有区分性的人脸特征信息。在此基础上,进一步提出三元组相似度间隔损失函数,通过拉大同类人脸相似度与异类人脸相似度之差,从而达到减小类内差异增大类间差异的效果。使用mask-CASIA-Web Face作为训练集,mask-LFW和mask-Age DB30作为测试集进行实验,在mask-LFW和mask-Age DB30数据集上分别达到98.78%、89.55%的准确率,比基线方法分别提升了0.33%、0.63%,进一步证明了本文所提方法对遮挡人脸识别的有效性。
面向准确性和数据稀疏的推荐方法研究
这是一篇关于知识图谱,自注意力机制,图神经网络,特征解耦,自监督学习的论文, 主要内容为随着全球数字经济蓬勃发展,数据呈几何指数式增长,海量的信息超过了个体用户的信息处理阈值从而导致信息过载问题。推荐系统作为解决信息过载问题的有效手段,在各大主流平台、应用中都受到了高度关注。现有推荐系统仍然存在诸多问题亟待解决,一方面,推荐系统在多特征因素共同干扰决策时的准确性仍存在提升空间;另一方面,现有方法在解决数据稀疏问题时通常需要消耗大量人力成本且牺牲一定准确率。针对上述问题,本文分别针对准确性问题和数据稀疏问题提出了循环解耦的知识图谱卷积神经网络模型和基于知识图谱和自监督学习的图神经网络模型。本文的创新点和主要工作如下:(1)针对真实世界中多特征因素共同干扰决策导致推荐系统准确性不高的问题,本文提出一种循环解耦的知识图谱卷积神经网络模型(Recurrent Disentangled Knowledge Graph Convolutional Networks,RDKGCN)。该算法首先采用特征提取模块对知识图谱进行表征学习,随后通过循环特征解耦模块对多特征因素进行深度解耦捕捉关键特征,根据评分预测模块计算实体评分,最后经过模型训练得到推荐结果,从而提高模型的准确性。本文在Movie Lens-20M、BookCrossing和Last.FM数据集上进行多组仿真实验,并综合召回率、F1-score、AUC等评价指标验证本文提出模型的有效性。实验结果证明,RDKGCN模型在Movie Lens-20M数据集上的召回率达到了34.48%,相较次优模型提高了约2.22%。(2)针对海量数据带来的数据稀疏问题,本文提出一种基于知识图谱和自监督学习的图神经网络模型(Self-supervised Knowledge Graph Neural Network,Self-KGNN)。该算法首先采用自监督学习模块对原始数据集进行数据增强,通过负采样方法构造正负样本对和相对相似性度量(Relative Similarity Measure,RSM)对样本进行区分,然后建立基于知识图谱的图神经网络模型并融合多头注意力机制获得实体特征,经过动态评分模块使得模型贴近真实世界环境,从而提升推荐系统的性能,缓解数据稀疏问题带来的影响。本文在Sports、Toys、Yelp数据集上进行对比实验,根据命中率、NDCG和MRR在多个维度验证本文提出模型的有效性。实验结果证明,Self-KGNN模型在Toys和Yelp数据集上的命中率达到了12.76%和7.12%,相较对比模型的最优命中率提升了约12.92%和15.02%,并通过稀疏性实验证明本方法应对数据稀疏问题的有效性。
基于深度学习的农作物叶片病害识别研究
这是一篇关于图像识别,特征融合,特征解耦,深度学习,农作物病害的论文, 主要内容为农作物病害是影响作物产量和质量的主要危害之一,及时准确的识别农作物病害种类是防治农作物病害的关键。在传统的病害图像识别方法中,主要依靠手工提取特征,这种方法一般都需要复杂的特征工程,因此费时费力,而且模型的鲁棒性一般较差。近年来,随着深度学习技术的发展,尤其是深度卷积神经网络在数据驱动下可以自动的提取特征,实现端到端的识别,省时省力,使得基于深度学习的农作物病害的检测和诊断,成为计算机视觉研究领域的一个热点。本文聚焦于应用深度学习技术解决农作物叶片病害识别问题,在对现有经典卷积神经网络进行研究的基础上,我们发现两个问题:(1)不同CNN网络提取的深度特征在用于农作物叶片病害识别,是否具有互补性,如何利用这种互补性,对它们特征融合,以提高农作物病害识别效果?(2)用深度网络提取叶片的病害特征,会在特征表示学习的过程中,耦合一些叶片自身的,如纹理、脉络等非病害特征,如何消除叶片非病害特征的干扰,提升网络模型的性能?针对这两个问题,我们分别从特征融合和特征解耦这两个角度进行了对叶片病害识别方法的研究。本文的主要研究工作及研究成果如下:(1)针对问题一,我们提出了一种用于融合不同CNN网络所提取的深度特征的网络模型MDFF-Net。该网络可以将两个不同的CNN网络模型进行并联,然后将不同模型输出的深度特征变换成相同维度的特征,并对相同维度的特征进行融合计算,最后将融合后的特征进行农作物类型预测并输出结果。我们选择VGG-16、Res Net-50和Dense Net-121这三个网络进行两两组合,共构成三组融合方案,在包含5种苹果叶片疾病的公开数据集上分别取得了95.41%、95.58%和96.02%的准确率,均高于单一网络模型。结果证明,该模型可以有效利用不同CNN网络提取的深度特征的互补性,在叶片病害识别上取得比单一网络更好的识别效果。(2)针对问题二,我们提出了一种用于分离作物叶片特征和疾病特征的网络模型LDFD-Net来解决此问题。该网络由疾病特征提取分支和作物叶片特征提取分支并联而成,同时设计了一种解耦损失函数,通过分别计算两个分支的分类损失和对抗损失来更新网络参数,以此来实现疾病和作物叶片特征的分离。我们用该网络在PV数据集上进行实验,分别对21种疾病类型和14种作物类型进行分类,LDFD-Net网络模型在21种疾病和14种作物的识别上F1-Score分别是95.85%和98.96%,均高于其他模型。此外,我们还进行了对未知作物的疾病识别的泛化能力测试,LDFD-Net展示出了更优的识别效果,进一步证明了该模型对疾病特征和作物叶片特征解耦的有效性。
基于深度学习的食品Logo检测方法研究
这是一篇关于深度学习,食品Logo检测,食品Logo数据集,多尺度,特征解耦的论文, 主要内容为随着深度学习技术的不断发展,卷积神经网络被广泛应用于很多科研领域,深度学习技术已成为解决计算机视觉领域问题的有效手段之一。当前,目标检测在智能视频监控、机器人导航、航空航天等领域中发挥着较大的作用,被研究者广泛关注。大数据时代的到来,数据量呈指数级增加,同时图形处理器(GPU)等硬件设施的更新迭代带动了目标检测算法的快速发展。Logo检测作为目标检测的一个分支,从图像中检测出Logo是确定品牌最具特色和最有效的方法之一。然而,由于Logo在图像尺度、几何形状、外观以及拍摄角度等方面存在很大的差异,使得Logo检测仍然是一个具有挑战性的问题。现实中品牌Logo的种类众多,食品Logo是生活中最常见的类别之一,同时食品Logo检测在现实生活中有着广泛的应用,如自助商店的食品推荐、电商平台的侵权检测以及针对性广告投放等。与普通Logo相比,食品Logo存在更多样的类间相似性以及更复杂的多尺度问题。本文针对食品Logo检测,通过构建食品Logo数据集和食品Logo检测算法的方式开展工作,具体分以下3个步骤:(1)数据质量是深度学习算法发挥作用的重要基础,为了开发先进的食品Logo检测算法,需要大规模的食品Logo数据集作为支撑。然而,目前尚无公开的食品Logo数据集。为此,本文构建了Food Logo Det-1500数据集,是目前规模最大、可公开下载的食品Logo数据集,该数据集有1,500个类别、大约10万幅图像和15万个手工标注的食品Logo目标。本文详细介绍了数据集的收集、清理和标注过程,分析了数据集的规模和多样性,并与其他Logo数据集进行了比较。据调研,Food Logo Det-1500是第一个用于食品Logo检测的最大的公开可用的高质量数据集。(2)本文提出了一种基于多尺度特征解耦网络的食品Logo检测模型(Multi-scale Feature Decoupling Network,MFDNet),实现对食品Logo的精确检测。该方法将分类任务与回归任务解耦成两个分支,解决食品Logo多类别检测问题。具体来说,引入了特征偏移模块(Feature Offset Module,FOM),该模块利用变形学习来获得最优的分类偏移量,在检测时可以有效地获得最具代表性的分类特征。此外,还使用了平衡特征金字塔模块(Balanced Feature Pyramid,BFP),它关注全局信息,增强了特征提取能力,并对多尺度特征的融合进一步增强,加强了对多尺度食品Logo的检测能力。(3)最后,本文在三个数据集上进行了广泛的实验评估,包括提出的Food Logo Det-1500和其他两个广泛使用的Logo数据集QMUL-Open Logo与Flickr Logos-32。实验结果验证了Food Logo Det-1500食品Logo数据集的有效性以及本文提出方法的可行性。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码码头 ,原文地址:https://m.bishedaima.com/lunwen/54432.html