9个研究背景和意义示例,教你写计算机协同训练论文

今天分享的是关于协同训练的9篇计算机毕业论文范文, 如果你的论文涉及到协同训练等主题,本文能够帮助到你 基于图神经网络和社交网络的推荐算法研究 这是一篇关于图注意力网络

今天分享的是关于协同训练的9篇计算机毕业论文范文, 如果你的论文涉及到协同训练等主题,本文能够帮助到你

基于图神经网络和社交网络的推荐算法研究

这是一篇关于图注意力网络,群组推荐,超图卷积,自监督学习,协同训练的论文, 主要内容为当今社会中存在着丰富的数字内容可以消遣,如电子书、电影、视频和网络购物等,但庞大的数据量也导致出现“信息过载”的问题。推荐系统的出现正是为了解决这一问题,现已与人们的日常生活息息相关,无论是购买衣服,观看You Tube精彩视频,还是在新城市搜索餐馆,后端的推荐系统都在为这些服务提供着支持。近年来,如何利用推荐系统向个人(群组)准确的推荐其可能感兴趣的项目一直是学者们研究的重点,将属性图与图神经网络结合应用于个人推荐算法中确实能提高算法推荐的准确率,但图神经网络与属性图的结合,会将用户或项目的所有属性嵌入,用户对项目以相同方式学习,导致推荐过程中存在一些属性噪声,不能很好的利用属性图进行推荐;另外,现有的模型处理用户与项目的属性交互时视同等价,而在现实中用户对项目的不同属性特征会存在不同的偏好。与此同时,随着社交媒体的迅猛发展,人们逐渐将研究方向从个人推荐算法向群组推荐算法转移,现有的群组推荐模型大多采用启发式或基于注意力的偏好聚合策略,学习群组成员的个人偏好并聚合为群组偏好。然而,由于用户交互数据的稀疏性,学习后的用户特征并不完备,现实生活中用户之间的交互是极其复杂的,而且用户之间的关系大都是是高阶的;再者,群组之间的相似性和群组间共同成员的个人偏好经常被忽视,而群组相似性对于提高群组表征学习具有很大的潜力。针对上述问题,本文的主要研究贡献如下:1.针对属性偏好不同以及属性图中存在噪声的问题,提出了融合图注意力网络和有益特征的协同过滤推荐算法。首先,在用户属性图和项目属性图交互过程中,使用定制化的图注意力算法,得到属性与属性之间不同权重交互信息的更新;其次,通过有益特征检测算法对用户和项目的属性特征进行筛选,摒弃对推荐不利或低影响的属性交互;最后,通过用户在用户图中的特征表示和项目在项目图中的特征表示进行匹配,以更好的完成推荐。通过在真实数据集Taobao和Book-crossing上的实验,采用AUC、Logloss和NDCG@10指标评估,结果显示,本文提出的模型优于其他通用的基准模型。这证明了图神经网络与有益特征检测属性图的结合能够提高为单个用户提供推荐的准确率。2.针对群组中用户数据稀疏性、复杂性以及群组之间相似性的问题,提出了融合超图卷积和自监督协同训练的组推荐算法。首先,在用户级超图中,利用三个通道编码超图卷积网络中的高阶用户关系,通过聚合多个通道学习的用户特征,获得增强的用户表示,这为学习群组偏好提供了坚实的基础。其次,在组级超图中,将所有的群组连接为重叠网络,并关注群组共同成员的个人偏好,超边嵌入过程可视为对群组偏好的学习。为进一步增强群组表示,将自监督学习和协同训练相结合,在上述两个超图上构建两个不同的图编码器,递归的利用不同信息生成标注样本,通过对比学习策略互相监督,与丢弃策略相比,所提出的自监督协同训练保留了完整信息,实现了真正的数据增强。本文提出的HCSC模型在两个真实世界的数据集上进行了广泛的实验,实验结果证明了本文提出的HCSC模型的优越性。

内外部语义协同训练的实体对齐算法的研究

这是一篇关于实体对齐,卷积图神经网络,跨语言知识图谱,协同训练的论文, 主要内容为随着知识图谱的发展,国内外涌现了各式各样的知识图谱,学者们通过将数据源不同的多个知识图谱融合成一个知识图谱,增强该知识图谱的数据覆盖率,作为知识图谱融合的一个重要子任务,实体对齐可以在两个知识图谱中查找引用同一真实世界对象的实体,在自动集成多个知识库方面起着至关重要的作用。然而,传统的实体对齐方法难以利用知识图谱中复杂的实体信息;其次,越来越多的特定语言知识图谱的出现使得知识图谱间的多语言差异巨大;最后,知识图谱体量庞大,但人为标注的训练数据较少,训练难度大。因此,跨语言知识图谱的实体对齐是一个必要且具有挑战的任务。本文主要研究跨语言知识图谱的实体对齐,分析了当前国内外的研究技术,提出了一种内外部语义协同训练的知识图谱嵌入的实体对齐算法,并利用该算法构建了一个实体对齐的可视化原型系统。本文完成的主要工作内容如下:提出了基于简化内部语义的关系感知图卷积网络的实体对齐算法im-GCN-align,该算法简化实体的属性特征并改进图结构的连通矩阵,挖掘实体的完整内部语义,进而改进内部语义视角的实体对齐效果。提出了基于内外部语义协同训练的知识图谱嵌入的实体对齐算法BRCEA,该算法分别利用im-GCN-align和RDGCN充分挖掘实体的内部语义和外部语义,并通过协同训练缓解训练数据不足的问题,提高训练集有限时实体对齐的效果。搭建了实体对齐可视化原型系统,该系统应用上述研究成果BRCEA算法在DBP15k数据集上的实体对齐结果,提供中、日、英、法四种语言的跨语言搜索服务。

协同训练框架下联合使用文本与图片的推荐方法研究

这是一篇关于推荐系统,多视图学习,协同训练,文本,图片,神经网络的论文, 主要内容为推荐系统通过分析用户对物品的历史行为来为用户推荐其可能感兴趣的物品。在实际场景中,用户对物品的历史行为信息往往是十分稀疏的,这会严重制约推荐系统性能。为了提升推荐系统的性能,现有的很多研究将物品的评论文本、图片等各种边信息加入到推荐系统中辅助推荐,取得了一定的效果。然而,现有的解决方法大多关注单一边信息,甚少有同时利用多种边信息的整体解决方案。事实上,同时利用多种边信息可以更加全面地表示用户偏好和物品属性,进而提升推荐算法的性能。因此,本文提出了协同训练框架下联合使用文本与图片的推荐方法,其主要创新点有:(1)首次使用协同训练这一多视图学习技术来整合文本和图片两种边信息用于推荐。该方法不仅使用文本和图片来提升了推荐算法性能,还为同时使用多种边信息用于推荐提供了一种新的思路。多视图学习是利用多源信息进行学习的重要方法。使用多视图学习可以让不同视图中的互补信息得到交换进而提升模型学习性能。协同训练是一种多视图学习技术,其利用具有不同视图的基模型互相标注无标记样本来实现信息的交换。面对高维异质的文本和图像数据,本文使用深度神经网络,分别从评论文本和物品图片中提取出低维的用户和物品的特征表示。然后使用提取出的特征构造了两个分别具有文本视图和图片视图的基模型。为了使两个视图的基模型互相学习,本文使用协同训练来联合训练两个不同视图的基模型。(2)提出了一种伪标记样本的可信性验证方法,防止协同训练过程中使用不可信的伪标记样本造成模型性能衰减。在协同训练的过程中,每个视图中的基模型会标注一部分无标记样本(得到的样本称为伪标记样本),用于另一视图中基模型的迭代训练。由于模型的标注结果不一定是可信的,本文提出了一种验证方法,保证伪标记样本的可信性,避免因为使用不可信的伪标记样本造成模型性能下降。最后,经过在三个公开数据集上进行大量的实验,结果表明本文的方法好于使用单种边信息的方法,并且退化实验显示了伪标记样本可信性验证方法的有效性。实验充分证明了本文方法的有效性,显示该方法能够有效提升推荐算法的性能。

内外部语义协同训练的实体对齐算法的研究

这是一篇关于实体对齐,卷积图神经网络,跨语言知识图谱,协同训练的论文, 主要内容为随着知识图谱的发展,国内外涌现了各式各样的知识图谱,学者们通过将数据源不同的多个知识图谱融合成一个知识图谱,增强该知识图谱的数据覆盖率,作为知识图谱融合的一个重要子任务,实体对齐可以在两个知识图谱中查找引用同一真实世界对象的实体,在自动集成多个知识库方面起着至关重要的作用。然而,传统的实体对齐方法难以利用知识图谱中复杂的实体信息;其次,越来越多的特定语言知识图谱的出现使得知识图谱间的多语言差异巨大;最后,知识图谱体量庞大,但人为标注的训练数据较少,训练难度大。因此,跨语言知识图谱的实体对齐是一个必要且具有挑战的任务。本文主要研究跨语言知识图谱的实体对齐,分析了当前国内外的研究技术,提出了一种内外部语义协同训练的知识图谱嵌入的实体对齐算法,并利用该算法构建了一个实体对齐的可视化原型系统。本文完成的主要工作内容如下:提出了基于简化内部语义的关系感知图卷积网络的实体对齐算法im-GCN-align,该算法简化实体的属性特征并改进图结构的连通矩阵,挖掘实体的完整内部语义,进而改进内部语义视角的实体对齐效果。提出了基于内外部语义协同训练的知识图谱嵌入的实体对齐算法BRCEA,该算法分别利用im-GCN-align和RDGCN充分挖掘实体的内部语义和外部语义,并通过协同训练缓解训练数据不足的问题,提高训练集有限时实体对齐的效果。搭建了实体对齐可视化原型系统,该系统应用上述研究成果BRCEA算法在DBP15k数据集上的实体对齐结果,提供中、日、英、法四种语言的跨语言搜索服务。

内外部语义协同训练的实体对齐算法的研究

这是一篇关于实体对齐,卷积图神经网络,跨语言知识图谱,协同训练的论文, 主要内容为随着知识图谱的发展,国内外涌现了各式各样的知识图谱,学者们通过将数据源不同的多个知识图谱融合成一个知识图谱,增强该知识图谱的数据覆盖率,作为知识图谱融合的一个重要子任务,实体对齐可以在两个知识图谱中查找引用同一真实世界对象的实体,在自动集成多个知识库方面起着至关重要的作用。然而,传统的实体对齐方法难以利用知识图谱中复杂的实体信息;其次,越来越多的特定语言知识图谱的出现使得知识图谱间的多语言差异巨大;最后,知识图谱体量庞大,但人为标注的训练数据较少,训练难度大。因此,跨语言知识图谱的实体对齐是一个必要且具有挑战的任务。本文主要研究跨语言知识图谱的实体对齐,分析了当前国内外的研究技术,提出了一种内外部语义协同训练的知识图谱嵌入的实体对齐算法,并利用该算法构建了一个实体对齐的可视化原型系统。本文完成的主要工作内容如下:提出了基于简化内部语义的关系感知图卷积网络的实体对齐算法im-GCN-align,该算法简化实体的属性特征并改进图结构的连通矩阵,挖掘实体的完整内部语义,进而改进内部语义视角的实体对齐效果。提出了基于内外部语义协同训练的知识图谱嵌入的实体对齐算法BRCEA,该算法分别利用im-GCN-align和RDGCN充分挖掘实体的内部语义和外部语义,并通过协同训练缓解训练数据不足的问题,提高训练集有限时实体对齐的效果。搭建了实体对齐可视化原型系统,该系统应用上述研究成果BRCEA算法在DBP15k数据集上的实体对齐结果,提供中、日、英、法四种语言的跨语言搜索服务。

基于循环神经网络RNN的领域命名实体识别方法研究

这是一篇关于知识图谱,循环神经网络,领域命名实体识别,协同训练,样本迁移的论文, 主要内容为随着信息时代的发展,人们越来越倾向于在网上检索信息和获取问题答案。传统的搜索引擎针对用户检索的问题往往返回的是相关文档而非确切的答案,因此基于知识图谱的问答系统逐渐发展起来。命名实体识别(Named Entity Recognition,NER)作为构建知识图谱中基础而重要的一步而被广泛研究。而由于不同领域文本具有不同的特征和风格,使得领域NER的研究难度大大增加。近年来,神经网络在命名实体识别方面展现了巨大的应用前景,循环神经网络(Recurrent Neural Network,RNN)成为解决实体识别任务的一种卓越有效的方法,但其需要大量标签数据,而带标签数据的缺乏一直是一个难以解决的问题。本文在现有NER方法的基础上,主要解决当标签数据极少时领域NER的识别方法,基于循环神经网络RNN提出了一种改进的ERNN模型,同时结合样本迁移方法和协同训练策略,有效提高了领域NER的识别精度。立足于标签数据远远缺乏的情景,本文中主要的工作包括:(1)研究和分析现有概率统计模型和循环神经网络在NER任务上的效果,在ATIS(Airline Travel Information System)和中文文学语料这两个数据集上对模型进行对比实验,并使用不同规模大小的训练数据对模型进行监督学习。实验结果表明对于NER任务,RNN的效果要好于统计概率模型,最高提升达到了39.72%,同时证明了小规模数据集能达到高识别结果的可行性。(2)将RNN模型和统计概率模型应用于协同训练,同时对RNN的激活函数进行改进,并对比了改进前后的识别效果。实验表明新激活函数一定程度上提高了NER识别精度,同时,在训练数据远小于测试数据时通过对未标记数据的迭代也能达到很好的NER识别效果。(3)针对领域NER,对(2)中的神经网络做进一步改进,通过添加额外的汇合层和采用样本迁移,从两方面来实现对相似领域数据的充分利用。此外,本文提出了两种迁移策略。实验中使用不同的相似领域和不同迁移策略对模型进行预训练从而进行对比。相似领域数据采用人民日报和搜狗新闻语料,目标领域数据为高中政治领域数据。结果表明相比改进前,本文提出的ERNN模型有了2.06%的提升(F1分数从0.9212提升到了0.9402)。

基于协同训练的半监督推荐算法研究

这是一篇关于推荐系统,半监督学习,协同训练,集成学习,未标记数据的论文, 主要内容为在互联网技术飞速发展的背景下,信息过载问题成为了用户新的苦恼,也阻碍了互联网业务继续发展。随着数据挖掘技术的进步,个性化推荐系统应运而生,推荐系统能够在浩如烟海的数据中发现用户潜在偏好,直击用户兴趣点。协同过滤是构建个性化推荐系统的核心技术,近年来受到了工业界和学术界的广泛关注,然而数据稀疏问题却始终制约着其性能。为了缓解数据稀疏问题,现有工作大多着眼于引入辅助信息,而甚少有工作关注大量廉价的未标记数据。本文聚焦于推荐系统中常见的数据稀疏问题,将尝试从两个新颖的角度进行思考,引入未标记样本缓解数据稀疏问题。本文针对传统推荐算法存在的数据稀疏问题,作出以下研究:提出了一种协同训练风格的半监督方法来集成三种成熟的协同过滤算法,称为半监督集成协同过滤(Semi-Supervised Ensemble Filtering),简称SSEF。具体而言,SSEF首先通过三种不同的协同过滤算法分别使用标记样本初始化三个弱预测模型。然后合并由邻域方法生成的两个预测模型,与潜在因子模型生成的预测模型,作为两个基学习器,在共同训练过程中,每个学习器都为另一个学习器标记无标记样本。为了安全地利用未标记的数据,通过验证伪标记的样本对标记的样本的影响来估计标记的置信度。通过将增强后的三个预测模型的输出加权融合,可以进行最终预测。所提出的算法在多个真实数据集上与众多协同过滤推荐算法(包括基于半监督,集成和基于边信息的解决方案)进行了对比,验证了所提出的半监督协同训练算法的有效性。通过提出一种评论感知的半监督协同训练方法(Review-aware Semi-supervised Collaborative Filtering,RSCF)来解决数据稀疏问题。具体来说,使用分解模型来捕获用户评论信息。然后,为了构建一个能够同时利用评论信息和未标记数据来提高推荐性能的模型,本文提出了一种半监督的集成学习算法。该算法使用不同评论信息构造不同的(弱)预测模型,然后采用协同训练策略以允许每个(弱)预测模型从其他预测模型中学习。与用于解决数据稀疏问题的标准推荐方法相比,该方法具有几个明显的优点。首先,它定义了一个评论感知分解模型,该模型兼顾了模型多样性与性能(评论信息使得学到的用户和物品表示更准确)。其次,该方法可以自然支持监督学习和半监督学习,提供了一种灵活的方法来合并未标记的数据。所提出的算法在两个真实数据集上进行了评估。实验结果表明,与标准算法相比,使用本文的方法可以显着提高推荐精度,并且可以大大缓解数据稀疏问题。

基于循环神经网络RNN的领域命名实体识别方法研究

这是一篇关于知识图谱,循环神经网络,领域命名实体识别,协同训练,样本迁移的论文, 主要内容为随着信息时代的发展,人们越来越倾向于在网上检索信息和获取问题答案。传统的搜索引擎针对用户检索的问题往往返回的是相关文档而非确切的答案,因此基于知识图谱的问答系统逐渐发展起来。命名实体识别(Named Entity Recognition,NER)作为构建知识图谱中基础而重要的一步而被广泛研究。而由于不同领域文本具有不同的特征和风格,使得领域NER的研究难度大大增加。近年来,神经网络在命名实体识别方面展现了巨大的应用前景,循环神经网络(Recurrent Neural Network,RNN)成为解决实体识别任务的一种卓越有效的方法,但其需要大量标签数据,而带标签数据的缺乏一直是一个难以解决的问题。本文在现有NER方法的基础上,主要解决当标签数据极少时领域NER的识别方法,基于循环神经网络RNN提出了一种改进的ERNN模型,同时结合样本迁移方法和协同训练策略,有效提高了领域NER的识别精度。立足于标签数据远远缺乏的情景,本文中主要的工作包括:(1)研究和分析现有概率统计模型和循环神经网络在NER任务上的效果,在ATIS(Airline Travel Information System)和中文文学语料这两个数据集上对模型进行对比实验,并使用不同规模大小的训练数据对模型进行监督学习。实验结果表明对于NER任务,RNN的效果要好于统计概率模型,最高提升达到了39.72%,同时证明了小规模数据集能达到高识别结果的可行性。(2)将RNN模型和统计概率模型应用于协同训练,同时对RNN的激活函数进行改进,并对比了改进前后的识别效果。实验表明新激活函数一定程度上提高了NER识别精度,同时,在训练数据远小于测试数据时通过对未标记数据的迭代也能达到很好的NER识别效果。(3)针对领域NER,对(2)中的神经网络做进一步改进,通过添加额外的汇合层和采用样本迁移,从两方面来实现对相似领域数据的充分利用。此外,本文提出了两种迁移策略。实验中使用不同的相似领域和不同迁移策略对模型进行预训练从而进行对比。相似领域数据采用人民日报和搜狗新闻语料,目标领域数据为高中政治领域数据。结果表明相比改进前,本文提出的ERNN模型有了2.06%的提升(F1分数从0.9212提升到了0.9402)。

协同训练框架下联合使用文本与图片的推荐方法研究

这是一篇关于推荐系统,多视图学习,协同训练,文本,图片,神经网络的论文, 主要内容为推荐系统通过分析用户对物品的历史行为来为用户推荐其可能感兴趣的物品。在实际场景中,用户对物品的历史行为信息往往是十分稀疏的,这会严重制约推荐系统性能。为了提升推荐系统的性能,现有的很多研究将物品的评论文本、图片等各种边信息加入到推荐系统中辅助推荐,取得了一定的效果。然而,现有的解决方法大多关注单一边信息,甚少有同时利用多种边信息的整体解决方案。事实上,同时利用多种边信息可以更加全面地表示用户偏好和物品属性,进而提升推荐算法的性能。因此,本文提出了协同训练框架下联合使用文本与图片的推荐方法,其主要创新点有:(1)首次使用协同训练这一多视图学习技术来整合文本和图片两种边信息用于推荐。该方法不仅使用文本和图片来提升了推荐算法性能,还为同时使用多种边信息用于推荐提供了一种新的思路。多视图学习是利用多源信息进行学习的重要方法。使用多视图学习可以让不同视图中的互补信息得到交换进而提升模型学习性能。协同训练是一种多视图学习技术,其利用具有不同视图的基模型互相标注无标记样本来实现信息的交换。面对高维异质的文本和图像数据,本文使用深度神经网络,分别从评论文本和物品图片中提取出低维的用户和物品的特征表示。然后使用提取出的特征构造了两个分别具有文本视图和图片视图的基模型。为了使两个视图的基模型互相学习,本文使用协同训练来联合训练两个不同视图的基模型。(2)提出了一种伪标记样本的可信性验证方法,防止协同训练过程中使用不可信的伪标记样本造成模型性能衰减。在协同训练的过程中,每个视图中的基模型会标注一部分无标记样本(得到的样本称为伪标记样本),用于另一视图中基模型的迭代训练。由于模型的标注结果不一定是可信的,本文提出了一种验证方法,保证伪标记样本的可信性,避免因为使用不可信的伪标记样本造成模型性能下降。最后,经过在三个公开数据集上进行大量的实验,结果表明本文的方法好于使用单种边信息的方法,并且退化实验显示了伪标记样本可信性验证方法的有效性。实验充分证明了本文方法的有效性,显示该方法能够有效提升推荐算法的性能。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码货栈 ,原文地址:https://m.bishedaima.com/lunwen/54700.html

相关推荐

发表回复

登录后才能评论