多语义路径融合的个性化论文推荐研究与实现
这是一篇关于论文推荐,多语义,融合,异质教育网络,元路径的论文, 主要内容为随着信息爆炸时代到来,越来越多的人难以在短时间内找到自己需要的资源。尤其是在蓬勃发展的科学研究领域,论文数量呈指数级增长,这给快速获取与自己研究领域密切相关的论文带了巨大的困难。通常,在研究生教育期间,为了更好的梳理自己研究方向的发展脉络,研究生要花费大量的时间和精力寻找论文。因此,个性化的论文推荐方法被研究生们所期待。近年来,随着社交网络的快速发展,基于社会关系规则和网络理论的推荐方法在一定程度上提高了推荐性能。然而,由于网络中节点类型的多样化和信息的深度融合,节点之间的潜在语义变得极其复杂。现有的论文推荐方法主要关注三、四个论文属性(比如标题、作者、出版物和关键词等),由这些属性信息构成的网络模式异常稀疏,易导致论文属性之间重要的语义路径丢失,进一步导致相关论文之间的关联缺失,影响论文的推荐效果。因此,在论文推荐过程中捕获多语义路径成为一个巨大的挑战。由于不同语义路径包含共同的同质和异质属性,可以通过这些共同属性找到多条语义路径之间的关系,从而建立起更多相关论文之间的关联。为了解决上述问题,本文提出一种新的异质网络中多语义路径融合的个性化论文推荐框架。在数据收集和预处理之后,通过丰富异质网络中的节点信息和边信息来构建一种新的异质教育网络(Heterogeneous Educational Network,HEN)模式,这个新的HEN模式中包含六个不同的节点类型,分别是论文标题、作者、出版物、关键词、基金和作者单位,还包含五种不同的直接相连的边信息和一种间接相连的边信息,分别是标题-作者、标题-出版物、标题-关键词、标题-基金、作者-作者单位以及标题-作者单位;其次,通过投影子网来生成不同语义的元路径,这些元路径由不同类型的节点构成,分别表示不同的语义信息;然后,一个新的多语义路径融合的HEN嵌入方法被提出,以产生丰富的HEN节点序列;最后,通过多语义路径的相似性为研究生个性化推荐论文。本文所提出框架方法的实验是在1987年至2021年教育促进代际流动研究领域和1997年至2021年数据挖掘与智能媒体研究领域两个论文数据集上进行的。大量实验表明,丰富异质信息网络和多语义路径融合有助于提高论文推荐的效率,即本文所提出的方法是有效的。基于本文提出的框架,通过需求分析和系统设计实现了一个个性化论文推荐系统。该系统包含检索论文、论文信息可视化、用户信息管理和论文信息管理等多个功能模块,可以为研究生提供个性化论文推荐服务,从而提高研究生的科研效率。
纺织领域学术热点及学术成果个性化推荐系统研究
这是一篇关于纺织,论文推荐,学术热点,自然语言处理,图数据挖掘的论文, 主要内容为近二十年来论文数量的爆发式增长推动了学术大数据的发展。论文推荐系统根据学者已发表的论文对推荐结果进行过滤,并根据学者实际的需求推荐论文,学术热点挖掘技术以文献计量学理论为基础,帮助学者追踪研究热点变化,两者可以减轻科研人员学术信息收集和梳理负担。目前学术热点挖掘技术在纺织领域应用的瓶颈在于,未对纺织领域的专业词汇进行统一的收集、消歧和分类,导致学术热点挖掘结果不够准确,科技情报服务平台在纺织领域应用的瓶颈在于,全学科领域学者消歧难度较大,目前仅根据姓名和机构识别学者身份,未完整的收集纺织学者以不同机构署名发表的论文,导致学者建模不够精准影响论文推荐。本课题将论文推荐和学术热点挖掘技术应用于纺织领域,为纺织领域的学者提供个性化、私域化和多样化的论文推荐服务,主要研究内容如下:(1)在收集中国知网发布的《中国学术期刊影响因子年报(2022年版)》纺织类36本中文期刊,创刊至2022年7月10日,已发表的19余万篇纺织中文论文的工作基础上,本研究构建了纺织学者库(6294位学者),基于合著关系对纺织领域的同名学者进行消歧,使用LDA、Doc2Vec和Node2Vec模型提取学者研究领域、论文语义和合著关系特征,为纺织学者自动绘制数字画像,并通过主题河流图可视化展示学者研究方向的时间变化。(2)在收集《纺织汉语叙词表》《纺织大百科》《纺织辞典》以及19万篇学术论文作者关键词工作的基础上,本研究利用作者关键词的中英文对应关系实现词义消歧,构建了纺织中文术语库(17806个术语),结合术语的文献计量学特征(时间、引用量和共现关系),挖掘研究技术和材料之间的联系,预测未来的学术热点,为基于学术热点的论文推荐提供依据。(3)在构建纺织术语库、论文库和学者库工作的基础上,本课题开发了纺织领域个性化学术推荐系统,该系统可以将近年来与学者研究方向相关的论文、与学者研究方向相近的学者发表的论文、与学者学术关系密切的学者发表的论文推荐给学者库中的学者,同时也考虑到纺织领域初级科研人员(已发表论文较少,缺少足够的信息对学者建模)的学术需求,系统向其推荐学术热点论文。与中国知网和AMiner等主流的学术推荐系统相比,本课题开发的系统具有如下优势:(1)在构建纺织学者库时,本系统对纺织领域的学者进行消歧,较为完整的收集学者以不同机构署名发表的论文,绘制纺织学者数字画像的过程中,综合纺织专家的意见,使得语言模型能更合理的识别纺织学者研究兴趣的变化。(2)在挖掘纺织领域学术热点时,本系统收集了纺织学术领域常用术语,在消歧和分类的基础上,整理出纺织各分支领域中主要的材料和技术,为学术热点挖掘在纺织全领域的应用提供基础数据,提高了学术热点挖掘的准确性。(3)在为纺织学者推荐论文时,本系统考虑到学者的个性化与多样化需求,推荐与学者研究领域相关的论文,减轻学者检索负担,推荐与学者学术关系密切的学者发表的论文,帮助学者了解身边动态,推荐与学者研究领域相关的学者发表的论文,帮助学者了解同行情况,推荐学术热点论文,帮助学者把握前沿热点。本系统初步实现了纺织学术领域的数字化,仅收集学者发表的中文论文并对学者建模,还不够全面,仅推荐中文论文给学者,无法满足学者对于英文论文的需求。目前系统整体的框架已基本搭建完成,实现了数据收集、清洗、消歧、训练和论文推荐过程的自动化,当前的瓶颈在于缺少跨语言的同名消歧和面向纺织领域的机器翻译两大功能模块,当实现这两部分功能后,系统能更好的满足纺织领域学者的需求。
基于Spring Cloud的科技论文分析系统的研究与实现
这是一篇关于Spring Cloud,热词排名,热词趋势,期刊评价,论文推荐的论文, 主要内容为随着从事科研工作的人逐渐增多,科技成果系统的需求也发生了变化。通过对科技成果管理系统的调研发现,首先,当前科技成果系统架构大部分使用的是单体架构,该架构容易导致系统的业务逻辑过于复杂、后期系统的可维护性和可扩展性差等问题。其次,目前大多数的科技成果系统缺少对科技论文进行分析,很难有效的提供丰富的数据分析功能,使用户无法从大量数据中获得有效的信息。所以本文针对上述问题,设计并实现了基于Spring Cloud微服务架构的科技论文分析系统。本文的主要工作包括:1.系统需求分析及总体功能设计。针对目前大多数科技成果系统中使用单体架构和系统中缺少科技论文分析功能的问题,进行了功能性和非功能性需求分析。系统中主要包含的功能模块有:用户管理模块、论文管理模块、论文查询模块、热词分析模块和论文推荐模块。2.微服务架构设计及核心功能算法设计。本文对系统总体架构进行设计,构建数据处理微服务群、算法微服务群和功能实现微服务群,并对系统中使用到的关键组件、数据库和核心功能进行设计。论文中使用基于用户投票的排名算法实现了热词排名功能,使用时间序列算法实现了热词趋势的功能,使用PageRank算法实现了期刊评价功能,使用基于用户的协同过滤算法实现了论文推荐的功能。3.系统的实现和测试评价。论文实现了基于Spring Cloud微服务架构的科技论文分析系统,并对系统进行功能性测试,检验系统的可用性。对热词排名功能、热词趋势功能和期刊评价功能的测试结果进行分析,验证这些功能的计算和预测的准确性。本文设计并实现了基于Spring Cloud微服务架构的科技论文分析系统,它能够提高系统后期的可维护性、可扩展性和可重用性,还能够为用户提供热门研究词汇以及热门词汇的发展趋势。
基于生成对抗网络的学术论文推荐算法研究
这是一篇关于推荐系统,生成对抗网络,论文推荐,卷积神经网络,长短时记忆网络的论文, 主要内容为随着大数据时代的快速发展,学术论文资源呈现爆炸式持续增长,面对如此海量的学术论文,传统的搜索引擎耗时耗力,推荐系统是进行信息过滤的有效手段,将用户获取论文的方式由“主动”转化为“被动”,大大节省用户的时间和精力,缓解信息过载问题。在论文推荐领域中,有以下几个挑战,第一,用户和论文的交互方式一般是浏览、点击等具有较少信息量的隐式反馈行为,无法准确区分用户的正负样本,这使得推荐系统很难精准建模用户的兴趣偏好。第二,学术论文中的标题和摘要具有丰富的语义内容信息,而在推荐系统中融入辅助信息是提升推荐性能的重要手段之一,如何有效提取论文的语义信息并融入推荐系统至关重要。近年来,生成对抗网络(GAN)由于其优秀的样本生成能力,在推荐系统中得到了愈为广泛的关注,尤其对于隐式反馈下的推荐系统,能有效改善正负样本区分不足的问题。本文针对上述论文推荐中的挑战,研究基于GAN的学术论文推荐算法,研究内容与主要工作如下:(1)提出一种基于神经协同的对抗推荐算法(NCGAN)。在隐式反馈的场景下,针对推荐模型IRGAN采用线性模型导致的交互不足和策略梯度带来的训练缓慢问题,NCGAN引入神经网络来建模用户和项目之间的非线性交互,同时,采用Gumbel Softmax方法解决离散采样问题,使得模型可通过梯度下降进行训练,替代原有的策略梯度。在模型中,生成器的反馈直接来源于判别器,避免了随机负采样所导致的误差,可以更好地拟合用户兴趣偏好。在两个公开数据集Movie Lens上验证了NCGAN的算法可行性和模型收敛效率的优势。(2)提出一种基于多类型神经网络的论文语义提取模型(TAA)。针对现有方法建模论文语义信息不充分问题,本文对论文的标题和摘要进行了更为细粒度的语义提取操作。首先,将标题视为论文整体信息的概括,利用卷积神经网络提取论文的全局特征,之后,将摘要视为标题内容的具体化,使用双层结构的长短时记忆网络分别对摘要的词序列和句序列进行语义建模,并引入注意力机制对标题和摘要文本上的相关度进行关联,提升语义特征的准确度,最后,将得到的语义特征输入到推荐任务,为推荐提供更为有效的辅助特征。通过下游的推荐实验对比,验证了TAA进行论文语义提取的有效性。(3)鉴于以上两点研究,提出一种融合细粒度语义特征的论文对抗推荐算法(TAGAN)。在GAN推荐算法的基础上引入更为细粒度的论文语义特征,GAN推荐算法可以改善隐式反馈下的正负样本问题,而语义特征的引入一定程度上缓解数据稀疏问题。在生成器模型中,将论文的交互特征和语义特征进行融合,并使用调节因子调整语义特征的重要度。在两个公开论文数据集Citeulike上验证了TAGAN的推荐效果,并通过模型简化实验验证了引入GAN推荐算法的有效性。(4)设计实现了一种论文推荐系统(TA)。首先,从万方、维普等学术资源商和网络学术爬虫获取各类论文元数据并存储到数据仓储中,之后元数据进行去重、过滤脏数据等一系类数据清洗操作,同时,对清洗完的数据进行数据加工,主要采用TF-IDF进行标签生成和采用朴素贝叶斯进行学科分类,最后,针对不同用户采取以TAGAN为核心的多策略推荐方法,并在移动端进行推荐页面展示。
基于生成对抗网络的学术论文推荐算法研究
这是一篇关于推荐系统,生成对抗网络,论文推荐,卷积神经网络,长短时记忆网络的论文, 主要内容为随着大数据时代的快速发展,学术论文资源呈现爆炸式持续增长,面对如此海量的学术论文,传统的搜索引擎耗时耗力,推荐系统是进行信息过滤的有效手段,将用户获取论文的方式由“主动”转化为“被动”,大大节省用户的时间和精力,缓解信息过载问题。在论文推荐领域中,有以下几个挑战,第一,用户和论文的交互方式一般是浏览、点击等具有较少信息量的隐式反馈行为,无法准确区分用户的正负样本,这使得推荐系统很难精准建模用户的兴趣偏好。第二,学术论文中的标题和摘要具有丰富的语义内容信息,而在推荐系统中融入辅助信息是提升推荐性能的重要手段之一,如何有效提取论文的语义信息并融入推荐系统至关重要。近年来,生成对抗网络(GAN)由于其优秀的样本生成能力,在推荐系统中得到了愈为广泛的关注,尤其对于隐式反馈下的推荐系统,能有效改善正负样本区分不足的问题。本文针对上述论文推荐中的挑战,研究基于GAN的学术论文推荐算法,研究内容与主要工作如下:(1)提出一种基于神经协同的对抗推荐算法(NCGAN)。在隐式反馈的场景下,针对推荐模型IRGAN采用线性模型导致的交互不足和策略梯度带来的训练缓慢问题,NCGAN引入神经网络来建模用户和项目之间的非线性交互,同时,采用Gumbel Softmax方法解决离散采样问题,使得模型可通过梯度下降进行训练,替代原有的策略梯度。在模型中,生成器的反馈直接来源于判别器,避免了随机负采样所导致的误差,可以更好地拟合用户兴趣偏好。在两个公开数据集Movie Lens上验证了NCGAN的算法可行性和模型收敛效率的优势。(2)提出一种基于多类型神经网络的论文语义提取模型(TAA)。针对现有方法建模论文语义信息不充分问题,本文对论文的标题和摘要进行了更为细粒度的语义提取操作。首先,将标题视为论文整体信息的概括,利用卷积神经网络提取论文的全局特征,之后,将摘要视为标题内容的具体化,使用双层结构的长短时记忆网络分别对摘要的词序列和句序列进行语义建模,并引入注意力机制对标题和摘要文本上的相关度进行关联,提升语义特征的准确度,最后,将得到的语义特征输入到推荐任务,为推荐提供更为有效的辅助特征。通过下游的推荐实验对比,验证了TAA进行论文语义提取的有效性。(3)鉴于以上两点研究,提出一种融合细粒度语义特征的论文对抗推荐算法(TAGAN)。在GAN推荐算法的基础上引入更为细粒度的论文语义特征,GAN推荐算法可以改善隐式反馈下的正负样本问题,而语义特征的引入一定程度上缓解数据稀疏问题。在生成器模型中,将论文的交互特征和语义特征进行融合,并使用调节因子调整语义特征的重要度。在两个公开论文数据集Citeulike上验证了TAGAN的推荐效果,并通过模型简化实验验证了引入GAN推荐算法的有效性。(4)设计实现了一种论文推荐系统(TA)。首先,从万方、维普等学术资源商和网络学术爬虫获取各类论文元数据并存储到数据仓储中,之后元数据进行去重、过滤脏数据等一系类数据清洗操作,同时,对清洗完的数据进行数据加工,主要采用TF-IDF进行标签生成和采用朴素贝叶斯进行学科分类,最后,针对不同用户采取以TAGAN为核心的多策略推荐方法,并在移动端进行推荐页面展示。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈 ,原文地址:https://m.bishedaima.com/lunwen/48799.html