学者研究兴趣网络构建与分析
这是一篇关于学者研究兴趣网络,主题模型,复杂网络,二分网络的论文, 主要内容为本文了解到学术领域存在信息过载和信息孤岛等问题,大部分学者没有足够的时间和精力对逐年增长的学术文献进行研读,仅通过关注核心期刊、领域核心人物或领域主要会议来了解研究领域的研究动态,这样容易造成学者在学术上的信息孤岛,无法及时发现和了解自己感兴趣的文章和与自己具有相同研究兴趣的学者。本文受电商平台广泛使用的用户购物兴趣模型启发,以地质领域为例,提出构建学术领域学者研究兴趣网络。在网络构建过程中,利用主题模型良好的主题抽取能力,结合不同的用户兴趣模型构建方法进行网络构建和分析。为了确保学者研究兴趣抽取结果的质量,本文制定了重名消歧规则来识别语料中的唯一作者,并通过领域词典构建、固定短语抽取等方法保证中文分词的质量。在集体学者研究兴趣网络构建过程中,使用LDA主题模型汇总多位学者数据训练一个主题模型,并从中抽取每个学者的研究兴趣,根据学者之间是否具有相同研究兴趣构建学者研究兴趣网络。在个体学者研究网络构建过程中,使用作者主题模型为每个学者训练一个主题模型并抽取研究兴趣,通过计算主题相似度构建学者研究兴趣网络。针对这两种学者研究兴趣网络分别使用复杂网络和二分网络的分析方法进行网络分析,发现地质领域的研究热点集中于油气资源和矿产资源的形成及开发。最后通过抽取学者研究兴趣随时间变化的趋势,构建了动态学者研究兴趣网络。学者研究兴趣网络是学术推荐系统的基础,据此可以进一步探索学者感兴趣文章推荐、具有相似研究兴趣的学者推荐等研究方向。
基于协同过滤的推荐算法研究与系统实现
这是一篇关于协同过滤,聚类,二分网络,多源信息,矩阵分解的论文, 主要内容为面对日益严重的“信息过载”问题,很多研究提出使用信息检索技术来解决,但是该技术仍有对搜索关键词依赖和无法提供个性化服务等问题。为了解决上述问题,推荐系统被提出。其中协同过滤算法是推荐系统中常用的一种推荐算法,但是仍面临着数据稀疏性、冷启动、可扩展性和评分数据本身的局限性等挑战。因此,本文以上述存在的问题为出发点,结合不同的分析方法,融合多源信息,在基于内存和基于矩阵分解的两种传统CF算法的基础上进行了研究、改进和实践应用。工作内容如下:研究了基于聚类和二分网络的协同过滤模型(Collaborative Filtering model based on Clustering and Bipartite Network,CBNRank)在缓解协同过滤算法中数据稀疏性、可扩展性和评分数据本身的局限性问题的效果。首先,使用聚类和协同过滤组合算法处理评分数据,对用户聚类,在每个聚类簇中利用基于用户协同过滤算法填充该评分矩阵,以降低算法的运算时间和数据的稀疏度。然后,将评分数据处理为成对偏好数据集,构建相应的二分网络结构,以缓解评分数据本身的局限性问题。最后,利用基于图的排名算法计算项目之间的相似度,实现Top N推荐。实验结果表明CBNRank模型对于缓解上述问题起到了积极的作用,提升了预测精准度。研究了基于多源信息和深度矩阵分解的协同过滤模型(Collaborative Filtering model based on Multi-source Information and Deep Matrix Factorization,MIDMFRank)在缓解协同过滤算法中数据稀疏性和冷启动问题的效果。首先,分别将用户和项目信息通过不同网络层的处理,得到用户和项目特征。然后,将评分数据作为深度矩阵分解模型的输入,分别学习到用户和项目隐特征,将用户和项目特征分别融合到用户和项目隐特征中,通过融合后的隐特征继续训练模型,以缓解冷启动问题。最后,根据归一化交叉熵损失函数继续学习,得到最终的评分预测矩阵,实现Top N推荐。实验结果表明MIDMFRank模型对于缓解上述问题有促进作用,提高了评分预测精度。设计了基于MIDMFRank模型的电影推荐系统。该系统以需求为出发点,设计了整体架构、功能模块和数据库,最终实现了推荐服务,验证了MIDMFRank模型在实践应用中的可行性。
学者研究兴趣网络构建与分析
这是一篇关于学者研究兴趣网络,主题模型,复杂网络,二分网络的论文, 主要内容为本文了解到学术领域存在信息过载和信息孤岛等问题,大部分学者没有足够的时间和精力对逐年增长的学术文献进行研读,仅通过关注核心期刊、领域核心人物或领域主要会议来了解研究领域的研究动态,这样容易造成学者在学术上的信息孤岛,无法及时发现和了解自己感兴趣的文章和与自己具有相同研究兴趣的学者。本文受电商平台广泛使用的用户购物兴趣模型启发,以地质领域为例,提出构建学术领域学者研究兴趣网络。在网络构建过程中,利用主题模型良好的主题抽取能力,结合不同的用户兴趣模型构建方法进行网络构建和分析。为了确保学者研究兴趣抽取结果的质量,本文制定了重名消歧规则来识别语料中的唯一作者,并通过领域词典构建、固定短语抽取等方法保证中文分词的质量。在集体学者研究兴趣网络构建过程中,使用LDA主题模型汇总多位学者数据训练一个主题模型,并从中抽取每个学者的研究兴趣,根据学者之间是否具有相同研究兴趣构建学者研究兴趣网络。在个体学者研究网络构建过程中,使用作者主题模型为每个学者训练一个主题模型并抽取研究兴趣,通过计算主题相似度构建学者研究兴趣网络。针对这两种学者研究兴趣网络分别使用复杂网络和二分网络的分析方法进行网络分析,发现地质领域的研究热点集中于油气资源和矿产资源的形成及开发。最后通过抽取学者研究兴趣随时间变化的趋势,构建了动态学者研究兴趣网络。学者研究兴趣网络是学术推荐系统的基础,据此可以进一步探索学者感兴趣文章推荐、具有相似研究兴趣的学者推荐等研究方向。
基于协同过滤的推荐算法研究与系统实现
这是一篇关于协同过滤,聚类,二分网络,多源信息,矩阵分解的论文, 主要内容为面对日益严重的“信息过载”问题,很多研究提出使用信息检索技术来解决,但是该技术仍有对搜索关键词依赖和无法提供个性化服务等问题。为了解决上述问题,推荐系统被提出。其中协同过滤算法是推荐系统中常用的一种推荐算法,但是仍面临着数据稀疏性、冷启动、可扩展性和评分数据本身的局限性等挑战。因此,本文以上述存在的问题为出发点,结合不同的分析方法,融合多源信息,在基于内存和基于矩阵分解的两种传统CF算法的基础上进行了研究、改进和实践应用。工作内容如下:研究了基于聚类和二分网络的协同过滤模型(Collaborative Filtering model based on Clustering and Bipartite Network,CBNRank)在缓解协同过滤算法中数据稀疏性、可扩展性和评分数据本身的局限性问题的效果。首先,使用聚类和协同过滤组合算法处理评分数据,对用户聚类,在每个聚类簇中利用基于用户协同过滤算法填充该评分矩阵,以降低算法的运算时间和数据的稀疏度。然后,将评分数据处理为成对偏好数据集,构建相应的二分网络结构,以缓解评分数据本身的局限性问题。最后,利用基于图的排名算法计算项目之间的相似度,实现Top N推荐。实验结果表明CBNRank模型对于缓解上述问题起到了积极的作用,提升了预测精准度。研究了基于多源信息和深度矩阵分解的协同过滤模型(Collaborative Filtering model based on Multi-source Information and Deep Matrix Factorization,MIDMFRank)在缓解协同过滤算法中数据稀疏性和冷启动问题的效果。首先,分别将用户和项目信息通过不同网络层的处理,得到用户和项目特征。然后,将评分数据作为深度矩阵分解模型的输入,分别学习到用户和项目隐特征,将用户和项目特征分别融合到用户和项目隐特征中,通过融合后的隐特征继续训练模型,以缓解冷启动问题。最后,根据归一化交叉熵损失函数继续学习,得到最终的评分预测矩阵,实现Top N推荐。实验结果表明MIDMFRank模型对于缓解上述问题有促进作用,提高了评分预测精度。设计了基于MIDMFRank模型的电影推荐系统。该系统以需求为出发点,设计了整体架构、功能模块和数据库,最终实现了推荐服务,验证了MIDMFRank模型在实践应用中的可行性。
基于协同过滤的推荐算法研究与系统实现
这是一篇关于协同过滤,聚类,二分网络,多源信息,矩阵分解的论文, 主要内容为面对日益严重的“信息过载”问题,很多研究提出使用信息检索技术来解决,但是该技术仍有对搜索关键词依赖和无法提供个性化服务等问题。为了解决上述问题,推荐系统被提出。其中协同过滤算法是推荐系统中常用的一种推荐算法,但是仍面临着数据稀疏性、冷启动、可扩展性和评分数据本身的局限性等挑战。因此,本文以上述存在的问题为出发点,结合不同的分析方法,融合多源信息,在基于内存和基于矩阵分解的两种传统CF算法的基础上进行了研究、改进和实践应用。工作内容如下:研究了基于聚类和二分网络的协同过滤模型(Collaborative Filtering model based on Clustering and Bipartite Network,CBNRank)在缓解协同过滤算法中数据稀疏性、可扩展性和评分数据本身的局限性问题的效果。首先,使用聚类和协同过滤组合算法处理评分数据,对用户聚类,在每个聚类簇中利用基于用户协同过滤算法填充该评分矩阵,以降低算法的运算时间和数据的稀疏度。然后,将评分数据处理为成对偏好数据集,构建相应的二分网络结构,以缓解评分数据本身的局限性问题。最后,利用基于图的排名算法计算项目之间的相似度,实现Top N推荐。实验结果表明CBNRank模型对于缓解上述问题起到了积极的作用,提升了预测精准度。研究了基于多源信息和深度矩阵分解的协同过滤模型(Collaborative Filtering model based on Multi-source Information and Deep Matrix Factorization,MIDMFRank)在缓解协同过滤算法中数据稀疏性和冷启动问题的效果。首先,分别将用户和项目信息通过不同网络层的处理,得到用户和项目特征。然后,将评分数据作为深度矩阵分解模型的输入,分别学习到用户和项目隐特征,将用户和项目特征分别融合到用户和项目隐特征中,通过融合后的隐特征继续训练模型,以缓解冷启动问题。最后,根据归一化交叉熵损失函数继续学习,得到最终的评分预测矩阵,实现Top N推荐。实验结果表明MIDMFRank模型对于缓解上述问题有促进作用,提高了评分预测精度。设计了基于MIDMFRank模型的电影推荐系统。该系统以需求为出发点,设计了整体架构、功能模块和数据库,最终实现了推荐服务,验证了MIDMFRank模型在实践应用中的可行性。
基于评分系统的个性化推荐算法研究
这是一篇关于推荐系统,个性化推荐算法,K-means聚类,协同过滤,二分网络的论文, 主要内容为推荐系统是现代电子商务平台的重要组成部分,精准的推荐对于产品的营销无疑具有极大的促进作用。推荐算法作为推荐系统的关键与核心技术,受到来自网络科学与电子商务等领域学者和工程师的高度重视与广泛关注,其研究具有重要的理论意义与经济价值。自推荐系统出现以来,已涌现不少算法技术,然而现有的各种算法都或多或少存在各自一定的局限性,例如,当前应用最广的协同过滤(Collaborative Filtering,CF),由于它对用户和物品之间的交互信息具有很强的依赖性,当数据稀疏时其推荐的精准度会大大降低。此外,许多网络平台为了更好了解用户的喜好和需求,都构建了评分系统,例如电影平台中用户对电影的评分、音乐平台中用户对歌曲的评分等。如何利用这些评分信息来进行个性化推荐是推荐算法研究的重要课题。目前专门针对评分系统的推荐算法研究相对匮乏,且相关文献中大多都只利用高评分信息,而忽视低评分数据隐含的内在信息,可能导致推荐的精准度降低。因此,本文聚焦评分系统,综合运用K-means聚类方法、向量欧氏距离阈值法、复杂网络节点相似性算法等方法,针对上述问题提出了几种改进个性化推荐算法。首先,针对评分系统提出了一种基于缩减物品空间上的个性化推荐算法(ICF算法)。该算法一方面通过对物品空间进行缩减,把单个物品的稀少信息投影到有限类物品空间上,从而一定程度上改善了数据稀疏性问题;另一方面运用K-means聚类对用户之间的相似性信息进行二次提取,提出了加权相似性度量指标,更加准确地提取和刻画用户之间的兴趣相似性,因而获得了更精确的推荐效果。并进一步给出了ICF算法的完整流程,在获取了“用户-物品”原始数据的情况下,计算机可执行流程并自动生成目标用户的推荐列表,提高了推荐系统的执行效率。其次,针对评分系统分别提出了基于用户兴趣关联网络的个性化推荐算法(UNP算法)和基于物品兴趣关联网络的个性化推荐算法(ONP算法)。两种算法在充分利用用户评分信息的基础上,通过计算向量的欧氏距离和设置阈值,筛选出对象之间强关联性,分别构建了用户兴趣关联网络和物品兴趣关联网络,再结合二分网络的结构信息,计算目标用户感兴趣的物品排序,从而实现目标用户的个性化推荐。最后,为了测试本文提出算法的推荐效果,将ICF算法、UNP算法和ONP算法分别在Movie Lens和Netflix数据集上进行了性能测试,并且与几种典型推荐算法的推荐效果进行对比,实验结果表明,ICF算法和UNP算法的推荐质量都有了显著地提升。
基于增量SVD和RBM推荐系统的关键技术和实现策略
这是一篇关于大数据,推荐系统,信息过载,数据处理,增量SVD,二分网络,RBM的论文, 主要内容为随着信息社会的到来,使得与信息相关的行业都得到了快速发展。这就带来了信息量的急速膨胀,结果导致信息过载,在此背景下提出了推荐系统(Recommender Systems)。推荐系统是一种可以向用户推荐有用物品的技术。近些年来,推荐系统已经成为一个热门的研究领域,因此吸引了众多学者,不仅在工业界,学术界也备受关注,加之Netflix每年举办的竞赛和相关国际会议的召开,使得推荐系统成为了一门独立的学科。虽然推荐系统不断有新的技术和新的方法诞生,使得推荐系统技术越来越成熟。但仍然存在一些新用户,新物品,模型容易过拟合(可扩展性)等问题。依据数据集背景,使用了几种典型的数据预处理技术,例如为了使得建立模型的更准确,使用去噪方法,使用有放回取样增加训练样本数,使用平均值填补缺失值,为了提高模型鲁棒性,人为加入噪声等。本文主要针对现存的一些问题提出了改进方法,介绍如下:(1)虽然基于奇异值分解(SVD)技术的推荐系统,相对于传统的推荐技术,性能更好,但是进行矩阵分解的需要的计算代价大,无论是时间复杂度和空间复杂度,特别是数据集很大时,缺点更加明显;因此,在SVD的基础上,提出了增量地建立SVD模型,使用折叠技术,对于新的用户进行一次线性映射,这种技术不仅提高了推荐系统的可扩展性,而且在保证预测准确性的条件下极大地降低整个过程(训练和预测)时间复杂度,使得时间复杂度为O)1(,适合于推荐系统的线下和线上计算。(2)基于二分网络的推荐系统是基于权重方法的个性化推荐,将二分网络直接压缩并进行单模式映射,虽然单模式比二分网络含有更少的信息,但通过使用权重方法保留原始信息,同时利用基于网络的动态资源分配思想,使用权重方法直接提取网络的隐藏信息,性能比全局排名方法(global ranking method)明显好。(3)基于RBM模型的推荐系统适用于大规模数据集,这种两层无向图模型适合处理表格数据,能进行有效学习和推理,将概率模型和图模型结合,从而直接在用户和评分之间建立连接,不仅对预测结果的可解释性强,性能相比于SVD更好。当然,随着互联网用户数的日益增加,用户的需求也增大,不仅表现出多样性,而且表现出丰富多变性,同时,数据稀疏问题、特征提取、冷启动、过拟合等诸多问题仍然存在,因此,需要不断改进原有的推荐技术,并挖掘新技术来满足用户需求,为用户提供更加方便和有效的用户体验。从而使得推荐系统技术不断成熟,特别是在工业上发挥更大作用。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码货栈 ,原文地址:https://m.bishedaima.com/lunwen/56080.html