基于可信数据和用户相似度融合的协同过滤推荐算法研究
这是一篇关于协同过滤,用户相似度,推荐准确性,slope one算法,可信数据的论文, 主要内容为互联网作为人们获取信息的主要途径,在给人们生活带来便利的同时,也使得人们不得不面临信息过载的问题。由于推荐系统能有效缓解信息过载,在互联网公司中应用非常广泛,其中,协同过滤推荐系统作为推荐系统领域的重要分支,一直是相关学者研究的重点。由于协同过滤推荐算法对系统的推荐准确性要求较高,算法的实现通常会很复杂,与此同时,在真实的网络环境中不可避免的存在虚假评分误导用户、算法在处理与用户相关的推荐任务时往往表现不佳等问题,为了解决以上问题,本文提出了一种基于可信数据和改进用户相似度融合的slope one协同过滤推荐算法,本文的主要工作如下:1.在基于用户的协同过滤算法中,用户相似度虽然能使用改进cosine相似度和皮尔逊相关度来得出,但是可能会忽略不同用户对单个项目的评价差异对用户相似度计算所造成的影响,即在计算用户相似度时,用户对项目的评分向量有显著差异时,仍会得到相似的合向量结果,最终影响系统的推荐准确性。针对这一问题,本文提出一种改进的用户相似度算法。该算法在传统的余弦相似度算法中加入了平衡因子来计算不同用户之间的项目评分差异。通过在Movie Lens数据集下测试,得到了最合适的平衡因子值,同时验证了基于该平衡因子的最佳阈值在算法实现中的有效性,有效地缓解了用户对项目评分差异对相似度计算结果的影响,获得了较好的推荐结果。2.深入研究了基于可信数据的融合推荐算法,为了提升在相同可信率下推荐系统的准确性,提出了一种基于可信数据和改进用户相似度融合的slope one算法,该算法包括三个步骤,首先,我们选择具有一定数量的可信数据,其次使用改进的相似度算法计算用户之间的相似度,最后,我们将得来的相似度加权到slope one算法中,得到最终的改进推荐算法。经过一系列实验,最终结果表明本文提出的改进slope one推荐算法比传统的slope one算法在相同可信率下MAE、RMSE指标表现更好,同时在邻居数较低时也能获得较好的推荐性能,缓解了评分矩阵的数据稀疏性,具备很高的实用价值。
基于多级相似度和信息核的协同过滤推荐算法研究
这是一篇关于推荐系统,协同过滤,信息核,用户相似度的论文, 主要内容为随着信息技术的迅速发展和普及,数据资源以指数级别的速度增加,这使得用户在面对众多的网络资源时,反而无法高效选择出对自己有用的信息,进而出现信息超载问题。于是推荐系统应运而生,它依据用户的历史数据,通过用户的兴趣爱好来进行独特的个性化分析、计算,从而为用户提供有用的信息。现今推荐系统已广泛应用到社交网站,电子商务,电子学习,电影推荐和旅游等诸多领域。随着对推荐系统的深入研究,相应的研究难题也显露出来,例如对于新注册的用户,系统为其作推荐时的冷启动问题;用户评分矩阵中的数据稀疏性问题;随着用户和物品数目激增而带来的系统可扩展性问题,以及大多数算法只注重推荐相似物品而缺乏多样性的问题等等,这都影响了推荐系统的进一步发展。本文就协同过滤系统由于数据量增多而导致的日益严重的可扩展性问题、算法耗时长以及相似度函数度量准确性等问题,进行了如下内容的研究:(1)针对协同过滤推荐中存在的可扩展性问题,本文使用了提取信息核的方法。即将一个用户集的所有用户进行训练,提取出携带信息最具价值的核心用户组成信息核,这一过程为离线操作,这使得在计算用户相似度时,会大大节省内存和时间消耗。本文在原有基于频率(Frequency-based,FB)和基于排名(Rank-based,RB)的信息核提取方法基础上,提出了改进的信息核提取方法IFB(IFrequency-based)和IRB(IRank-based,IRB),在寻找最相似邻居环节提出了一个优化集的概念,在优化集上利用物品评分和用户相似度两项参考内容来为每个用户寻找最相似邻居,该算法在较大程度上同时也降低了推荐过程的时间复杂度。(2)针对推荐系统中用户相似度计算准确性问题,本文在传统度量标准皮尔逊相似度(PCC)的基础上做出改进,提出了多级相似度算法(Multi-Level Pearson Correlation Coefficient,MLPCC),算法分为五层,每层对应不同的约束条件和调节参数。在利用评分接近程度来计算用户相似度的同时,充分考虑了共同评分物品数量对用户相似度的影响,使共同评分物品数量越多的用户具有更高的相似度,优化了度量标准。在与多种推荐算法的对比实验中可以看出,本文的方法能够有效解决推荐过程的可扩展性问题,节省了大量时间开销,并减少了平均绝对误差(MAE),同时具有更高的准确率(Precision)和更好的召回率(Recall),推荐效果更优。
基于信任关系的社交网络推荐算法研究
这是一篇关于推荐系统,社交网络,信任关系,用户相似度,项目相似度的论文, 主要内容为近年来,随着互联网行业飞速的发展,人类已经逐步进入了大数据时代,但与此同时,由于信息的数据量呈现爆炸式的增长,“信息过载”已经成为业内重点关注的问题之一。推荐系统作为一种解决“信息过载”问题的技术在互联网中得到了广泛的应用。当前推荐算法的研究取得了一定的进展,众多学者纷纷提出融合用户信任信息的推荐算法,但算法的推荐性能仍有可提升空间。通过结合用户信任度和社会特征等,会使推荐性能得到较好地提升。本文主要研究工作如下:(1)针对社交网络中数据集稀疏性问题,以及用户间具有不同兴趣偏好的特点,本文提出了一种融合用户信任关系簇与用户社会特征的推荐算法(Recommend System with Trust Cluster and User Characterized Social Regularization,简称RSTU算法)。在算法中,通过对同一受信者有信任关系的用户簇特征向量作为受信者特征向量的方法,计算簇中用户与受信者的相似度,使其能够降低用户之间信任关系的稀疏度;针对用户簇中存在用户数量少而不能很好表示受信者特征的问题,利用用户与其对应信任用户簇之间的相似度计算最小距离,提升用户簇可解释性;再根据用户在不同项目中表现出不同兴趣偏好的特性,来计算在同一评分项目中不同用户潜在特征之间的相似度,结合用户社会特征并给出新的约束参数,以此减少用户兴趣偏好对推荐效果的影响。最后使用Epinions社交网络数据集将本算法与三种传统算法PMF、So Reg和SVD++进行了对比分析,实验结果显示RSTU算法相较其他算法,在算法性能评测指标RMSE上表现最优,证明了算法在评分预测精确度的性能上得到提升,较好地解决数据集稀疏性问题,提高了推荐效果。(2)针对基于社交网络的推荐方法大多利用了用户之间的信任关系,而忽略了项目之间相似度信息对用户兴趣影响的问题,本章提出了结合用户信任关系和项目间相似度的推荐算法(Recommend System with Trust Relation and Item Similarity,简称RSTI算法)。在算法构造中,首先利用用户熵和改进的Jaccard相似度进行结合得到用户综合相似度,再通过具有共同评分用户项目间的项目局部相似度和全局相似度来共同构成项目综合相似度。将用户综合相似度和项目综合相似度再进一步结合,以此进行推荐,其目的是解决数据稀疏性以及用户冷启动问题,提高评分预测精度。最后利用公开数据集Ciao对RSTI算法与三种传统推荐算法PMF、So Rec和Trust SVD进行对比验证。实验结果显示在评分预测度和用户冷启动问题上,RSTI算法在算法性能评测指标RMSE中表现均较其他算法更优。
基于粒层聚类的协同过滤推荐算法
这是一篇关于粒层聚类,协同过滤,推荐算法,用户相似度,稀疏数据的论文, 主要内容为基于用户的协同过滤推荐通过收集和分析与用户行为相关的历史数据,并基于与其他用户的相似性实现对用户的推荐,而用户的历史行为数据集存在严重的稀疏性,从而降低推荐的准确性。K-means聚类和模糊C-means聚类降低了稀疏数据的影响,但推荐的多样性效果并不明显,将粒层聚类融入协同过滤推荐不仅能解决算法对稀疏数据的敏感,同时也能实现多样性推荐。粒计算是使复杂问题简单化的一种计算工具,通过合适粒度的选择,在不同粒层上求解得到原问题的最优解。用户的相似度作为粒层划分阈值,通过调整阈值实现合适粒度选择,达到全局最优,以此提高推荐的多样性和准确性。具体内容如下:首先,对基于用户属性和基于模型聚类的5种算法进行实验重现,通过数据对比,分析每种算法对数据稀疏的敏感性和数据集大小的敏感性,发现5种算法对于大数据集推荐效果降低。第二,通过数据预处理技术降低协同过滤推荐的数据稀疏性,采用SMOTE技术填充空白数据,提高了推荐的准确性。同时探究时间因子对推荐质量的影响,发现时间因子是否影响推荐效果取决于聚类中心的选取过程。第三,针对推荐系统面临的多样性较差问题,提出覆盖粗糙粒层聚类模型。该模型减弱数据稀疏的影响,通过寻找用户局部粗糙粒集进而得到全局覆盖粗糙粒集,降低数据稀疏导致的局部最优问题,为用户提供精准的多层次、多粒度推荐,从而实现推荐的多样性。将粒计算理论应用于推荐算法,是对推荐模型的优化和创新,通过基准数据集实验测试,证明基于粒计算的推荐模型面向大数据集时,在不降低推荐准确性的同时,实现推荐的多样性。图10幅;表32个;参67篇。
基于用户相似性的推荐算法优化研究与实现
这是一篇关于协同过滤,用户相似度,差异性,用户活跃度,Jaccard系数的论文, 主要内容为随着计算机的迅速发展和网络技术的更迭运行,互联网逐渐进入人们的日常生活,并完全改变了人们访问信息的方式方法。大量的网络信息确实能提供很多价值,但是大多数消费者会被各种各样的选择所困扰,并且这些庞大的信息容易产生“信息过载”的现象,不能被更有效地利用,还会使用户查找相关信息变得越来越难。这个时候推荐系统的地位就突出了,推荐系统(RS)已被证明是有效的电子商务工具,它提供个性化推荐的技术,能够帮助用户选择具有吸引力的产品。到目前为止,推荐系统已经成功在电子商务中找到了应用,例如书籍推荐在amazon.com,电影推荐在 Netflix.com,等等。在众多推荐技术中,协同过滤(CF)是RS中最广泛使用的也是设计最成功的方法,但目前还是存在一定的缺点,如数据稀疏性的问题还在困扰着推荐性能的精确度提升。因此,本文基于传统协同过滤推荐技术,对其出现的问题进行深入研究和分析,主要研究内容如下:(1)本文介绍了协同过滤算法的历史发展历程还有近些年的发展成果,还介绍了相关推荐技术,包括常见的几种推荐算法。分析了目前还存在于推荐系统的几个问题,在数据稀疏的问题基础上改进,提出基于用户评分差异性的信息熵计算方法,通过熵值完成用户间评分差异的比较。(2)为了改善推荐效果,本文提出了融合信息熵的Jaccard加权相似性计算方法,这个方法综合考虑了用户共同评价的项目数量以及用户之间评分的差异性,通过传统的协同过滤推荐算法Jaccard系数与基于信息熵的相似性算法进行线性加权,达到推荐的目的。(3)由于传统的协同过滤推荐算法Jaccard系数只考虑了用户的共同评分数量,而忽略了用户的活跃度对项目评分的影响,本文提出了融合用户活跃度的Jaccard相似度算法,并与基于信息熵的相似性算法进行线性加权,以此提高推荐精度。最后通过在MovieLens等公开数据集上的实验,来验证本文所提出的相似度计算方法是否有效,同时与传统的几个协同过滤推荐算法进行比较。实验的最终结果验证了算法是有效的,综合了共同评分项目、用户活跃性以及用户之间的差异性所得到的算法推荐结果更佳。
基于MMTD和用户的协同过滤推荐算法
这是一篇关于协同过滤,用户相似度,中介真值程度度量,兴趣偏向系数,深度森林,用户分类的论文, 主要内容为随着互联网的迅猛发展,网络上的信息量大幅度增长。信息的生产和消费产生了新的矛盾:生产者难以让自己生产的信息引人关注;消费者难以寻找到自己感兴趣的信息。为解决这一矛盾,推荐算法应运而生。基于邻域的推荐算法是推荐算法领域中应用最广泛的一种,受到学术界的广泛关注和深入研究。基于用户的协同过滤算法作为基于领域的推荐算法的重要组成部分,近年来取得了众多研究成果,但是这些算法在度量用户间的相似性时,都未能合理利用用户的正反馈数据,导致用户间的相似性度量不够准确。针对这一问题,本文将中介真值程度度量(Measure of Medium Truth Degree,MMTD)和兴趣偏向系数引入到协同过滤推荐算法,有效地利用了用户的正反馈数据,提高了用户间相似性度量的准确性。同时,在用户数据量过大时,基于用户的协同过滤算法开销较高。针对这一问题,本文将深度森林和兴趣偏向向量应用到用户分类上,一定程度上实现了降低开销的目标。实验结果表明,本文提出的方法能够有效提高推荐结果的准确率和召回率,具有很高的实用价值。论文首先对中介数学和中介真值程度度量方法进行了介绍,在此基础上对用户相似性度量,用户对物品兴趣度和用户分类进行了深入研究。主要工作如下:(1)针对目前基于用户的协同过滤算法中,未能充分合理利用用户正反馈数据度量用户间相似性的问题,提出了一种结合用户评分和MMTD的方法,并将其应用于传统的余弦相似性和Jaccard相似系数的改进,有效地提升了用户间相似性度量的准确性。(2)为了减轻用户评分主观性对推荐性能的影响,提出了兴趣偏向系数,并将其和用户评分应用于用户对物品兴趣度的度量,有效地提高了推荐结果的准确率和召回率,并且提高了算法的健壮性。(3)针对用户数据量过大时,协同过滤算法开销较高的问题,提出了一种结合兴趣偏向向量和深度森林的方法,实现了对用户的较准确分类,从而降低用户数据量,有效地提高算法的效率。(4)结合本文改进的推荐算法设计并实现了基于Java和SSM框架的电影管理和推荐系统。该系统能够实现用户数据、电影数据和日志数据管理以及热门物品,分类推荐,猜你喜欢三种电影推荐方式,具有很高的实用价值。
基于协同过滤的个性化推荐算法研究及系统实现
这是一篇关于推荐系统,协同过滤,基于用户的协同过滤算法,k-means聚类算法,用户相似度,惩罚因子,推荐系统实现的论文, 主要内容为随着互联网的飞速发展,信息呈现几何级的增长,海量数据问题日趋严重,用户快速获得自己感兴趣的信息变得相当困难。加之移动设备的普及,用户更愿意在移动设备上获取信息。在这样的情况下,个性化推荐系统应运而生。本文在实际需求的驱动下,首先了解推荐系统的理论知识,学习相关推荐算法,然后重点研究了协同过滤推荐算法和k-means聚类算法,并对协同过滤算法进行改进。最后设计和实现了文章推荐子系统。本文做的工作主要有以下几个方面:1.分析了热门对象可能对推荐算法中用户相似度的影响,提出在计算用户相似度时加入惩罚因子,以降低热门对象对用户相似度的影响。通过实验验证,提出的算法的准确率和召回率都有所提高。2.对于协同过滤算法的时间瓶颈及扩展问题,提出了采用聚类算法对协同过滤算法进行改进。在聚类时不单单使用用户的评分信息,而且挖掘了用户评分对象的特征信息,通过这两部分信息为用户偏好进行建模,进而聚类。通过实验验证,改进后的算法的推荐效率与预测准确率都有所提升。在此基础上,综合惩罚因子与用户聚类两种策略来改进基于用户的协同过滤算法。通过实验验证,综合改进比任意的单一改进在推荐效率与推荐质量都要优越。3.根据某公司业务的特定手机应用场景和具体需求,应用提出的协同过滤算法设计并实现了文章推荐子系统。该子系统主要包含用户日志收集与处理模块、用户与推荐对象建模模块、推荐模块和推荐列表展示模块,并且对这四个模块进行设计与实现。
基于粒层聚类的协同过滤推荐算法
这是一篇关于粒层聚类,协同过滤,推荐算法,用户相似度,稀疏数据的论文, 主要内容为基于用户的协同过滤推荐通过收集和分析与用户行为相关的历史数据,并基于与其他用户的相似性实现对用户的推荐,而用户的历史行为数据集存在严重的稀疏性,从而降低推荐的准确性。K-means聚类和模糊C-means聚类降低了稀疏数据的影响,但推荐的多样性效果并不明显,将粒层聚类融入协同过滤推荐不仅能解决算法对稀疏数据的敏感,同时也能实现多样性推荐。粒计算是使复杂问题简单化的一种计算工具,通过合适粒度的选择,在不同粒层上求解得到原问题的最优解。用户的相似度作为粒层划分阈值,通过调整阈值实现合适粒度选择,达到全局最优,以此提高推荐的多样性和准确性。具体内容如下:首先,对基于用户属性和基于模型聚类的5种算法进行实验重现,通过数据对比,分析每种算法对数据稀疏的敏感性和数据集大小的敏感性,发现5种算法对于大数据集推荐效果降低。第二,通过数据预处理技术降低协同过滤推荐的数据稀疏性,采用SMOTE技术填充空白数据,提高了推荐的准确性。同时探究时间因子对推荐质量的影响,发现时间因子是否影响推荐效果取决于聚类中心的选取过程。第三,针对推荐系统面临的多样性较差问题,提出覆盖粗糙粒层聚类模型。该模型减弱数据稀疏的影响,通过寻找用户局部粗糙粒集进而得到全局覆盖粗糙粒集,降低数据稀疏导致的局部最优问题,为用户提供精准的多层次、多粒度推荐,从而实现推荐的多样性。将粒计算理论应用于推荐算法,是对推荐模型的优化和创新,通过基准数据集实验测试,证明基于粒计算的推荐模型面向大数据集时,在不降低推荐准确性的同时,实现推荐的多样性。图10幅;表32个;参67篇。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码项目助手 ,原文地址:https://m.bishedaima.com/lunwen/48222.html