基于邻域协同过滤推荐算法的研究及应用
这是一篇关于协同过滤,推荐系统,KNN算法,Slope One算法的论文, 主要内容为互联网的快速发展迎来电子商务繁忙时代,同时也衍生出信息过载问题。电影是人们日常生活中比较热门的娱乐休闲项目,如何从海量的电影资源中快速找到用户喜欢的电影并推荐给用户。为了解决这个问题,电影推荐系统应运而生,其核心思想是根据用户的偏好以及观影动作行为,使用算法程序自动的为目标用户推荐其感兴趣的电影信息。在推荐系统中,协同过滤推荐算法技术的应用最为广泛,但是,目前仍存在数据稀疏和噪声数据干扰等问题,使推荐系统的准确度有所下降。为了解决上述存在的问题,本文在前人研究基础上提出了算法改进,将KNN算法和Slope One算法进行优化,提出了基于影响因子的KNN算法和基于KNN邻域的加权Slope One算法,目的是为了提升推荐算法的准确性,并在电影推荐系统中加以实现,具体内容如下:(1)详细阐述推荐系统的研究背景和意义,从推荐系统中推荐算法的角度分别对国内外研究状况进行了介绍,确定了本文主要研究的内容,同时研究了推荐系统的算法及流程,分析协同过滤推荐算法中存在的问题。(2)对于传统的推荐算法中的KNN算法存在的问题,如噪声数据的干扰问题、不同相似度的近邻用户对评分影响作用相同导致的预测准确度下降的问题,提出了一种基于影响因子的KNN改进算法。该算法目的是让最相近用户的评分在最终的评分结果中占据更大的权重,利用MovieLens数据集进行验证,实验结果表明,改进的KNN算法不但能避免噪声数据对预测结果的影响,还能提高KNN算法预测评分的准确度。(3)对于Slope One算法中存在的相似度极低削弱高相似度的作用效果问题,提出了一种基于KNN邻域的Slope One改进算法。该算法首先从目标用户中发现相似度高的K个用户开始,然后根据这些K个用户的评分来计算目标项目对其它项目的偏差大小,通过引入偏差来预测目标用户对该项目的评分。实验结果表明,基于KNN邻域的Slope One改进算法能够使用少量但质量高的评分去预测评分,不但在一定程度上改善协同过滤中存在的数据稀疏性问题,还可以提高Slope One算法中预测评分的准确度。(4)根据目前资讯类电影网站的不足,设计并实现基于以上改进算法的电影推荐系统,该系统具备电影的发布、删除、修改、查询和推荐等功能,不仅能够查看电影同时能分析用户的兴趣偏好,形成准确的推荐列表,提升用户体验,从根本上解决传统电影资讯网站的弊端。
基于非负矩阵分解的个性化物流配送服务推荐研究
这是一篇关于非负矩阵分解,物流配送服务,个性化推荐,Slope One算法的论文, 主要内容为随着“互联网+物流”的不断发展,第三方物流配送服务成为大部分中小企业降低物流配送成本、提高物流配送服务质量的最佳选择。为打破物流服务资源供需方之间存在的信息壁垒,我国相关政府部门和企业投资建设了一批物流信息服务平台。平台作为中小企业选择第三方物流配送服务的途径之一,能在一定程度上促进物流配送服务资源整合与信息共享,提高物流配送效率。但是,在服务资源供需双方聚集的物流信息服务平台上,物流配送服务数量众多且实际质量未知,不同客户对服务的时效、安全等属性的偏好也存在差异。因此,对物流配送服务有着个性化需求的中小企业客户难以高效地选择满足自身需求的服务,从而导致用户满意度不高。基于物流信息服务平台的推荐系统,主动地向中小企业推荐满足其个性化需求且质量较优的物流配送服务是解决上述问题的有效方法。为此,本文研究能充分挖掘用户个性化需求的物流配送服务推荐方法,其主要通过构建个性化物流配送服务推荐模型并给出求解模型的混合式推荐算法(MLEW)。首先对服务各个属性的评分数据进行预处理,获得相应的评分矩阵。其次,针对评分矩阵高度稀疏的问题,提出基于投影非负矩阵分解的特征提取方法,并给出其迭代算法,得到包含用户偏好信息的系数矩阵,进而得到用户相似度矩阵,并基于用户相似度矩阵寻找目标用户的相似用户集合;然后,基于获得的相似用户集合,利用加权Slope One算法预测目标用户对服务各个属性的初始评分值,再使用信息熵对初始值进行修正;最后,将修正后的用户对各个属性的评分预测值进行加权求和,得到最终的综合评分预测值,并根据综合评分预测结果按TOP-N推荐方式进行结果推荐。本文最后基于阿里巴巴物流服务平台的真实物流配送服务信息生成的用户评分数据集进行数值实验。实验主要分为MLEW算法的性能分析和模型的预测结果分析。实验结果表明,在本文的数据集上,MLEW比WSO算法的准确率和召回率分别高出4.31%和3.1%,比LEW算法的准确率和召回率分别高出1.89%和2.85%。此外,根据评分预测结果测试用户满意度,结果表明,用户的满意度可比使用MLEW算法推荐前高9%。因此,本文提出的个性化推荐方法可有效地提高用户满意度,进而促进平台与服务资源供需双方的良性循环发展。
基于Slope One的个性化推荐算法研究及应用——以电子商务平台为例
这是一篇关于Slope One算法,个性化推荐,产品相似度,马太效应的论文, 主要内容为随着互联网信息技术的蓬勃发展,海量的产品与信息可供使用者选择,但与此同时,各大平台信息过载的问题也日益严重,这导致线上使用者不能快速有效地获取自己喜欢的产品。推荐系统正好可以解决这一困扰,推荐系统可以对大量使用者的信息进行收集与整理分析,发现使用者的兴趣喜好,主动为使用者推荐产品,让使用者获得更为智能化和人性化的体验与服务。由于推荐系统实际应用需求巨大,促进各类推荐算法不断地推陈出新,推荐算法成为了国内外研究人员的研究热点。Slope One算法作为一种经典的协同过滤推荐算法,普遍地应用在各种网站,但也存在不足之处亟待改进。因此,本论文结合已有的研究和当前推荐系统常见的问题,针对Slope One算法在数据稀疏性、可扩展性、马太效应、时间因素等方面做出优化改进。主要的研究内容包括:(1)对原始的打分矩阵乘上产品流行度权重进行预处理,以此缓解网站推荐过程中常出现的马太效应;(2)由于传统Slope One算法没有考虑到使用者相似性和产品相似性,本文融入适合稀疏数据的使用者相似度和产品相似度到Weighted Sl(?)e算法;(3)考虑使用者兴趣会随时间变化的因素,将时间权重融入到Weighted Slope One算法的预测打分;(4)为提高算法的可拓展性,本文(?)K-Means Plus聚类算法对使用者进行聚类,将相似使用者归类可以大大减少(?)索近邻相似使用者的计算量。最后使用著名电子商务平台亚马逊的打分数据集验证改进后算法的性能。实验证明,改进后的算法相对于原始的Slope One算法和Weighted Slope One算法对客户的预测打分准确度更高,推荐效果更优。
融合时间效应和用户属性的推荐算法研究
这是一篇关于协同过滤,用户属性,Slope One算法,时间上下文信息的论文, 主要内容为在网络信息科技飞速发展的同时,网络上的信息实现了跨越式的增长。用户在海量信息里获取有用的信息需要花费大量的时间成本,如何给用户筛选符合其兴趣爱好的内容也成为了各大软件和网站急需解决的问题。随着推荐系统的快速发展,新的推荐算法不断被提出并研究,其中作为传统算法的协同过滤算法虽然被很多学者研究,但其仍存在不足。协同过滤算法都只考虑了用户-评分或项目-评分的信息,考虑角度单一,且用户行为数据过于稀疏。没有考虑到用户信息对推荐效果的影响以及用户的兴趣随着时间的变化情况。针对上述提到的问题,本文做了以下工作:一.传统的相似度只考虑了用户项目评分信息降低了用户相似度的准确性,因此将用户属性信息引入到用户相似度中作为综合用户相似度,并将其引入到加权Slope One算法中来计算出项目Dev从而预测项目评分,缓解数据的稠密度问题,提高算法的准确性。二.针对协同过滤算法考虑角度单一的问题,本文引入时间因素,考虑时间效应对用户兴趣的影响。通过艾宾浩斯遗忘曲线来计算用户在时间因素下的相似度,根据改进的用户相似度和相似度支持度进行预测评分。最后将两种算法进行融合,解决了单一算法存在的问题即Slope One算法两种项目无共同评分不可预测的缺点,改进了单一算法的局限性并提升预测的准确性。最后本文将算法应用到Movielens数据集上来验证融合时间效应和用户属性算法的有效性,通过实验对比分析改进后的算法在MAE和RMSE值上有较好的结果,提升了推荐性能。
基于Hadoop的图书推荐系统研究
这是一篇关于Hadoop,图书推荐,Slope One算法,模糊聚类的论文, 主要内容为在电子图书领域,存在着大量的用户对其看过的书籍的借阅及评分等信息,那么如何从这么多的信息中挖掘出读者的读书偏好,对用户提供个性化的推荐,对于提升用户的体验至为重要。另外,随着用户、图书量及其数据处理量的不断增多,可扩展性的问题成为了限制推荐系统发展的一个瓶颈,而将Hadoop分布式大数据处理平台运用到推荐系统上可以有效地解决这个问题。论文首先对应用较为广泛的推荐算法、Canopy算法、模糊c均值聚类算法等进行了总结分析,详细说明了大数据平台Hadoop中主要的组成部分HDFS(分布式文件存储系统)、MapReduce分布式处理框架和Sqoop的工作原理,并结合推荐系统的通用模型,设计了一个基于Hadoop的推荐系统架构,详细介绍了系统中每个模块的设计思想。其次,论文对Slope One算法进行深入分析,提出了基于聚类的Slope One推荐算法:先对用户进行模糊聚类,再计算出目标用户归属度大于某个阈值的类,再在这些最近邻类中找到top-k项最近邻用户,计算出目标用户与这些最近邻居用户之间的相似程度,并且以此作为项目之间评分差值的权重。考虑到用户兴趣随时间的变化,采用改进的时间衰减函数对项目评分值进行加权处理,以此来反映用户兴趣随时间的变化。而为了避免模糊聚类算法对初始聚类中心和聚类数目选取的盲目性,利用Canopy算法对其进行优化。同时,在Hadoop平台上实现了改进算法的MapReduce并行化处理。之后,在Hadoop集群上利用豆瓣用户-图书评分数据集对改进的推荐算法的性能进行测试分析,从实验结果中可以看出来,改进的算法的准确度要比传统的Slope One算法有明显的提高,另外,还比较了分布式环境下和单机模式下的算法性能,分布式下的推荐算法执行苏速率更高,从而,说明了改进算法的有效性和高效性。最后,实现了改进Slope One的算法,并对图书推荐的结果进行展示。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设货栈 ,原文地址:https://m.bishedaima.com/lunwen/49222.html