基于Hadoop的电子商务推荐系统研究
这是一篇关于推荐系统,协同过滤,K均值聚类,Slope One,Hadoop,组合推荐,MapReduce的论文, 主要内容为电子商务使我们的生活变得便捷,它迅速发展的同时也产生了大量的数据,如何帮助用户在海量的数据中快速高效地找到有价值的内容便成了一个重要的问题。目前,搜索引擎和信息分类网站都在一定程度上解决了海量数据的搜索问题,但是,这两者是需要用户通过输入关键字或者提供其他相关信息去查找,才能获取到需要的信息。相比之下,推荐系统的出现则更加的主动和智能化,从而在电商网站中起到了越来越重要的作用。它能以相当快的速度在海量数据中进行检索,不需要用户输入关键字等提示信息,主动的向顾客推荐有用的商品,它的智能化方便顾客的同时也为商家提供了很大的帮助。支撑推荐系统正常运行的推荐算法有很多,协同过滤算法是其中运用最广泛的推荐算法。然而,随着电子商务中用户数量和商品数量的高速增长,协同过滤推荐算法也面临新的挑战,比如数据稀疏性问题、可扩展性问题等等。针对这些问题,本课题对协同过滤推荐算法进行了全面深入的研究,并阐述了通过组合推荐算法来解决数据稀疏性问题,进而完成推荐工作。同时,考虑到受单机性能的限制,当面对需要处理海量数据时,必然会对推荐结果的准确性和效率造成严重影响。因此,采用将协同过滤推荐算法迁移部署到Hadoop平台中,对数据进行分布式处理,提高算法的运行效率,解决算法的可扩展性问题,最终达到增加商品销售量的目的。本文主要的研究工作如下:1)对于常用的几种推荐算法进行深入研究分析,全面了解各个算法的优点和缺点,重点研究了协同过滤推荐算法。2)运用组合推荐算法完成数据填充和结果推荐。该组合算法是将K均值聚类算法、Slope One加权改进算法和协同过滤算法(CF)相结合,以此来实现推荐。K均值聚类算法和Slope One加权改进算法用来解决数据稀疏性问题,协同过滤算法(CF)用来在数据相对完整的基础上实现最终的推荐。3)对协同过滤推荐算法进行改进,使其能够适应MapReduce编程模型,进而达到对数据进行分布式处理的目的,以此来解决算法存在的可扩展性问题。4)对单个推荐算法和组合推荐算法进行评测。本课题运用MovieLens数据集中的数据,通过实验,从各个算法的准确率、召回率和反应时间的角度对算法进行了评测,并对实验结果进行分析。
电子商务推荐系统中协调过滤算法的分析与研究
这是一篇关于电子商务,协同过滤,组合推荐的论文, 主要内容为随着互联网和计算机技术的高速发展,用户在结构复杂的电子商务网站中,经常会在大量的商品中迷失,无法寻到自己想要的商品。在这种情况下,电子商务个性化推荐系统就诞生了,个性化推荐系统根据用户的兴趣来过滤信息,并将用户喜欢和关注的信息回馈推荐给用户,帮助用户高效率地发掘对自己有价值的信息,其应用前景广泛,受到学术界和商业的广泛关注。但是目前的个性化推荐技术还远没有成熟,存在着很多亟待解决的问题,例如自身数据稀疏度问题、用户自身兴趣变化等问题。 目前个性化推荐系统中应用最为广泛和最为成功的技术是协同过滤技术,协同过滤的基本思想是:为用户找到喜欢和关注的商品,首先需要找与这个用户行为和口味相近的用户,然后将相近用户喜欢的物品推荐给目标用户。一般采用最近邻居计算方法,利用用户的历史记录来计算之间的相关距离,然后根据最近相邻用户的评分来推测目标用户对这类商品及相似商品的感兴趣程度,使得个性化推荐系统能根据用户的感兴趣程度为用户进行个性化的推荐。 论文对个性化推荐系统进行了深入研究,从各个方面讨论了个性化推荐系统的基本原则、流程以及通用的推荐系统体系结构,并对当前协同过滤个性化推荐技术进行了研究,分析了基于用户的协同过滤算法和基于项目的协同过滤算法的实现,并对传统协同过滤算法中影响推荐质量的问题进行了深入探讨。 论文使用了组合推荐方法对传统协同过滤算法进行改进,并给出了仿真实验。实验表明,传统协同过滤算法在准确性和适应性等方面都远远比不上使用了组合推荐的改进算法,特别是在数据集合非常稀疏的情况下,改进算法体现了优良的性能和普遍的适应性。
基于聚类的社交关系推荐算法研究
这是一篇关于推荐系统,聚类算法,社交关系,Doc2Vec,组合推荐的论文, 主要内容为在信息技术的高速发展的今天,大量碎片化,无规律的信息开始充斥我们的日常生活,作为这些信息的提供者和使用者,人们既希望能够从中获利,得到准确信息数据,但是又希望保护好自己的隐私,不被有心之人所利用,推荐算法作为当前信息过滤的首要选择,针对上述问题的处理方法多种多样,本文提出了基于社交关系的推荐算法,通过利用社交关系自带的相似因子,对于隐性社交关系进行数据分析,挖掘用户间潜在相似关系,既满足用户获取准确信息数据的需求,又避免用户个人隐私泄露的问题,主要研究内容如下:一、提出了基于聚类的社交关系推荐算法(Clustering based Social Relationship Recommendation Algorithm,CBSR),依靠用户评分数据计算出用户社交活跃度,同时使用Canopy算法优化K-means算法聚类中心,再利用加入潜在社交因子修正后的相似度计算得出最终相似用户集合,根据相似用户集合进行评分预测并获得最终推荐结果。二、面对数据源单一问题,提出了融合电影属性和社交关系的组合推荐算法(Combined Recommendation Algorithm combining Movie Attributes and Social Relationship,MASR),先根据电影属性标签信息构建电影物品画像,再将提取出的特征词带入Doc2Vec模型,获取电影标签文档向量数据进行相似度计算,再与基于社交关系计算出的相似度加权聚合得到混合相似度,形成相似电影集合并做出推荐。
基于分布式平台的个性化推荐系统研究
这是一篇关于个性化推荐系统,协同过滤,Hadoop云平台,分布式推荐算法,组合推荐的论文, 主要内容为近年来,发展势头迅猛的互联网行业,极大的促进了社会发展并改善了人们的生活方式。Web的广泛使用和普及,也使得基于Web平台的网络商务交易应用模式变得愈发流行。网络商务的推广应用中最典型的一个问题就是“信息过载”,互联网信息的种类繁多,物品数量庞大,推荐技术是在大量看似散乱无关的数据中分析并提取出用户可能会关注的信息的一种策略,因此如何给予参与者更好、更快速的推荐服务体验显得尤为重要。然而,网络商务交易系统规模的快速增长使得推荐系统的实施也受到了来自许多方面的挑战,其中影响其发展的几个主要问题有:特征提取问题、“冷启动”问题、数据稀疏性问题、算法可扩展性问题等等,本文将致力于解决上述几个推荐难题。在当今的社会背景下,局限于单机性能的推荐系统在面对海量规模的数据的分析和处理业务面前显得力不从心,所以迫切的需要结合云平台处理海量规模数据的并行计算特性,将传统的推荐系统的解决方案改进成适合分布式平台处理的方案才是推荐领域未来的研究发展的态势。文章重点研究和分析了三类常见的推荐技术的核心原理和方法,对比分析了协同过滤推荐模型、Content Based模型和Slope One推荐模型的特性,针对不同的推荐技术中存在的不足之处,提出相应的改进方法。另外从用户特性和物品特性的角度出发,尝试使用组合模型来融合不同推荐技术的优点以求最大程度的优化推荐模型。为了能够高效地处理具有大规模数据量的推荐应用,本文结合Hadoop平台高效的并行计算能力将几种改进的推荐技术实现为分布式推荐算法,并通过仿真实验与国内外相关研究工作的实验结果进行对比,验证本文改进的个性化推荐算法效果比较稳定,相对于传统的推荐算法而言更加高效、精确,同时也具有良好的可扩展性,在模拟推荐服务中有比较理想的结果。在本文最后部分,基于实验结果仿真构建了一个分布式个性化推荐系统,由Web展示层、推荐引擎计算层和数据库存储层三个部分协调工作组成,模拟在线推荐和离线计算过程相分离,使得能够高精度、快速地响应用户需求。
基于聚类的社交关系推荐算法研究
这是一篇关于推荐系统,聚类算法,社交关系,Doc2Vec,组合推荐的论文, 主要内容为在信息技术的高速发展的今天,大量碎片化,无规律的信息开始充斥我们的日常生活,作为这些信息的提供者和使用者,人们既希望能够从中获利,得到准确信息数据,但是又希望保护好自己的隐私,不被有心之人所利用,推荐算法作为当前信息过滤的首要选择,针对上述问题的处理方法多种多样,本文提出了基于社交关系的推荐算法,通过利用社交关系自带的相似因子,对于隐性社交关系进行数据分析,挖掘用户间潜在相似关系,既满足用户获取准确信息数据的需求,又避免用户个人隐私泄露的问题,主要研究内容如下:一、提出了基于聚类的社交关系推荐算法(Clustering based Social Relationship Recommendation Algorithm,CBSR),依靠用户评分数据计算出用户社交活跃度,同时使用Canopy算法优化K-means算法聚类中心,再利用加入潜在社交因子修正后的相似度计算得出最终相似用户集合,根据相似用户集合进行评分预测并获得最终推荐结果。二、面对数据源单一问题,提出了融合电影属性和社交关系的组合推荐算法(Combined Recommendation Algorithm combining Movie Attributes and Social Relationship,MASR),先根据电影属性标签信息构建电影物品画像,再将提取出的特征词带入Doc2Vec模型,获取电影标签文档向量数据进行相似度计算,再与基于社交关系计算出的相似度加权聚合得到混合相似度,形成相似电影集合并做出推荐。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈 ,原文地址:https://m.bishedaima.com/lunwen/49234.html