基于用户相似性的推荐算法优化研究与实现
这是一篇关于协同过滤,用户相似度,差异性,用户活跃度,Jaccard系数的论文, 主要内容为随着计算机的迅速发展和网络技术的更迭运行,互联网逐渐进入人们的日常生活,并完全改变了人们访问信息的方式方法。大量的网络信息确实能提供很多价值,但是大多数消费者会被各种各样的选择所困扰,并且这些庞大的信息容易产生“信息过载”的现象,不能被更有效地利用,还会使用户查找相关信息变得越来越难。这个时候推荐系统的地位就突出了,推荐系统(RS)已被证明是有效的电子商务工具,它提供个性化推荐的技术,能够帮助用户选择具有吸引力的产品。到目前为止,推荐系统已经成功在电子商务中找到了应用,例如书籍推荐在amazon.com,电影推荐在 Netflix.com,等等。在众多推荐技术中,协同过滤(CF)是RS中最广泛使用的也是设计最成功的方法,但目前还是存在一定的缺点,如数据稀疏性的问题还在困扰着推荐性能的精确度提升。因此,本文基于传统协同过滤推荐技术,对其出现的问题进行深入研究和分析,主要研究内容如下:(1)本文介绍了协同过滤算法的历史发展历程还有近些年的发展成果,还介绍了相关推荐技术,包括常见的几种推荐算法。分析了目前还存在于推荐系统的几个问题,在数据稀疏的问题基础上改进,提出基于用户评分差异性的信息熵计算方法,通过熵值完成用户间评分差异的比较。(2)为了改善推荐效果,本文提出了融合信息熵的Jaccard加权相似性计算方法,这个方法综合考虑了用户共同评价的项目数量以及用户之间评分的差异性,通过传统的协同过滤推荐算法Jaccard系数与基于信息熵的相似性算法进行线性加权,达到推荐的目的。(3)由于传统的协同过滤推荐算法Jaccard系数只考虑了用户的共同评分数量,而忽略了用户的活跃度对项目评分的影响,本文提出了融合用户活跃度的Jaccard相似度算法,并与基于信息熵的相似性算法进行线性加权,以此提高推荐精度。最后通过在MovieLens等公开数据集上的实验,来验证本文所提出的相似度计算方法是否有效,同时与传统的几个协同过滤推荐算法进行比较。实验的最终结果验证了算法是有效的,综合了共同评分项目、用户活跃性以及用户之间的差异性所得到的算法推荐结果更佳。
基于用户相似性的推荐算法优化研究与实现
这是一篇关于协同过滤,用户相似度,差异性,用户活跃度,Jaccard系数的论文, 主要内容为随着计算机的迅速发展和网络技术的更迭运行,互联网逐渐进入人们的日常生活,并完全改变了人们访问信息的方式方法。大量的网络信息确实能提供很多价值,但是大多数消费者会被各种各样的选择所困扰,并且这些庞大的信息容易产生“信息过载”的现象,不能被更有效地利用,还会使用户查找相关信息变得越来越难。这个时候推荐系统的地位就突出了,推荐系统(RS)已被证明是有效的电子商务工具,它提供个性化推荐的技术,能够帮助用户选择具有吸引力的产品。到目前为止,推荐系统已经成功在电子商务中找到了应用,例如书籍推荐在amazon.com,电影推荐在 Netflix.com,等等。在众多推荐技术中,协同过滤(CF)是RS中最广泛使用的也是设计最成功的方法,但目前还是存在一定的缺点,如数据稀疏性的问题还在困扰着推荐性能的精确度提升。因此,本文基于传统协同过滤推荐技术,对其出现的问题进行深入研究和分析,主要研究内容如下:(1)本文介绍了协同过滤算法的历史发展历程还有近些年的发展成果,还介绍了相关推荐技术,包括常见的几种推荐算法。分析了目前还存在于推荐系统的几个问题,在数据稀疏的问题基础上改进,提出基于用户评分差异性的信息熵计算方法,通过熵值完成用户间评分差异的比较。(2)为了改善推荐效果,本文提出了融合信息熵的Jaccard加权相似性计算方法,这个方法综合考虑了用户共同评价的项目数量以及用户之间评分的差异性,通过传统的协同过滤推荐算法Jaccard系数与基于信息熵的相似性算法进行线性加权,达到推荐的目的。(3)由于传统的协同过滤推荐算法Jaccard系数只考虑了用户的共同评分数量,而忽略了用户的活跃度对项目评分的影响,本文提出了融合用户活跃度的Jaccard相似度算法,并与基于信息熵的相似性算法进行线性加权,以此提高推荐精度。最后通过在MovieLens等公开数据集上的实验,来验证本文所提出的相似度计算方法是否有效,同时与传统的几个协同过滤推荐算法进行比较。实验的最终结果验证了算法是有效的,综合了共同评分项目、用户活跃性以及用户之间的差异性所得到的算法推荐结果更佳。
基于混合的物质扩散和热传导的推荐算法的研究和实现
这是一篇关于推荐系统,物质扩散,热传导,用户活跃度的论文, 主要内容为不同推荐算法对数据的内容或形式要求也不一样,比如基于内容的推荐,重点在于对用户或商品进行标签属性分类,属性越多,标签粒度越细越准确;基于关联规则的推荐,重点在于挖掘商品之间的关联规则,而规则的挖掘比较棘手,商品种类和交易量不足更是生成规则的困境;基于协同过滤的推荐关注点在于用户社交网络或其他联系,对于系统中相对独立的用户,则该方法往往无能为力。因此当用户和商品的属性标签较少、用户与商品的互动信息不够多以及用户之间的社交关系缺少或者不公开时,现行使用较多的推荐系统难以达成有效推荐。基于二部图的物质扩散(Mass Diffusion,MD)和热传导(Heat Conduction,HC)推荐算法是物理学与计算机学交叉研究成果,二者对用户数据的依赖性不高,仅需确定用户与商品之间的购买关系,能有效避免冷启动和数据稀疏性问题。然后依据扩散的原理,计算各商品的购买概率。MD算法在推荐准确性上比较突出,而HC算法优于推荐新颖性。二者有相同的理论基础,故本文提出一种混合的物质扩散和热传导推荐方案,该方案在研究用户活跃度与商品准确性和多样性之间的存在相互关系的基础上,将用户活跃度作为混合的权值参数,基于用户特点定义了用户活跃度计算方法,即通过分析用户的消费记录计算用户活跃度。该方案指出当用户活跃度高时,强调推荐的多样性,混合方案偏向于热传导推荐结果,反之则偏向于物质扩散推荐结果。测试结果和消费分析的结果表明,该方法符合预期的完成商品推荐需求,同时增加用户的黏性,提高用户的活跃度,达到设计目标。
基于用户相似性的推荐算法优化研究与实现
这是一篇关于协同过滤,用户相似度,差异性,用户活跃度,Jaccard系数的论文, 主要内容为随着计算机的迅速发展和网络技术的更迭运行,互联网逐渐进入人们的日常生活,并完全改变了人们访问信息的方式方法。大量的网络信息确实能提供很多价值,但是大多数消费者会被各种各样的选择所困扰,并且这些庞大的信息容易产生“信息过载”的现象,不能被更有效地利用,还会使用户查找相关信息变得越来越难。这个时候推荐系统的地位就突出了,推荐系统(RS)已被证明是有效的电子商务工具,它提供个性化推荐的技术,能够帮助用户选择具有吸引力的产品。到目前为止,推荐系统已经成功在电子商务中找到了应用,例如书籍推荐在amazon.com,电影推荐在 Netflix.com,等等。在众多推荐技术中,协同过滤(CF)是RS中最广泛使用的也是设计最成功的方法,但目前还是存在一定的缺点,如数据稀疏性的问题还在困扰着推荐性能的精确度提升。因此,本文基于传统协同过滤推荐技术,对其出现的问题进行深入研究和分析,主要研究内容如下:(1)本文介绍了协同过滤算法的历史发展历程还有近些年的发展成果,还介绍了相关推荐技术,包括常见的几种推荐算法。分析了目前还存在于推荐系统的几个问题,在数据稀疏的问题基础上改进,提出基于用户评分差异性的信息熵计算方法,通过熵值完成用户间评分差异的比较。(2)为了改善推荐效果,本文提出了融合信息熵的Jaccard加权相似性计算方法,这个方法综合考虑了用户共同评价的项目数量以及用户之间评分的差异性,通过传统的协同过滤推荐算法Jaccard系数与基于信息熵的相似性算法进行线性加权,达到推荐的目的。(3)由于传统的协同过滤推荐算法Jaccard系数只考虑了用户的共同评分数量,而忽略了用户的活跃度对项目评分的影响,本文提出了融合用户活跃度的Jaccard相似度算法,并与基于信息熵的相似性算法进行线性加权,以此提高推荐精度。最后通过在MovieLens等公开数据集上的实验,来验证本文所提出的相似度计算方法是否有效,同时与传统的几个协同过滤推荐算法进行比较。实验的最终结果验证了算法是有效的,综合了共同评分项目、用户活跃性以及用户之间的差异性所得到的算法推荐结果更佳。
基于混合的物质扩散和热传导的推荐算法的研究和实现
这是一篇关于推荐系统,物质扩散,热传导,用户活跃度的论文, 主要内容为不同推荐算法对数据的内容或形式要求也不一样,比如基于内容的推荐,重点在于对用户或商品进行标签属性分类,属性越多,标签粒度越细越准确;基于关联规则的推荐,重点在于挖掘商品之间的关联规则,而规则的挖掘比较棘手,商品种类和交易量不足更是生成规则的困境;基于协同过滤的推荐关注点在于用户社交网络或其他联系,对于系统中相对独立的用户,则该方法往往无能为力。因此当用户和商品的属性标签较少、用户与商品的互动信息不够多以及用户之间的社交关系缺少或者不公开时,现行使用较多的推荐系统难以达成有效推荐。基于二部图的物质扩散(Mass Diffusion,MD)和热传导(Heat Conduction,HC)推荐算法是物理学与计算机学交叉研究成果,二者对用户数据的依赖性不高,仅需确定用户与商品之间的购买关系,能有效避免冷启动和数据稀疏性问题。然后依据扩散的原理,计算各商品的购买概率。MD算法在推荐准确性上比较突出,而HC算法优于推荐新颖性。二者有相同的理论基础,故本文提出一种混合的物质扩散和热传导推荐方案,该方案在研究用户活跃度与商品准确性和多样性之间的存在相互关系的基础上,将用户活跃度作为混合的权值参数,基于用户特点定义了用户活跃度计算方法,即通过分析用户的消费记录计算用户活跃度。该方案指出当用户活跃度高时,强调推荐的多样性,混合方案偏向于热传导推荐结果,反之则偏向于物质扩散推荐结果。测试结果和消费分析的结果表明,该方法符合预期的完成商品推荐需求,同时增加用户的黏性,提高用户的活跃度,达到设计目标。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码客栈 ,原文地址:https://m.bishedaima.com/lunwen/55719.html