8篇关于稀疏性的计算机毕业论文

今天分享的是关于稀疏性的8篇计算机毕业论文范文, 如果你的论文涉及到稀疏性等主题,本文能够帮助到你 基于协同过滤推荐系统的数据稀疏性问题研究 这是一篇关于推荐系统,协同过滤

今天分享的是关于稀疏性的8篇计算机毕业论文范文, 如果你的论文涉及到稀疏性等主题,本文能够帮助到你

基于协同过滤推荐系统的数据稀疏性问题研究

这是一篇关于推荐系统,协同过滤,稀疏性,相似性的论文, 主要内容为随着信息技术的迅猛发展和信息资源的不断膨胀,电子商务也随之蓬勃发展,推荐系统被越来越广泛地应用于电子商务的网站中。推荐系统是电子商务个性化服务的重要组成部分,它打破了传统的商业运作模式,扮演着传统商业中销售人员的角色。对于增加商品的销售量,提高顾客的忠诚度等都有较大的贡献。目前协同过滤技术是推荐系统中最为成功的技术之一,并且获得了比较广泛的应用。但是随着用户人数的不断增加和商品本身的因素限制,现有大多数协同过滤算法普遍存在着几点弊端,主要有数据稀疏性问题、系统可扩展性问题、冷启动问题以及同义词问题等。几乎所有的推荐系统中,每个用户涉及的信息量相当有限,而在这些系统中一般用户购买商品的总量却仅占网站所有商品数量的1%甚至更少,因此造成了用户对商品评分的数据非常稀疏。因此,为了提高推荐质量,许多研究人员都试图从不同的角度对用户和商品信息进行分析、处理。 本文首先对推荐系统的基本知识进行详细介绍,接着通过阐述协同过滤推荐系统中的问题引出数据稀疏性问题,总结目前解决数据稀疏性问题的几种方案。然后通过对基于项目和基于用户的协同过滤算法的比较与分析,分别从两个不同的方面针对数据稀疏性问题提出改进算法:其一是对提高算法精度的算法引入项目的属性,加入了基于项目类别的用户偏爱度,针对用户更喜爱的项目类别计算与目标项目的相似性,使得计算项目相似性方面减少计算数据,提高计算速度,计算的准确性更高;其二是对降低数据集稀疏性方法采用Slope One方法预测填充未评分的项目,降低数据集的稀疏性,计算目标项目与其他所有项目的相似性,然后对目标项目进行推荐。对改进算法进行了相似的理论分析,阐述其可行性,给出了改进算法在标准数据集上的实验结果,并对改进算法与原算法进行了相关性能的比较分析。实验表明,改进的算法能够有效缓解数据稀疏性问题,提高推荐系统的推荐质量。

一种基于协同过滤的服务推荐系统研究

这是一篇关于推荐系统,协同过滤,冷启动,稀疏性,用户相似性的论文, 主要内容为互联网的诞生为用户带来了巨大的便利,但同时随着互联网的不断应用,也产生了大量数据信息,进而也对服务提供商在信息海洋中针对用户需求进行信息挖掘、提取、高效提供服务的能力提出了要求。随着这些要求的不断升级,用户在使用过程中便产生了效率低下的问题,也就是所谓的信息超载。为此,研究人员提出了推荐系统的概念,帮助用户完成信息的筛选工作。推荐系统是为了帮助用户筛选信息而设计的,它挖掘用户的潜在需求,过滤掉用户不感兴趣的项目,只为用户推荐他有可能喜欢或者偏爱的项目。推荐系统中使用最多、应用最成功的是协同过滤技术。它通常将一个用户与一群具有相同兴趣爱好的用户群联系起来,然后将该用户群喜欢的项目进行特定推荐。但是,面对数据稀疏性和新用户的冷启动问题时,协同过滤推荐系统也有其无法攻克的难关。针对该问题,论文提出一种将用户属性特征和用户树结构相结合的协同过滤推荐算法,即在相似度计算时首先融入用户的属性特征,包括年龄、性别、职业等,然后构造一种非冗余的项目子空间来展示不同的兴趣模型,并将该模型计算得来的基于用户评分的相似度与用户属性特征相似度按照一定权值相结合,找到目标用户的邻居用户。再根据邻居用户提出一种改进的WABR方法来预测没有评分项目的分值,进而将分值高的前N个项目进行推荐。通过在数据集Movielens上进行对比实验,证实本文提出的算法能够在一定程度上缓解由于缺乏数据导致的数据稀疏问题以及新用户无评分信息带来的冷启动问题,最终使得推荐精度在某种程度上达到提高。

双层优化最近邻的协同过滤算法

这是一篇关于人工免疫系统,遗传算法,协同过滤,稀疏性,扩展性的论文, 主要内容为随着互联网技术的迅猛发展,网络浏览的用户数量和网络平台的资源与日俱增,因此出现了日益严重的信息过载问题。为了让用户在面对多元化的信息时能够快速地做出正确的选择,个性化推荐系统应运而生。协同过滤算法是个性化推荐技术中运用最广泛的一种算法,该算法通过用户和项目之间的交互信息进行建模,然后来衡量用户对项目的喜爱程度。在真实的个性化推荐系统中,普遍存在着数据稀疏和扩展性差等问题,严重影响了推荐系统的性能。而传统的协同过滤算法不能够很好的解决此类问题,因此本文提出了改进的双层优化最近邻的协同过滤推荐算法。首先,在寻找项目的最近邻居时,通过分析时间因素和项目自身类型标签对用户决策的影响,给出动态变化的用户兴趣度作为相似度计算方法,提高了相似性度量精度;其次,提出双层优化算法,通过人工免疫算法和遗传算法对项目最近邻进行双层优化。在最近邻人工免疫系统优化层利用人工免疫系统的快速收敛能力提高算法性能并且通过增殖克隆来优化最近邻抗体以增加算法扩展性;在遗传算法优化层利用交叉、变异和选择算子进一步产生最强抗体(即最佳推荐项目列表)以缓解数据集的稀疏性问题;最后,以Movielens资料集为测试目标来验证本文算法的推荐性能,结果表明该算法降低了传统遗传算法处理数据的时间,推荐效果从MAE和准确率方面优于人工免疫系统模型和遗传算法模型,具有一定的实用性。

基于BiasSVD和集成学习模型的网站评分预测

这是一篇关于评分预测,稀疏性,矩阵分解,集成学习的论文, 主要内容为近年来各种类型的网站不断涌现,人们进入了信息过载时代.为了解决信息过载问题,推荐系统应运而生并且在各大主流网站中得到了广泛的应用.评分预测和Top N推荐是两大推荐任务,本文主要围绕评分预测问题展开研究.评分预测一般存在三大问题:数据稀疏性、冷启动、可扩展性.这些问题的存在导致传统模型的评分预测误差偏高.针对传统模型的各类问题,本文提出一种结合BiasSVD矩阵分解和集成学习模型的解决方法.该方法主要有以下三点创新:(1)结合时间这一最重要的上下文信息.在BiasSVD矩阵分解的基础上将用户偏置项和物品偏置项分别与倒置的Sigmoid曲线、物品流行度与评分关系曲线结合,转化成融入时间的BiasSVD矩阵分解.(2)挖掘用户和物品的潜在关联构造特征.首先对融入时间的BiasSVD矩阵分解学习到的用户隐矩阵和物品隐矩阵的乘积行向量做K-means聚类获取聚类特征,其次从用户偏置项和物品偏置项中分别获取用户兴趣度和物品流行度两个特征,最后以评分作为权重加入到基于图的随机游走算法中获取每个物品的访问概率.(3)将第二点创新中提到的特征作为深层特征,和基础特征如用户性别、用户职业等结合,输入到Light GBM集成学习模型中做出预测.本文提出的解决方法不仅保留了矩阵分解模型不受数据稀疏影响的优点,也充分挖掘了用户和物品的潜在关联并构造出深层特征.此外,使用Light GBM模型将深层特征和基础特征结合,在一定意义上缓解了冷启动问题.实验以平均绝对误差(MAE)和均方根误差(RMSE)作为评价指标,将本文模型与UserCF、ItemCF、FunkSVD、BiasSVD等模型比较.实验结果表明本文模型MAE降低了17%-29%,RMSE降低了16%-27%.

基于用户购物信息的个性化推荐系统的模型和算法研究

这是一篇关于信息过载,协同过滤,平衡参数,MapReduce,稀疏性的论文, 主要内容为随着当前互联网技术的不断发展,现在越来越多的商家都通过互联网来发展自己的网络电子商务平台,随着web 2.0以及“互联网+”的到来,互联网已经成为了人们生活中不可或缺的一部分。因此,当我们使用互联网时,海量的数据信息就呈现在我们面前,随着互联网的不断普及,这一问题也会更加凸显,这就会导致消费者很难在海量的数据中找到符合自己兴趣的商品,对于商家来说也会面临着用户丢失的风险。为了解决信息过载与信息爆炸的问题,个性化推荐系统应运而生,个性化推荐系统通过挖掘用户历史信息或者近邻信息从而计算他们之间的相似度,实现为用户推荐的功能。当前,个性化推荐系统需要考虑的问题主要有以下三点:一是随着用户和项目的增长,如何避免推荐系统的的稀疏性弊端。二是如何高效快速从海量的数据中拆分剥离出那些完整,可靠的用户信息。三是在推荐过程中如何按照时间信息进行相关的推荐推送。为了更好的为用户和商家提供个性化推荐,论文将针对以上所提出三个问题进行研究。首先,论文提出基于平衡参数的协同过滤算法。该算法主要针对传统协同过滤的稀疏性问题,传统算法中,用户评分矩阵往往会产生空值,这样在计算用户相似度的过程中就会导致一些不同兴趣的用户拥有相同的相似度,为此,论文提出来平衡参数来解决这个问题,平衡参数针对用户的属性差异进行计算,每个数据集不同,产生的结果就不同,然后将其与传统的余弦相似度计算法相结合,达到平衡用户相似度的效果。从实验结果来看,该方法缓解了传统协同过滤算法所存在的稀疏性问题。其次,论文对所需处理的数据集搭建数据预处理框架并进行数据处理。在论文的实验中,由于实验所使用数据存在冗余,缺失的问题,为此,我们对于该数据集采用Hadoop集群进行数据的筛选,搭建了三个节点的Hadoop数据处理集群,使用自己所编写的MapReduce程序对数据集中的一些冗余数据进行清理,得到可靠的用户信息。最后,论文提出了基于时间感知标签的推荐算法。该算法主要针对推荐时间不敏感的问题,在用户权重的计算过程中,根据用户所购买的项目时间的不同,采用新型的权重计算法,根据时间选择使用自适用函数来缓解推荐算法时间上的不敏感问题,同时将改进后的协同过滤算法与时间感知的标签模型结合,提出算法的具体步骤。通过实验结果分析,论文算法的精确性,召回率等性能指标上都有了一定提升,并且缓解了推荐时间不敏感的问题。总体而言,论文对个性化推荐系统所存在的三个问题进行了改进,从实验结果来看,改进后的推荐算法的性能和准确性都有了较高的提升。

面向稀疏数据的加权slope one算法改进研究

这是一篇关于加权slope one算法,稀疏性,巴氏系数,矩阵填充,时间因子的论文, 主要内容为随着信息技术不断发展,产生的数据量越来越多,人们如何快速而准确的找到感兴趣的信息变得越来越困难,而推荐系统能有效解决该问题。但是,推荐系统持续发展的同时依然面临许多问题,如数据稀疏性问题、冷启动问题等。本文主要以加权slope one算法为研究基础。加权slope one算法是协同过滤算法的一种,其主要依靠项目评分数值差,采用线性方式进行预测。此方法计算简洁,但是在数据稀疏时效果较差,因此针对加权slope one算法存在的问题以及数据稀疏性问题,本文进行如下研究:(1)加权slope one算法仅仅考虑评分用户数量对结果的影响,并没有考虑用户或项目自身内在联系,因此,本文考虑用户相似度对结果的影响。此外,由于传统相似度计算方式如皮尔逊相关系数、余弦相似度等,在计算相似度时主要依赖用户共同评分,当共同评分很少甚至没有时,此时运用传统相似度计算方式取得的结果较差,因此,本文提出一种融合巴氏系数的加权slope one算法(BCWSOA)。从两方面进行改进:一是利用巴氏系数改进用户相似度,首先使用巴氏系数分析用户相关性计算出全局相似度,再与传统相似度计算方法加权融合,得到最终用户相似度;二是利用巴氏系数优化预测评分公式,用巴氏系数计算项目相似度,并将其作为权重因子优化预测评分公式。(2)针对加权slope one算法中数据稀疏性问题,常用的解决方法有矩阵填充。目前,大多数填充是采用数据的平均数、中位数和众数等方式。虽然可以缓解数据稀疏问题,但是这些填充方法未考虑用户和项目本身特性,未考虑用户评分易受主观性以及环境等其他因素的影响,从而导致用户对项目的评分不准确。由于项目属性是固定不变的,因此,可以根据用户对项目属性的偏好,间接体现用户对项目的喜好,故本文提出一种新的评分矩阵填充方法。首先计算用户对项目属性的偏好值,再联合用户平均评分,最后填充评分矩阵。基于填充后的评分矩阵,又考虑到用户兴趣爱好随时间动态变化,于是引入时间因子变量,故第四章提出一种基于评分矩阵填充和时间因子的加权slope one算法(FTWSOA)。本文算法以加权slope one算法为基准,为验证提出的BCWSOA和FTWSOA两种算法,通过在Movie Lens数据集上实验,结果表明:BCWSOA和FTWSOA两种算法相比于其他算法在MAE和RMSE两个指标上均有更好的效果。

基于知识图谱和证据理论的个性化推荐算法研究

这是一篇关于知识图谱,推荐系统,证据理论,稀疏性,知识抽取的论文, 主要内容为知识图谱被定义为包含多类型节点和多类型边的多关系图,它实际上是一个语义网络的知识库,如今已广泛地应用在证券投资、搜索、自适应教育、大数据风控、聊天机器人、智能医疗、推荐系统等领域中。如何采取有效的辅助信息去改善协同过滤推荐系统的性能成为研究的热点。目前,改善的主要方法有在推荐系统中引入如深度学习、神经网络、知识图谱等辅助信息,相比其他辅助信息,知识图谱不但能够使实体之间具有更加丰富的语义关系,从而能够更深层地挖掘用户的兴趣,而且可以实现不同种类实体的关系连接,有助于去进行推荐结果的发散,因而在信息推荐技术领域有着相当得天独厚的优势,所以在电影推荐、音乐推荐等应用场景中,将知识图谱和证据理论引入推荐算法中,能够取得不错的效果,本文的主要研究内容如下:(1)对知识图谱的构建技术展开了研究,知识抽取技术不但是构建的第一步,而且是知识图谱质量保障的重中之重,因而本文重点研究了知识抽取的相关技术,包括命名实体识别和关系抽取等,经过综合分析,选取综合性能较优的组合模型去进行知识抽取,从而实现知识图谱的构建任务,为后续的研究打下基础。(2)针对协同过滤推荐系统中因数据过于稀缺和几乎没有用户行为数据而导致推荐效果不佳的问题,本文通过相关研究,提出一种基于知识图谱和证据理论的新方法,具体地,首先需要根据构建技术构建电影知识图谱,然后在用户社交网络中进行社区划分,接着,在每一个社区中研究了知识图谱的偏好传播和证据理论建模的灵活性,并将它们结合到一起,使他们具备了各自的优点,以达到对用户和商品的评分矩阵改进的目的,最终可以通过少数已有的用户和商品交互信息,对用户和商品的未交互信息进行预测。(3)根据前面的相关研究,展开实验和分析。首先,由于不同的构建技术存在着质量差异,因而在实验中验证了不同知识抽取技术抽取能力以及知识图谱构建质量的好坏对推荐性能造成的影响;然后,验证了知识图谱的引入与否给推荐性能带来的影响;最后选择基线进行对比实验,通过分析对比验证了改进模型和方法的可行性。

双层优化最近邻的协同过滤算法

这是一篇关于人工免疫系统,遗传算法,协同过滤,稀疏性,扩展性的论文, 主要内容为随着互联网技术的迅猛发展,网络浏览的用户数量和网络平台的资源与日俱增,因此出现了日益严重的信息过载问题。为了让用户在面对多元化的信息时能够快速地做出正确的选择,个性化推荐系统应运而生。协同过滤算法是个性化推荐技术中运用最广泛的一种算法,该算法通过用户和项目之间的交互信息进行建模,然后来衡量用户对项目的喜爱程度。在真实的个性化推荐系统中,普遍存在着数据稀疏和扩展性差等问题,严重影响了推荐系统的性能。而传统的协同过滤算法不能够很好的解决此类问题,因此本文提出了改进的双层优化最近邻的协同过滤推荐算法。首先,在寻找项目的最近邻居时,通过分析时间因素和项目自身类型标签对用户决策的影响,给出动态变化的用户兴趣度作为相似度计算方法,提高了相似性度量精度;其次,提出双层优化算法,通过人工免疫算法和遗传算法对项目最近邻进行双层优化。在最近邻人工免疫系统优化层利用人工免疫系统的快速收敛能力提高算法性能并且通过增殖克隆来优化最近邻抗体以增加算法扩展性;在遗传算法优化层利用交叉、变异和选择算子进一步产生最强抗体(即最佳推荐项目列表)以缓解数据集的稀疏性问题;最后,以Movielens资料集为测试目标来验证本文算法的推荐性能,结果表明该算法降低了传统遗传算法处理数据的时间,推荐效果从MAE和准确率方面优于人工免疫系统模型和遗传算法模型,具有一定的实用性。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码货栈 ,原文地址:https://m.bishedaima.com/lunwen/46916.html

相关推荐

发表回复

登录后才能评论