基于神经协同过滤的个性化电影推荐研究与系统设计
这是一篇关于神经协同过滤,用户特征,贝叶斯个性化排序,因子分解机,个性化推荐的论文, 主要内容为随着在线电影数目不断增加,人们开始通过信息过滤以获取有效信息,因此个性化的电影推荐系统成为研究的热点。本课题研究电影推荐,从个性化推荐的算法和应用两个方面展开研究。其中算法以Movie Lens数据集上的“用户-项目”对为基础数据,根据用户是否已选择该电影划分正负样本,并在正样本中划分训练集和测试集,通过对比实验和参数实验等验证提出算法的有效性,同时设计并实现了基于改进的神经协同过滤模型的个性化电影推荐系统。当前协同过滤作为过滤信息的有效方法,虽然被广泛应用,但是该算法的计算过于依赖评分矩阵,而评分矩阵会面临矩阵稀疏和可扩展性等问题。因此本课题引入了神经协同过滤,它对协同过滤算法的优化在于将矩阵分解的过程神经网络化,避免了评分矩阵的生成。神经矩阵分解模型是神经协同过滤的一种具体实现,在该实现的基础之上,本课题提出了改进的模型——融合贝叶斯排序的神经协同过滤模型。该模型引入因子分解机及贝叶斯个性化排序,该结构能进一步捕捉用户特征的非线性信息及优化排序性能。通过实验对比,新模型在命中率和排序性能上对比原算法模型都有一定的提升,并且保持了较快的收敛速度。基于融合贝叶斯排序的神经协同过滤,本课题实现基于该算法的推荐引擎,构建了一个基于B/S架构的个性化电影推荐系统。该系统通过数据库存储完成用户行为搜集—算法计算—返回推荐结果等一系列过程,并且实现了用户个人中心、运营人员页面、电影详情页、系统主页和电影推荐等各项业务功能,提供了神经协同过滤算法的一种系统实现方案。
基于用户特征和项目类型兴趣的协同过滤推荐算法研究
这是一篇关于协同过滤推荐,冷启动,近邻确定,评分预测,用户特征,项目类型的论文, 主要内容为互联网和信息技术的快速发展,带来的是信息量的几何级增长。面对由此带来的“信息过载”问题,根据用户输入的关键词“被动”提供信息检索服务的搜索引擎技术已经无法满足人们的需要了。不同于搜索引擎技术,能够“主动”将用户感兴趣的信息和资源推荐给用户的个性化推荐系统,可以解决这一问题,从而得到了越来越广泛的研究和关注,在电子商务、视频音乐推荐等多个领域都有所应用。其中,协同过滤(collaborative filtering,CF)推荐算法是目前应用最广泛的推荐算法之一,它主要由两部分构成:一是近邻确定部分,通过计算用户历史行为的相似性获取目标用户的近邻用户集合;二是生成推荐部分,根据近邻用户的历史评分预测目标用户可能给出的评分,排序并生成推荐列表。然而,该算法存在一些不足,如:冷启动问题、用户兴趣迁移问题以及仅考虑用户历史评分数据等,这些不足制约了算法的可扩展性和推荐准确性。为了缓解以上问题,本文对协同过滤算法进行了以下研究:首先,本文对协同过滤推荐算法的近邻确定部分做出改进,提出了一种融合用户特征和项目类型兴趣的近邻确定方法。该方法针对系统中全体用户的三类基本特征(年龄、性别、职业),分别计算每类特征下用户对所有项目类型的兴趣分布向量,并利用k-means聚类算法进行聚类,得到基于用户不同特征下的相似子用户群,然后根据目标用户自身的具体特征值判断他在每类特征上的归属簇,并通过三类特征归属簇的交集来获得近邻用户。对于系统新注册用户,可有助于解决新用户冷启动问题;对于老用户,有助于解决可扩展性差的问题,以及单纯利用项目-评分矩阵确定近邻用户所具有的数据稀疏性问题。此外,本文在计算用户对不同项目类型的兴趣度时通过引入时间因子来模拟用户兴趣变化过程,有助于解决用户兴趣迁移问题。其次,本文对协同过滤推荐算法的生成推荐部分进行优化改进,提出了一种融合项目类型偏好评分的评分预测方法。该方法根据经时间因子修正过的用户评分和项目类型信息构建项目类型-评分矩阵,分别计算每个用户对不同项目类型的兴趣度,并以此作为权重计算用户对项目的类型偏好评分,在生成推荐时,用户对未评分项目的总体预测评分由两部分构成,一是传统协同过滤推荐算法中基于近邻用户对项目的历史评分得到的预测评分——近邻预测评分,二是基于用户对项目类型的偏好得到的预测评分——项目类型偏好评分,这样计算得到的对项目的总体预测评分可以同时反映用户对项目的偏好和对项目类型的偏好。最后,以精确率、召回率和F1值作为算法评价标准,将以上两种方法应用到协同过滤算法与Pop-strategy算法、UCRAR算法和PTP-Item-CF算法等相关推荐算法进行实验对比。实验证实:(1)在确定近邻时考虑用户特征属性和项目类型兴趣分布的关系有助于提高近邻用户集的选取质量;同时面对系统新注册用户的冷启动问题,有助于进一步提高推荐准确性。(2)在生成推荐部分考虑目标用户对项目的类型偏好评分能够更好地反映用户偏好,提高推荐质量。
基于新颖度和用户特征的推荐算法优化
这是一篇关于推荐系统,协同过滤,数据稀疏,新颖度,用户特征的论文, 主要内容为随着互联网、云计算、大数据等领域的迅速发展,网络上的数据呈现指数级增长,如何在庞大的数据海洋中寻找出用户感兴趣的内容成为一个难题。个性化推荐系统是解决这些信息过载问题的方法之一。它能根据用户特点和兴趣偏好进行个性化的推荐。协同过滤技术是个性化推荐领域经典的算法之一,协同过滤大多是利用用户的评分数据进行推荐,能够适应各种特定的推荐场景。但它的推荐效果会受到诸如数据稀疏性、冷启动、相似度计算精度差等影响。而且当前研究并未考虑新颖度和用户特征这两个因素对推荐的影响。对此,本研究提出了了两种混合推荐算法,并将新颖度和用户特征这两个因素考虑进去。解决了协同过滤存在的数据稀疏,推荐精度差和新颖性不高的问题,本研究的工作主要如下:(1)对新颖性推荐及利用用户特征等进行推荐的相关知识进行了研究和总结,对推荐领域常见算法原理和求解流程作了说明,阐述了推荐系统当前的研究现状和面对的挑战,为后文的研究提供了理论基础。(2)提出了一种引入新颖度的优化协同过滤算法。该算法对新颖度的计算进行了定义,并将新颖度和Bias SVD算法结合对稀疏评分矩阵进行填充;利用填充后的评分矩阵和用户特征相似度进行最近邻推荐。(3)提出了一种综合用户特征和评分的协同过滤算法。该算法利用文本信息和用户特征信息对最近邻协同过滤算法进行改进。先利用TF-IDF算法为每个电影生成关键词,再利用归一化方法分别生成用户-关键词权重表、性别-关键词权重表、年龄-关键词权重表、职业-关键词权重表。将性别、年龄、职业三个用户特征的权重和用户关键词权重结合得到融合用户特征的用户-关键词权重表。利用此权重表中的数据和用户的评分数据生成融合用户特征的用户-关键词评分表,最后利用融合用户特征的用户-关键词评分数据和改进的杰卡德相似度进行最近邻推荐。通过在公开数据集上反复验证,本文提出的引入新颖度的优化协同过滤算法能够缓解评分稀疏问题,并能得到新颖度更高的推荐,改善了推荐结果单一,用户新鲜感差的局面。本文所提综合用户特征和评分的协同过滤算法充分利用了用户特征信息和文本信息,使得推荐结果更符合用户的真实想法,提高了算法精度。
基于twitter的个性化新闻推荐系统的设计与实现
这是一篇关于新闻推荐,个性化,用户特征的论文, 主要内容为推荐系统能够从海量数据中提取有用的信息推送给用户,解决大数据时代的“信息过载”问题。针对用户难以根据新闻阅读习惯和当前场景需求来获取新闻的问题,提出了基于Twitter的个性化新闻推荐系统。该系统向用户推荐符合用户阅读习惯的个性化的新闻信息。系统采用B/S模式,其主要架构包括数据展示层、数据处理层和数据存储层,其主要功能包括新闻采集功能、用户信息采集功能、数据挖掘功能、新闻推荐功能和用户兴趣特征管理功能。新闻采集功能负责从Twitter中爬取新闻并对新闻进行主题分布计算、热度计算以及数据存储。用户信息采集功能负责获取用户的行为记录及个人资料。数据挖掘功能负责新闻主题建模、用户特征计算和相似用户计算。新闻推荐功能根据用户阅读、点赞、评论过的新闻建立用户特征为用户提供个性化的新闻信息。兴趣特征管理功能负责对主题及词汇标签进行增加或删除,来修改用户特征。设计了个性化新闻推荐系统数据库。个性化新闻推荐系统在新闻采集时需要先对Twitter信息进行BTM主题分类模型建模,然后采用BTM模型对采集的新闻进行主题分布计算及热度计算。在新闻推荐前需要进行用户特征及用户相似度的计算。该个性化新闻推荐系统使用内容和协同过滤的混合式推荐方式,按比例选择用户推荐方案生成推荐结果。用户系统功能测试、性能测试和可用性测试的结果表明该系统能够提供良好的个性化新闻推荐服务。
推荐系统相关技术的研究与应用
这是一篇关于推荐系统,用户特征,相似度计算,深度学习,自编码神经网络的论文, 主要内容为随着4G时代的到来,推荐系统作为大数据时代的产物在电子商务、信息检索以及移动应用、社交网络等众多领域都取得了不错的发展。伴随着这些应用的发展用户和产品数目不断增长,数以亿计的资源信息被产生,数据的规模不断壮大,致使推荐系统面临着前所未有的挑战。主要包括数据稀疏、可扩展性和冷启动等问题,这些问题俨然已成为了影响推荐质量的主要因素,研究者们在学习过程中提出了多种方法来克服这些问题。但是针对形态各异的问题不同的推荐算法存在各自的优劣点。为此本文综合分析了国内外的研究现状,针对推荐系统中的数据稀疏、冷启动、用户特征随时间动态变化及不同用户对同一特征依赖程度不同等问题,分别从改进算法及构造新的数学模型等方面对推荐系统开展了细致地研究,主要工作成果如下:1.提出结合用户特征分类和动态时间的协同过滤推荐。本文主要通过加入用户特征信息及特征动态变化因子来改善协同过滤推荐存在的不足,首先构建特征分类树、并根据用户间相同特征数目引入一种自适应的权重模型改进了计算特征相似度的方法。同时还分析了用户特征动态变化这一因素对推荐结果的影响,通过引入一个包含时间跨度的衰减函数来改善用户特征动态变化问题对推荐精度的限制。最后针对冷启动问题利用sigmoid函数将上述基于用户特征模型与传统协同过滤推荐模型相融合,通过平滑地过渡来灵活地计算用户间相似度。为了突出本文算法的有效性,从推荐结果的准确率、精度及召回率等方面进行了验证。实验结果表征结合用户特征分类和动态时间的协同过滤推荐不但能够提升推荐精度、准确率和召回率,同时对推荐系统面临的冷启动问题也起到了一定的缓解作用。2.提出基于降噪自编码的推荐算法。自编码神经网络隶属于模型的方法,它能够提取数据从低层到高层的特征,发现隐藏在样本间潜在的相关性,为了提高推荐系统的推荐质量将该模型应用于推荐系统。针对原始数据之间的冗余度问题,本文采用ZCA白化技术对原始数据进行转化、去相关。同时为了增强自编码神经网络的鲁棒性,本文还对自编码模型进行了改进,提出了基于降噪自编码的推荐算法,主要是在利用自编码模型进行训练时加入了随机噪声来克服自编码神经网络将输入样本直接复制输出的问题。实验结果表明引入ZAC白化和降噪后的自编码模型能够有效地提高推荐的精度。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码海岸 ,原文地址:https://m.bishedaima.com/lunwen/48999.html