基于移动用户观影记录的推荐系统研究
这是一篇关于移动观影,评分预测,推荐系统,注意力机制的论文, 主要内容为随着移动设备的广泛使用以及视频网站资源的海量增长,移动端观影越来越流行。移动设备观看影片具有受时间、地点影响小,成本低等优点,但是爆炸式增长的影片资源使得用户难以快速做出有效、准确的观影选择。因此,建立个性化视频推荐系统给予用户优质的观影服务是提高用户的满意度和视频网站的收入的关键。针对上述问题,本文基于运营商提供的用户观影记录和网络影片内容信息对于用户移动观影行为进行研究,取得以下创新性成果:提出一种基于影片客观信息的电影评分类别预测方法。利用知识图谱和自然语言处理领域方法处理影片结构化信息和简介信息,并使用深度神经网络自动学习信息向量特征构建评分类别预测模型。在电影评分三分类预测问题上取得62.1%的准确率和63.9%的F1-micro值,性能优于未改进的Trans R方法和单一信息源模型。最后该模型成功实现“新影片”的评分预测,有效解决新影片评分“冷启动”问题。提出一种结合用户观影记录和影片内容信息的混合推荐模型。该模型在传统协同过滤方法的基础上,加入了影片结构化信息、影片简介信息和影片评论信息等辅助信息,并且利用注意力机制处理不同用户评论。上述信息特征由神经网络自动学习,无需手动特征技术。在用户移动端观影数据集上,该模型HR@10值达到0.564,MRR达到0.307,推荐影片覆盖率达到0.665,性能优于6种传统推荐方法和模型。实验结果表明,结合用户观影记录和影片内容信息能有效提升模型影片推荐性能并缓解“长尾”影片推荐问题。
基于文本评论的推荐算法研究
这是一篇关于推荐算法,神经网络,用户评论,评分预测,注意力机制的论文, 主要内容为互联网带来的海量信息问题,非常容易导致用户迷失在信息中无法找到自己想要的内容。推荐系统正是解决信息过载问题的利器,但是传统的推荐方法往往会面临数据稀疏和冷启动等问题,导致推荐的精度降低。评论中包含了很多丰富且有价值的信息,如何能够更全面地从文本评论中挖掘出物品的特征和用户的兴趣偏好,缓解数据稀疏和冷启动问题,从而实现更加精准的推荐,成为了研究的热点。针对这些问题本文主要的研究内容如下:第一,针对传统推荐方法中存在的数据稀疏性问题,本文提出了一种新颖的神经网络推荐模型,该模型可以通过用户评论来推荐物品。利用用户和物品各自的评论分别代表每个用户和物品,并将推荐问题视为文本匹配问题。为此,采用了CNN体系结构和回归网络来预测用户-物品对的匹配得分,以此来表示用户对物品的评分。实验结果表明,本章提出的模型优于基于评论的Deep Co NN等神经网络推荐模型,能够一定程度上缓解数据稀疏性问题。第二,针对物品冷启动问题,本文提出了一种联合深度推荐模型,该模型由两个并行的神经网络组成,分别学习用户和物品的低阶特征交互。每个网络进一步由两个子网组成。其中一个子网络用于利用用户和物品的评论,另一个子网络用于利用元数据信息和评分来学习用户偏好和物品属性。将每个网络中学习到的潜在特征进行拼接,从而生成用户和物品的潜在特征向量。通过在顶部引入一个共享层把两个网络结合起来,用来学习从这两个网络获得的更高级别的潜在特征并产生最终评分。实验结果表明,与已有的一些推荐模型相比,该模型的预测性能更好,一定程度上缓解了物品冷启动问题。第三,传统的推荐方法是基于静态向量对用户物品的潜在特征进行独立建模的,没有考虑用户物品交互的动态特性,这可能会影响推荐过程的准确性。针对这个问题,本文提出了一种基于多层次注意力机制的推荐模型。该模型利用神经网络注意力机制,联合考虑了用户-物品对的细粒度语义信息,利用基于评论的特定交互特征,学习异构的用户物品表示。使用真实数据集进行了实验,结果表明该模型在评分预测和排名性能方面都优于基线方法。
基于评分预测的个性化推荐算法优化
这是一篇关于推荐系统,协同过滤,相似度计算,评分预测,隐式反馈的论文, 主要内容为近年来,随着网络发展的多元化,信息过载问题日益严重。分类目录和搜索引擎是早期出现的解决信息过载问题的两类主流方案。但是随着互联网规模的不断扩大,分类目录网站只能覆盖有限的热门网站,而搜索引擎则需要用户主动提供关键词来寻找信息,在用户不清楚自己需求的情况下具有很大的局限性。这时,个性化推荐技术应运而生。个性化推荐技术可以分析和挖掘用户潜在偏好,是解决大数据时代信息冗余问题、提高人们信息获取的效率和质量的重要手段。本项研究工作研究了基于评分预测的个性化推荐算法,并从基于邻域和基于学习两个方面进行算法的优化。这里的“评分”指广义的评分,即用户对物品的偏好分值,不只是狭义的用户打分。实验结果表明,对比优化前的算法,本项研究工作实现了更高精度和鲁棒性的个性化推荐。本论文的研究内容和贡献包括以下方面:1.在基于邻域的评分预测推荐中,针对传统的基于用户的推荐算法中存在的不足,如忽略用户评分归一化的必要性、以及用户相似度计算中加权用户属性而导致推荐不准确等问题,本项研究工作以用户相似度计算的改进为中心,进行用户评分归一化、用户评分的Jaccard相似性计算方法改进、加入用户属性相似度,并与用户评分相似度线性结合,最终提出了一个优化的基于用户的协同过滤推荐算法O-recommend。并通过实验,验证了用户综合相似度计算中用户评分归一化和评分相似度计算方法优化以及加权用户属性三点改进的必要性,并证明改进算法提高了推荐精度。2.在基于学习的评分预测推荐中,针对传统推荐算法主要基于显式反馈信息,即用户对商品的独立选择进行预测的方法中存在的不足,本项研究工作提出了一种基于多类型隐式反馈的推荐系统MIF,将商品对而非单个商品作为用户兴趣建模的基础,引入商品比较信息这一重要的隐式反馈信息,基于贝叶斯的排序模型来建模商品间的比较关系,并对不同类型的隐式比较行为赋予不同的置信度,最后通过实验验证了改进算法的有效性。
基于小样本数据的推荐方法研究
这是一篇关于小样本学习,推荐系统,评分预测,数据增扩,原型网络的论文, 主要内容为推荐系统通过分析用户的兴趣爱好,从互联网的海量信息中挖掘用户可能感兴趣或需要的信息资源或物品,从而为用户做出相应的推荐。目前主流推荐方法对于数据密集型任务有很好的推荐效果,但在某些实际场景中,因收集成本较高等原因而难以获得足够的数据,不充足的样本易导致过拟合、模型表达能力不足等问题,进而影响推荐效果。因此,需要研究基于小样本数据的推荐方法以缓解数据有效样本不足的问题。目前小样本学习已用于解决机器学习领域中模型因样本不足而无法得到充分训练的问题,在目标检测、命名实体识别、文本分类等多种任务中取得较大进展。在推荐领域中,尽管数据样本不足的问题存在已久,但还没有成熟的解决方案。在数据样本不足的场景下,其研究面临以下三个挑战:(1)正样本数量不足。庞大的物品、用户数量和极其有限的正样本数量将导致推荐系统中典型的数据稀疏问题,甚至导致用户或者物品冷启动问题;(2)信息量不够导致特征表示不准确。样本信息量不够导致特征提取不充分,如何从数量有限的样本中提取具有强表达能力的特征是一大挑战;(3)过拟合问题。基于小样本数据训练的机器学习或深度学习模型容易因正样本数量不足和信息量不够陷入对小样本的过拟合,导致对新样本的推荐能力下降。针对上述挑战,本文从数据量不足和信息量不够两个主要角度进行研究,解决模型训练时的过拟合问题,缓解小样本数据对推荐效果带来的负面影响。一是针对数据量不足的问题,本文以Web服务推荐中Qo S预测问题为研究对象,提出利用现有稀疏数据增扩训练数据集,通过算法生成伪数据来扩充原始数据集,从而缓解数据稀疏性问题;二是针对信息量不够的问题,本文以电子商务商品推荐问题中的商品评分预测任务作为研究对象,利用商品的评论文本作为信息补充,提出一个增强的原型网络模型,实现训练场景和测试场景的匹配,设计特征编码器提取强表达特征,解决极少样本情况下的模型训练问题。本文的研究工作主要包括以下3点贡献:(1)提出了一种基于数据增扩的推荐方法。为了缓解服务推荐中数据量不足的问题,本文使用现有稀疏数据来增扩训练数据集,从而增加数据密度,提高模型预测的准确性。该方法包括两个主要步骤:首先,使用基于欧式距离的相似度度量的方法选择出近邻用户,并将近邻数据增加到原始数据集中;然后,基于增扩后的数据集对模型进行训练来实现服务推荐,该方法中使用的模型可以任何基于神经网络的推荐模型,本工作中推荐使用神经协同过滤模型。(2)提出了一种基于评论文本原型网络建模的推荐方法。针对小样本环境下信息量不足的问题,本文提出将商品的评论文本作为补充信息,利用原型网络和自然语言分析的方法,在用户交互商品数量不足的场景下提高推荐准确性。具体来说,首先,将用户对商品的评论数据随即划分为支持集和查询集;其次,将支持集中的评论信息特征进行聚合并获得一个聚合中心;接着,查询集中的评论信息特征与聚合中心进行比较,通过优化模型使得两者距离缩小。训练完成后,模型根据用户现有的评论和待评价的物品的特征预测推荐评分。该方法的核心之处在于使训练场景和测试场景保持一致,利用评论补充信息,解决极少样本情况下的模型训练问题,来达到更好的预测性能。(3)本文的基于数据增扩的推荐方法在当前学术界广泛使用的Qo S公开数据集WSDream上进行了实验,在多种不同的稀疏度上与现有主流的Qo S预测方法进行了性能对比。本文的基于评论文本原型网络建模的推荐方法在Amazon和Yelp评论数据集上进行了实验,与现有主流推荐方法进行了性能对比,并对多个参数进行了分析。两个部分的实验分别从数据量不足和信息量不够两个角度验证了本文所提出的推荐方法能在一定程度上缓解数据样本不足的问题,并具有更好的推荐准确度。综上,针对小样本场景下的推荐问题,提出了一种数据增扩方法和一种基于评论文本原型网络建模的推荐方法,两种推荐方法从两个不同的角度去缓解推荐过程中数据样本不足的问题,达到提高模型推荐准确度的目的,最后通过实验验证了所提方法的有效性。
基于云模型的推荐系统评分预测算法应用与研究
这是一篇关于用户行为,推荐系统,评分预测,云模型的论文, 主要内容为随着信息时代的高速发展,近年来,海量的用户行为数据创造了巨大的财富,分析用户的行为也成为最有价值的研究之一。在电子商务以及互联网中,推荐系统旨在帮助用户可以快速、准确的从海量信息中找出对自己有用的那一部分,得益于学术界对推荐技术的不断研究,推荐系统也由最初的协同过滤算法发展成为融合各行业技术的一门独立的学科。在当前的推荐技术背景下,研究者把更多的目光投向于改善推荐系统的性能上,通过研究用户的行为数据提高预测的准确率是一个主流的研究方向;同时对推荐系统所面临的问题进行深入的研究也很有意义,如用户评分主观性问题,主观性的存在导致评分标准不统一,从而造成评分的高低并不能完全代表用户对物品的感兴趣程度,数据稀疏问题的存在也对用户兴趣的挖掘造成了一定的困难,针对此类问题论文的主要研究内容和创新如下:1.本论文通过研究用户的评分行为数据,针对推荐系统中的用户评分主观性问题,结合传统的协同过滤算法,设计实现一种基于用户行为的推荐方法。首先,针对评分主观性和个体差异性问题,引入并优化相关云模型理论,利用云模型定量到定性之间相互转换的优势,提出采用综合云模型生成评分标准并转化用户评分的方法;然后,在此基础上对用户进行聚类分析,以发现被推荐用户的相似群体。2.本论文针对由于数据稀疏造成的预测不准确问题,通过引入隶属度达到数据降维和目标用户定位的作用,进一步考虑到社交关系对评分结果的影响,分别利用社交关系及相似群体,在云模型及隶属度相关理论的基础上建立两个评分预测模型,并基于高斯变换融合两部分预测结果生成预测评分。最后,本论文用过真实数据集对所提方法进行实验,实验表明,本论文所提方法不仅克服了用户评分主观性问题,同时有效改善了用户评分数据稀疏情况下传统预测方法准确度偏差的问题。
面向企业的政策推送算法的研究与实现
这是一篇关于推荐系统,政策推送,协同过滤,相似度,评分预测的论文, 主要内容为政策推送算法是一种应用于政务服务领域的推荐算法,近年来其相关研究的落地,促进了政策的落实,保障了企业能够及时享受政策红利。目前的政策推送算法已基本可以满足企业与政策快速对接的需求,但在精准程度上,尤其在数据稀疏场景下的推荐准确度欠佳。针对以上问题,本文提出面向企业的政策推送算法,挖掘企业之间的隐性相似因素,并利用政策数据特征以及企业之间的邻居关系,迭代预测企业对潜在政策的态度,以提高推荐准确度。针对政策推送算法在计算企业之间相似度时,缺乏对特征信息、极端态度、共同评分比例等隐性因素的综合利用问题,本文提出了基于多类型隐性因素的相似度算法。算法从评分信息与特征信息两个维度计算相似度,在评分维度中,引入了极端评分相似度与共同评分系数,充分利用企业之间的隐性相似信息,提高用户之间相似关系的准确性。为提高政策推送算法在稀疏数据场景下的推荐准确度,本文提出了融合特征改进的迭代评分预测算法。本文针对评分矩阵中的个性化差异,提出了评分与满意度之间的映射方式。在预测过程中,算法利用政策数据特征以及企业之间的邻居关系,为目标用户迭代预测未知项目的态度。算法引入了可靠性矩阵,修正邻居与目标用户的距离对预测结果造成的影响,并结合政策数据的特征,提高预测结果的准确性。基于所提出的算法,本文设计并实现了面向企业的政策推送系统。本文从政策推送目标出发,分析系统需求,将系统分为数据获取与预处理层、数据分析层和数据展示层,通过总结各层的工作流程,详细设计与实现了其中涉及到的模块,并设计测试用例分别进行验证,证明系统的可用性。
辅助信息增强的协同推荐系统研究
这是一篇关于推荐系统,评分预测,Top-n推荐,神经网络,度量学习,辅助信息的论文, 主要内容为推荐系统已广泛应用在电子商务、社交媒体、教育科研等诸多领域,有效应对了信息超载问题;然而,数据稀疏性一直制约着推荐系统的效果,利用辅助信息如内容信息、用户社交网络能有效缓解数据稀疏问题的副作用,但如何有效地利用这些信息增强推荐效果仍是一个开放性问题。此外,随着深度学习、度量学习等技术的进步,研究如何融合新技术和辅助信息来构建新型推荐系统成为新的挑战。为此,本文针对推荐系统中的评分预测和Top-n推荐两个主要任务类型,提出利用评论信息和社交网络信息来构建辅助信息增强的推荐系统。针对评分预测问题,本文提出了基于深度神经网络的对偶正则化矩阵分解(Dual-Regularized Matrix Factorization,DRMF)模型。DRMF首先利用结合了卷积神经网络和门控循环单元的深层神经网络,来分别处理用户和项目的评论内容,获得两个独立的分布式表示来表征用户和项目;然后,利用这些表示来约束概率矩阵分解过程中用户和项目的嵌入表示。DRMF模型参数的联合优化通过交替迭代训练方式实现,即每次固定矩阵分解模型的参数,利用反向传播方法优化深层神经网络组件参数;再固定后者,优化矩阵分解模型的参数。大量实验证明DRMF可以显著减少评分预测的误差。针对Top-n推荐问题,本文提出了社交正则化协同度量学习(Social-Regularized Collaborative Metric Learning,SRCML)方法。SRCML首先定义相似度函数,用于融合社交偏好和评分偏好来衡量用户相似性;接着,构建正则化组件来重整协同度量学习的损失函数,使得兴趣爱好相似的用户彼此在度量空间中更加接近,同时使衡量用户与项目距离的度量函数得到优化;最后,给出了基于梯度下降的模型学习方法。大量实验证明,SRCML可以提升推荐排名的准确性和召回率。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设工坊 ,原文地址:https://m.bishedaima.com/lunwen/46408.html