基于特征表示的推荐算法实践与研究
这是一篇关于推荐系统,特征表示,上下文,隐式反馈的论文, 主要内容为推荐系统作为一种信息过滤工具诞生至今已有20余年,推荐算法的应用场景亦早已不限于电商领域,转而在诸多关联人和信息的领域发挥作用。早期的推荐算法多采用单一的用户物品交互数据,基于上下文信息的推荐算法致力于通过额外场景信息的引入来对传统推荐算法进行改良。受神经网络和矩阵分解算法普及的影响,特征表示的算法日新月异。本文致力于通过基于上下文的特征表示,在隐式反馈数据上引入上下文信息以提升推荐精度,具体包括三方面工作:·归纳总结并实现常见的基于特征表示的推荐模型。具体地,针对引入了上下文的隐式数据推荐场景,改进并实现矩阵分解和因子机算法;因推荐中神经网络模型应用较少,且一般只使用单一评分数据,设计了一种可引入多源特征数据的DeepRec算法。·在隐因子模型基础上,提出一种基于上下文信息的矩阵分解方法(Context Aware Matrix Factorization.,CAMF)。建模非线性的特征交互关系,同时又缓解数据稀疏性。引入按对排序学习框架,更加贴近基于隐式反馈数据的Top-K推荐场景,提升相关推荐算法性能。·针对基于上下文推荐的场景,基于Stacking模型融合框架,定制了一种不同深浅层次的多模型融合框架(Joint-training)。相比传统模型集成方法,在不降低预测准确率的前提下,更加的轻量快速。上述三方面的工作始于对APP推荐问题的研究,但不限于APP领域。为此,本文在IJCAI SocInf 2016推荐比赛数据上进行实验,以进一步验证本文相关工作在基于上下文的推荐场景中,具有一定的通用性。
基于隐式反馈的视频会议系统推荐方法设计与实现
这是一篇关于推荐系统,隐式反馈,会议系统,个性化排序,协同过滤的论文, 主要内容为现代网民经常会在互联网的海量内容中感到迷失,不知如何寻找自己可能感兴趣的内容。个性化推荐系统能将用户和内容进行匹配,协助用户做出决策,满足用户的信息需求,在互联网+时代发挥了重要作用,并逐渐扩展到了更多应用领域,比如视频会议系统。视频会议系统通过网络音视频提供了远程的实时交流服务,降低了沟通成本,现在开始尝试逐渐从机构用户渗透到个人用户,目标是提供一个沟通的大平台。此时,可以应用推荐技术来帮助用户挖掘他们所喜欢的,想要参与的交流活动。可以注意到,包括视频会议系统在内的绝大多数系统都得不到用户物品评分反馈,只能收集到诸如点击,参与会议这样的隐式反馈。推荐系统也只能借助隐式反馈来对用户偏好进行建模。本文结合了视频会议系统来研究隐式反馈推荐方法,通过分析视频会议系统的反馈数据模式,针对性地进行推荐算法设计,提出融合了隐式反馈和物品本身信息的SimBPR个性化排序推荐算法,并依此设计和构建视频会议系统的推荐模块。文章首先分析了推荐系统和视频会议系统的的历史和发展趋势,然后叙述了现有的隐式反馈推荐算法,共分为单类协同过滤、引入辅助信息推荐和排序学习三类。通过观察业界实践,明确了基于逐对排序学习的算法是最佳方案,据此对贝叶斯个性化排序(BPR)算法通过最大化模型参数的后验概率来进行推荐的原理进行了分析学习,并提出了在分布式系统上实现BPR的方法。鉴于物品内容信息一直是辅助推荐的有效手段,本文使用描述文本代表物品,设计了一种基于语义相似度、关键词相似度、类别相似度的三合一相似度计算方法。随后文章推出比BPR更进一步的偏好假设,认为用户会对和自己以往交互过的物品相似度高的物品更感兴趣,由此根据物品相似度把用户没有交互过的物品集合分为和历史交互物品高相似度和低相似度的两个物品集合,分别称为假反馈集合和缺失反馈集合,并依此改进BPR算法,构建了同时训练真反馈样本和假反馈样本的SimBPR算法。另外,BPR算法的随机样本采样是有优化空间的,本文进而提出正负样本分别基于时间和基于流行度进行采样。观察到业界流行使用大规模上下文辅助信息来对推荐建模,本文还针对视频会议系统设计了可以收集到的上下文特征,包括参会人数和参会用户的好友关系等,并使用因子分解机将其融入个性化排序的底层模型预测器之中,为SimBPR构建了一个新的预测器。随后,文章基于Spark、Hive、HBase等技术来为视频会议系统设计推荐模块。模块设计中把模块分为了离线、近线和在线三个子模块分别负责非实时、准实时和实时的计算任务;在系统中,设计了全量上传和日志上传两种数据采集方式,并依照星型模型设计了数据建模方法。最后,文章详细叙述了每个子模块的设计和实现。第三部分中,文章对SimBPR算法做了离线实验,选取了BPR和AoBPR这样较先进的算法作对对比算法,设定推荐列表长度为5,在两个数据集上分别测试,表明SimBPR在AUC、MAP和NDCG指标上实现了对两种对比算法的超越,进而验证了物品信息对推荐起到的正面作用。实验还测试了假反馈权重和物品相似度计算中的子相似度权重的不同取值对SimBPR性能的影响。
基于项目隐式反馈和多因素融合的协同过滤推荐算法研究
这是一篇关于矩阵分解,相似度,隐式反馈,协同过滤,推荐算法的论文, 主要内容为推荐系统的研究一直是数据挖掘中的热点,在解决信息过载方面起到了重要作用。其中协同过滤是相对成熟的推荐技术,但目前协同过滤算法仍存在数据稀疏性、冷启动以及隐式信息挖掘不充分等问题。本文通过对项目隐式信息的挖掘以及融合多因素来改善协同过滤过程进而影响推荐准确度,缓解数据稀疏性。首先,本文对常用的推荐算法进行描述,详细介绍了协同过滤中矩阵分解方法的原理及优缺点,分析了针对项目隐式反馈和协同过滤算法过程的研究现状及相关问题,并提出改进策略。其次,在当前矩阵分解推荐算法中,一般研究用户和项目的显式信息对评分的影响,对于矩阵中隐式信息的挖掘尚不成熟,且在对隐式信息的挖掘过程中绝大多数算法忽略了项目本身属性的挖掘。为了更好地融入项目隐式信息对用户评分的影响,考虑项目是否在同一领域和项目口碑效应两个影响因素,并融入到矩阵分解模型中,再通过最小化目标函数来学习用户和项目特征矩阵,尽可能的达到预测评分接近真实评分的结果。再次,针对基于协同过滤推荐算法过程中,仍存在的数据信息挖掘不足,利用率不高的现象,引入用户重叠评分项、评分均值以及用户从众评分因素,建立多因素融合模型来优化协同过滤算法。主要通过矩阵分解对数据进行降维,融合用户评分信息以及信任信息与具体相似度计算结合,有效计算用户间相似性,以期提高推荐准确性。最后,分别对本文所提出的基于项目隐式反馈模型和多因素融合的协同过滤算法模型在经典数据集上设计实验。通过实验找出算法的最优参数,然后结合对比实验对数据进行综合分析,实验结果表明本文所构建的模型有效提高了推荐结果的准确性。
推荐系统中多源信息融合和隐式反馈挖掘的研究
这是一篇关于推荐系统,协同过滤,矩阵分解,打分预测,主题建模,社会推荐系统,异构信息源,隐式反馈的论文, 主要内容为通信技术和网络媒体的发展,产生了大量的信息、:新闻,音乐,视频,应用软件等;为克服由此带来的信息过载问题,研究者们就对如何构建支撑用户做出个性化决策的信息系统产生了兴趣,并提出了多种信息过滤算法,这些系统(算法)统称为推荐系统(算法)。由于推荐系统能够为广大用户提供他们感兴趣和有用的物品,给企业带来营收、为平台增强功能同时也提升了用户满意度,使得推荐系统在电子商务、流媒体平台和社交网络与社会媒体等领域有广泛的应用。由于传统的协同过滤推荐方法只利用了用户对物品的浅层打分信息,使得推荐性能深受冷启动和数据稀疏性的影响。因而目前一个重要方向是增加额外的数据源:一方面,是增加文本信息,如用户对产品的评论数据;另一方面,是增加社交关系信息,如用户在社会网络中形成的信任关系链。然而,如何将文本信息和社交关系信息整合到基于矩阵分解的协同过滤方法中,还缺乏高效的融合方法。另一个重要方向是深度利用有限的信息,如挖掘打分信息中的隐式反馈。但是如何把横向增加额外数据源与纵向深挖有限信息两个重要方向结合起来以进一步提高推荐性能,相关工作据作者所知还没有。本文对推荐系统中的多源信息融合和隐式反馈挖掘进行了研究,在此基础上提出了两个推荐模型,主要工作包括:1.提出一个基于多源信息融合的高效综合方法,能够同时建模打分信息、文本信息和社交网络信息。以往利用额外数据源的方法通常只加入了一种额外信息,比如只加入了文本信息,或者只加入了社交关系信息,缺乏一个高效的综合方法。针对这一问题,本文通过基于矩阵分解的协同过滤基本模型,建立了打通文本信息和社交关系信息的融合方法。该方法不仅具有优化目标上的统一性,在两个真实数据集的评估上都有实践上的性能提升。2.提出一个基于隐式反馈挖掘的扩展融合模型,能够在深挖纵向打分信息的同时融合横向的额外数据源。以往利用隐式反馈信息的方法都只考虑了如何纵向深挖打分信息,而忽略了融合横向的额外数据源。针对这一问题,本文通过多源信息融合这一综合方法,在此基础上建立了能深挖隐式反馈信息的扩展模型。通过此方法,本文首次实现了横向多源数据融合和纵向隐式反馈挖掘两个克服冷启动和数据稀疏性问题的重要方向的汇合。所提出的融合模型和扩展融合模型在两个较大规模的数据集上做了实验验证,并对两个模型的所含组件和超参敏感性进行了详细分析。
基于隐式反馈的图书推荐系统设计与实现
这是一篇关于推荐系统,隐式反馈,单类协同过滤,个性化排序的论文, 主要内容为在“互联网+”的时代背景下,个性化推荐系统为用户提供“私人订制”式的推荐服务以满足不同用户的消费需求。因个性化推荐系统具有互动性的特点,使其成为实现“互联网+”新型消费模式的重要手段。然而随着推荐服务规模越来越大,评分数据不足、用户-项目矩阵稀疏等问题愈发凸显,传统推荐算法面临难以突破的瓶颈。为了解决这一问题,不少研究学者开始更多地关注用户隐式行为的分析和研究,尝试从中挖掘用户兴趣偏好以弥补显式评分数据带来的不足。本文针对图书推荐系统的评分数据稀疏和单类协同过滤等问题展开研究,分析系统中数据的特点,将隐式反馈作为建立和更新用户兴趣模型的数据来源,创造性地提出一种改进算法——基于分层隐式反馈的贝叶斯排序算法,通过预测用户对项目的相对喜好来得到推荐列表。本文的研究工作可概括如下:首先,文章从系统中存在的显式和隐式反馈数据的特点与区别出发,分析本系统选取隐式用户反馈的原因以及隐式反馈带来的问题。然后从基于评分和基于排序两个方面介绍了几种经典的推荐算法。针对当下排序推荐算法往往只考虑用户有过操作行为的项目与未操作过的项目之间的偏好差别,缺乏对用户偏好程度深度理解和区分,本文探索用户隐式反馈所表示的用户偏好,将隐式反馈类型按所代表用户兴趣程度进行划分,使用分层隐式反馈模型来表示用户偏好。在贝叶斯个性化排序算法的基础上设计了“强正反馈-弱正反馈-负反馈”的三层隐式反馈表示模型,为用户生成符合用户兴趣的项目推荐列表。然后,经过大量实验研究分析潜因子矩阵维度k值大小、推荐列表长度等参数对算法性能的影响,并从AUC、平均精度均值、平均百分比排序、归一化折损累积增益等角度与经典的排序推荐算法作比较,对改进的算法进行评估,得出本文算法所生成的推荐列表可以更准确地把握用户当前兴趣。最后,在改进算法基础上,从分析个性化图书系统的功能需求入手,对系统进行功能模块划分与设计,实现了基于隐式反馈的个性化图书推荐系统。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设港湾 ,原文地址:https://m.bishedaima.com/lunwen/49180.html