基于时动联邦学习的跨端联合个性化推荐研究
这是一篇关于联邦学习,聚类方法,时间衰减因子,个性化推荐的论文, 主要内容为推荐系统的诞生使得用户能够在正确的时间以最合适的方式发现最有用的项目。联邦学习的诞生使得用户的个性化数据隐私得到保护。联邦推荐系统是联邦学习与推荐系统的交叉学科,是将联邦学习思想应用到推荐系统中。本文对联邦学习和联邦推荐系统进行了研究,主要内容有以下几点:(1)针对联邦学习中普遍存在非独立同分布问题,本文提出一种基于时间衰减因子的动态聚类联邦学习(简称时动联邦学习)方法。客户端利用时间衰减因子对本地历史参数列表中的历史参数和服务器发送的全局参数进行加权平均后再进行本地训练;服务器接收到客户端上传的参数后,不仅进行参数聚合,还会对这些参数进行聚类,并把聚类后的类平均参数发回给相应的客户端,以使客户端能更新本地历史参数列表。时动联邦学习方法解决了客户端本地数据间存在的非独立同分布问题。(2)针对传统联邦推荐系统中服务器由于缺乏原始用户数据导致无法进行个性化推荐的问题,本文提出一种基于用户嵌入特征的推荐系统模型,实现跨端联合个性化推荐。用户嵌入特征是原始用户数据输入到Embedding层后的输出结果,服务器无法仅通过用户嵌入特征逆推出客户端数据,故用户数据隐私得到有效保护。因此,服务器可以使用用户嵌入特征进行个性化推荐,将所得候选项目集发送给客户端,使得客户端可以使用原始用户数据进行本地个性化推荐,从而实现跨端联合个性化推荐。(3)针对用户在关联第三方软件、使用第三方软件账号登录后,一般不愿意再在推荐系统中提供原始用户数据的情况,本文提出一种基于第三方用户标识符的推荐系统模型,同样实现跨端联合个性化推荐。第三方用户标识符由第三方软件提供,服务器无法从第三方用户标识符中识别原始用户数据,有效保护客户端数据隐私。因此,服务器可以使用第三方用户标识符进行个性化推荐,将所得候选项目集发送给客户端,使得客户端可以使用原始用户数据进行本地个性化推荐,从而实现跨端联合个性化推荐。实验表明,本文提出的时动联邦学习方法优于传统联邦学习方法,能有效应用于跨端联合个性化推荐。
基于用户的个性化影视推荐系统的研究与实现
这是一篇关于影视推荐,个性化,时间衰减因子,标签,词频-逆文档频率的论文, 主要内容为随着互联网的飞速发展,每天都有浩如烟海的信息产生,面对数据量庞大的信息海洋,人们往往会感到无所适从,因此,推荐系统应运而生。推荐系统的目的是主动向用户提供其感兴趣的物品或资源而无需用户主动搜寻。经过20多年的发展,推荐系统已经深入到了人们生活的方方面面,如电子商务,新闻推荐,影视推荐等。其中影视推荐是推荐系统技术研究的重要领域。现有的影视推荐主要是热门推荐和相关推荐,热门推荐容易导致马太效应,而相关推荐在一定程度上符合用户喜好,但是个性化程度较低,不同用户在同一个播放页上看到的推荐列表往往是相同的。协作过滤算法是推荐领域中最成功也是应用最广泛的推荐策略,常用于个性化推荐。本文在基于用户的协作过滤策略的基础上进行改进。用户评分的高低表达了对电影的喜好程度,而用户的标注行为表达了用户的喜好倾向,两者结合可以有效提升推荐结果的个性化程度。本文首先在用户行为数据建模阶段对用户的行为数据进行分析,将用户的评分行为和标注行为结合起来建立了初始的用户行为数据模型。同时,考虑到用户喜好并不是一成不变,参考“牛顿冷却定律”引入了时间衰减因子模拟整个时间轴上的用户喜好变化,对用户行为数据模型进行偏移处理。之后使用该模型进行用户之间的类似程度计算,获得推荐的电影资源候选池。在电影资源的评分预测阶段,考虑到标签在一定程度上也反映了电影资源的内容特征信息,参考信息挖掘领域“词频-逆文档频率”的思想建立电影资源和标签之间的联系并对侯选池中的电影资源进行评分预测的改进。然后对本文做出的改进设计了对比实验验证其有效性,选取了Top-N推荐中常用的评价标准命中率(Hit-rate)和命中排序(Hit-rank)作为衡量指标进行相关实验,验证了在推荐同等数量电影资源的情况下,改进后的算法Hit-rate和Hit-rank都要高于现有的协作过滤算法。本文在最后以前文提出的改进的推荐算法为基础设计并实现了一个影视推荐系统,首先分析了系统的需求,然后根据需求进行相关设计,并用SS2H框架实现了该系统,并给出了系统主要的数据表展示与功能界面展示。
基于图神经网络的用户行为分析和个性化推荐
这是一篇关于协同过滤,Node2Vec,时间衰减因子,召回模型,排序模型的论文, 主要内容为在当前大数据的时代背景下,推荐系统已经开始在各种各样的场景下使用,尤其是在电商平台、新闻资讯、视频网站等场景。在视频推荐的应用场景下,本文对用户短期的交互行为数据、用户个人特征数据和视频特征数据进行分析,采用召回和排序两个阶段为每个用户生成一个个性化视频推荐列表。在召回阶段中,基于用户的交互行为数据构建以视频为节点的网络图,采用图神经网络中Node2Vec算法来提取视频的特征表示向量,进而得到视频-视频之间的相似度矩阵。结合用户-视频的交互矩阵进行协同过滤,为每个用户初步筛选得到一个大小为200的视频候选集。本文在传统协同过滤的基础上,引入时间衰减因子对用户-视频交互矩阵进行改进,来突出用户兴趣随时间变化的特点。通过实证对比分析发现,加入时间衰减因子后召回率为0.297124,这个指标相比于未改进的模型增加了1.4%,说明用户兴趣的变化是用户行为的分析中的一个重要因素。在实际业务中,可以对用户的兴趣区分长期兴趣、中期兴趣和短期兴趣进行分析。在排序阶段,基于用户特征数据和视频特征数据,以用户是否观看视频为目标训练排序模型,分别训练了逻辑回归、XGBoost、Light GBM和Deep FM模型,结果发现基于特征工程后训练的XGBoost模型效果优于推荐领域流行的Deep FM模型。本文采用模型融合的方法得到最终的排序模型,该融合后的模型相较于单一最优模型AUC指标提升了1.296%。在实际建模过程中,本文对用户特征和视频特征进行了特征工程,从用户角度构造了用户兴趣偏好、用户活跃度等特征,从视频特征角度构造了视频流行度以及对视频标签、导演和演员重要性等特征。通过XGBoost模型的特征重要性分析发现,基于用户兴趣画像构建的用户兴趣偏好特征是最重要的特征,说明本文构造的特征对于结果的预测是有必要的。最终,对召回阶段得到的候选视频集采用排序模型进行精准排序得到一个长度为30的个性化视频推荐列表,基于加入时间衰减因子后的召回模型和排序模型组合得到的召回率最高,达到0.235789。
面向数据流的近期加权频繁项集挖掘及应用
这是一篇关于数据流,加权频繁项集挖掘,时间衰减因子,相似度,位组合的论文, 主要内容为随着计算机和大数据采集技术的迅猛发展,数据流已成为企业和组织最重要的资源之一,但也对有效知识发现提出了严峻挑战。模式挖掘是数据挖掘的一个重要子领域,能够发现数据流中隐含的相关性信息。然而,传统频繁项集挖掘方法仅考虑事务数据库中项目频率,而忽视了其他隐含因素,如项目或项目集的权重、利息、风险或利润,在实际应用中表现出很大局限性。相较于传统频繁项集挖掘,加权频繁项集更符合用户需求。然而,随着时间推移,用户兴趣的下降可能会导致过时的加权频繁项集失去指导现有用户的相关性和能力。此外,现实应用中涉及多个数据流,它们均会不断地生成对象,并且一些有趣的观察结果可能会出现在多个数据流中的同一对象上。针对上述问题,本文对面向数据流的频繁项集挖掘进行了深入研究,主要内容包括:(1)针对传统频繁项集挖掘仅考虑项目频率导致的信息损失以及流式数据所包含知识将随时间推移发生变化的问题,本文引入时间衰减因子,通过设置相似性阈值自适应地调整不同时域数据流的衰减程度,提出单数据流近期加权频繁项集挖掘RWFIM-Neg(Recency Weighted Frequent Itemset NegNodesets)算法。RWFIM-Neg算法在挖掘过程中使用一种更高效的数据结构NegNodeset避免了复杂的建树过程和繁琐的支持度计算,提高了连接效率,同时采用超集等价和父子等价修剪策略,有效地减少了最近加权频繁模式的搜索空间。(2)由于RWFIM-Neg算法仅适用于单数据流近期加权频繁项集挖掘,无法有效地用于多数据流近期加权频繁项集挖掘的问题,因此本文提出多数据流协同近期加权频繁项集挖掘CRWFIM(Collaborative Recency Weighted Frequent Itemset)算法。CRWFIM算法采用基于位组合的频繁项目集挖掘算法,将数据转换为二进制,并逐步增加元素组合来挖掘频繁项集和计算支持度,同时还记录了结果集中每个频繁项连续超集中存在的次数,并迅速剪枝非频繁候选项,以进一步提高挖掘效率。(3)设计了一种基于RWFIM-Neg算法的商品推荐系统,可以帮助管理者更加直观地了解用户的购买行为和商品流的趋势,从而提供更加具有参考意义的推荐结果。
专家推荐模型优化及其在电信项目管理中的应用
这是一篇关于专家遴选推荐,文本表示,时间衰减因子,评分模型,层次分析法的论文, 主要内容为项目评审是项目综合管理的重要环节,而评审专家遴选推荐又是项目评审的核心部分。为提高项目评审专家遴选推荐的时效性和准确性,专家智能推荐方法研究及其应用,已成为项目综合管理领域亟待解决的关键问题之一。为此,本文结合电信企业的项目综合管理需求,开展了项目评审专家遴选推荐模型优化研究,设计实现了一个电信项目综合管理系统。主要研究工作和成果包括:1.提出了一种引入时间“衰减”因子的作者主题模型(Time Decay Author Topic Model,TDATM)。其主要特点在于,通过引入时间“衰减”因子,来衡量不同时间段专家的文献特征词具体的权重关系,既能捕捉专家文献与专家之间的隐藏关联,又能降低专家前期研究领域主题特征权值。中文DBLP语料库和爬虫从文献检索库中抓取数据集上的实验结果表明,相比于LDA、Doc2Vec、TF-IDF等主题模型,TDATM模型具有更好的专家遴选推荐文本分类性能。2.优化重构了项目评审专家评分模型。为提高专家遴选推荐准确性,应用层次分析法,从目标层、准则层、方案层三个层次综合调整影响专家价值评分的指标体系,优化重构了项目评审专家评分模型,算例分析表明所提出的模型是有效可行的,符合项目评审专家遴选推荐工作实际。3.基于TDATM模型和优化重构的专家评分模型,提出了一种项目评审专家遴选推荐新方案。方案首先通过TDATM模型计算专家文献与评审项目之间的相似程度,生成专家候选集环节,然后通过优化重构的专家评分模型对专家候选集进行优化遴选,形成评审专家推荐结果。电信实际数据集上的实验结果表明,该方案遴选的评审专家推荐结果符合电信项目管理需求,是有效可行的。4.基于所提出评审专家推荐新方案,采用SSM框架开发了一个电信项目综合管理系统。系统包括申报管理、评审管理、专家管理、精细化管理等四个功能模块,能结合电信项目管理业务需求,实现专家智能遴选推荐和项目信息精细化管理。测试结果表明,系统达到了预期的功能和性能指标,稳定性较好。主要贡献:提出一种引入时间“衰减”因子的作者主题模型,优化重构了项目评审专家评分模型,并给出了一种项目评审专家遴选推荐新方案。开发了一个电信项目综合管理系统,能实现专家智能遴选推荐和项目信息精细化管理。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设客栈 ,原文地址:https://m.bishedaima.com/lunwen/53257.html