基于学习网络表征的推荐系统实现及应用
这是一篇关于推荐系统,协同过滤,网络表征学习,大数据,实时性,技术增强学习的论文, 主要内容为现代社会已经进入了信息过载的时代,电商平台、User Generated Content社区、在线教育等平台每天都会产生海量的内容数据,用户与内容之间的交互也会产生大量的数据。因此如何帮助用户过滤海量信息,帮助用户快速的找到他们最可能感兴趣的内容或商品,是提升用户体验的关键。推荐系统作为一种信息过滤系统,能够结合用户对物品的反馈信息,向用户个性化的推荐他们可能感兴趣的物品。但是随着用户和物品越来越多,数据量越来越大且数据越来越稀疏,推荐系统面临着数据稀疏和海量数据带来的推荐质量降低、推荐的实时性下降等挑战。为提升推荐系统的推荐质量和用户体验,本文主要关注推荐算法和系统架构的设计,用以改善和提升当下推荐系统在数据稀疏和海量数据下的推荐质量和推荐的实时性。首先,本文将介绍推荐系统研究的背景、意义和国内外研究现状。其次,介绍与本文工作相关的理论和系统开发技术。在此基础上,进行基于自然语言处理模型Skip-Gram的推荐算法研究,设计了一种基于Transform-Embedding-Recommender框架的LN-N2V-TW-CF推荐算法,并使用在线教育和电影数据集进行推荐效果的验证和测试。最后,结合大数据相关技术和前后端系统开发技术,设计了一种基于离线模型和在线推荐的实时推荐框架,并实现了基于Apache Spark和Django框架的完整的实时性教育推荐系统应用。本文的主要成果有:(1)在推荐质量方面,在基于Transform-Embedding-Recommender的框架思想下,进行基于自然语言处理模型Skip-Gram的推荐算法研究;设计了一种基于学习网络(Learning Networks)转换、Node2Vec表征和考虑时间权重的基于物品的协同过滤推荐相结合的LN-N2V-TW-CF推荐算法。其中,学习网络的转换方式更好地捕捉了物品之间的拓扑与递进关系;Node2Vec能够更好的表征学习网络中的节点信息和捕捉节点之间的关系;结合引入时间权重的基于物品协同过滤的推荐算法捕捉了时间变化对用户兴趣的影响。相比一些已有的协同过滤推荐算法,本文所提出的算法在教育推荐场景和电影推荐场景下提高了推荐系统的准确率和召回率等指标。(2)在推荐实时性方面,为保证推荐系统的实时性和推荐的时效性,本文设计了一种离线模型和在线推荐相结合的实时推荐系统架构。为了加速网络表征部分的计算,本文将网络表征部分部署于Apache Spark分布式计算平台上,并结合Django框架实现具有Restful风格的推荐系统后端,实现离线模型更新和在线实时推荐相结合的分层实时推荐系统。最后通过前端演示了推荐系统与用户交互的界面,验证了算法的可落地性,最终实现了一个MOOC教育推荐系统应用。
基于异质信息网络的表征学习推荐方法研究
这是一篇关于异质信息网络,网络表征学习,推荐系统,动态推荐,三角嵌入的论文, 主要内容为随着移动互联网技术的不断发展,网络结构及其拓扑日益复杂,数据规模爆炸式扩张,使得如何迅速而准确地从海量信息中搜集和获取更多有价值的数据及其特征已经成为当前关注的热点。个性化推荐算法就是一种通过对用户历史活动资料进行分析,挖掘用户潜在偏好信息的有效方法。协同过滤推荐算法作为经典的个性化推荐算法,可以准确发现其喜好与倾向,并对其倾向的商品进行筛选、预测与推荐。然而,面对数据规模快速增长,以及日益复杂的推荐问题,协同过滤推荐算法存在一些无法回避的问题:仅考虑用户与项目间的矩阵交互;同时对用户数据稀疏性以及冷启动问题也缺少有效的解决策略。近年来,由多种属性节点与边链接构成的异质信息网络(Heterogeneous Information Network,简称HIN)可以融合复杂多源异构信息,具有强大的数据建模和分析能力,已被广泛研究应用于很多大数据分析与挖掘的复杂任务中。由于这种异质信息网络在分析和处理建模表征数据的异质性等诸多复杂问题上具有较高的应用灵活性,被国内外学者用于自动推荐系统的表征建模过程中。这些异质推荐算法多基于元路径获取用户的相关信息,同时也利用网络表征学习来进行表征融合。推荐性能提升的同时,也存在以下的问题:首先,传统协同过滤推荐方法仅考虑用户和商品的历史交互行为,无法利用异质信息网络中隐藏的复杂关系,导致可扩展性问题;针对用户历史信息稀疏,结合异质辅助信息在局部推理可能发生冲突,导致稀疏不一致性问题;其次,基于异质信息网络的推荐方法通常仅考虑异质信息网络中低阶交互,而忽略其中某些高阶关系,易带来信息缺失问题;最后,用户的兴趣偏好可能会随着时间的推移而发生变化,出现兴趣漂移问题,影响推荐效果。针对上述这些问题,本文提出了一系列关于异质信息网络推荐的研究方法,利用异质信息网络丰富的结构和语义信息进行推荐,主要工作内容如下:(1)针对传统协同过滤推荐方法的可扩展性问题,提出了一种异质信息融合网络嵌入的注意力偏好推荐方法(MFFHINE),通过联合优化矩阵分解模型和融合函数,可有效利用属性信息。进而采用了一种基于注意力机制的融合策略,将不同权重元路径产生的偏好特征有机融合,用于解决异质信息网络推理过程的局部稀疏不一致性问题。(2)针对基于异质信息网络推荐方法的信息缺失问题,提出了一种在异质信息网络中采用三角嵌入的高阶推荐方法(RLTE),通过多层级嵌入为指导的异质网络嵌入方法,分别利用skip-gram模型和局部三角化结构挖掘异质信息网络中隐藏的低阶和高阶关系,通过这些潜在信息的特征融合缓解信息缺失问题。(3)针对动态推荐过程中用户兴趣漂移的问题,提出了一种用时序因子追踪用户兴趣偏好的策略方法(DRLTE),结合三角高阶多层级信息融合进行动态推荐,解决兴趣漂移的不确定性问题。最后,全文工作以Python语言实现,并与相关的基准和SOTA推荐算法进行比较及参数分析,在真实大规模数据集实验也表明本文提出的相关模型方法有效可行。
基于三支决策的网络表征学习的推荐系统方法研究
这是一篇关于推荐系统,网络表征学习,三支决策,图神经网络,组推荐的论文, 主要内容为大数据时代的来临,使得人们从海量数据中获取感兴趣的项目与内容愈发困难。为了构建用户和项目之间的桥梁,推荐系统方法(Recommendation System)作为当前一大研究热点,可通过对用户或者项目信息进行建模挖掘用户偏好,在Amazon、Facebook、淘宝等诸多商业应用中已获得极大成功。传统的推荐系统主要考虑用户的历史行为,然而在实际场景中用户与项目的交互是有限的,往往会直接影响推荐结果。近年来,很多研究融合用户或者项目的辅助信息对大型网络或稀疏网络进行建模,形成了包含多种类型信息的异质信息网络。融合辅助信息进行推荐的方法受到越来越多的关注。这些推荐算法大多基于元路径得到相似用户,同时利用网络表征学习提取有效信息。虽然提升了一定的效果,但大多存在以下问题:随着用户节点数量的增加,用户-用户图中的边数量通常呈指数增长;当融合的辅助信息含有噪声时,推荐是不可靠的;信息提取过程中大多只考虑了单一的结构信息。针对已经存在的问题,结合粒计算三支决策理论从不同的视角对大规模网络进行建模,提出了基于三支决策的网络表征学习的推荐系统方法,主要工作内容如下:(1)针对复杂网络中存在的不确定信息,提出基于三支决策的图神经网络推荐方法,通过引入三支决策理论结合图神经网络挖掘用户和项目的潜在特征,使得结构信息和属性信息相互补充,解决含有不确定信息的推荐问题。(2)针对用户兴趣的群体复合性,构建灵活的群组并利用图神经网络获取单个用户偏好,结合融合策略得到群组偏好,提出基于图神经网络的组推荐,使其应用到组推荐任务中。(3)进一步考虑在异质推荐框架中融合群体兴趣特征,提出一种基于群组的图神经网络混合推荐算法。将大规模的异质信息网络根据群组、用户、项目三个属性划分为群组-用户网络、用户-项目网络。将两个本质上不同的网络,采用注意力机制有机融合,使其相互补充、相互制约。通过真实数据集的算法性能评测,结果表明本文提出的混合推荐算法具有良好的性能。
基于学习网络表征的推荐系统实现及应用
这是一篇关于推荐系统,协同过滤,网络表征学习,大数据,实时性,技术增强学习的论文, 主要内容为现代社会已经进入了信息过载的时代,电商平台、User Generated Content社区、在线教育等平台每天都会产生海量的内容数据,用户与内容之间的交互也会产生大量的数据。因此如何帮助用户过滤海量信息,帮助用户快速的找到他们最可能感兴趣的内容或商品,是提升用户体验的关键。推荐系统作为一种信息过滤系统,能够结合用户对物品的反馈信息,向用户个性化的推荐他们可能感兴趣的物品。但是随着用户和物品越来越多,数据量越来越大且数据越来越稀疏,推荐系统面临着数据稀疏和海量数据带来的推荐质量降低、推荐的实时性下降等挑战。为提升推荐系统的推荐质量和用户体验,本文主要关注推荐算法和系统架构的设计,用以改善和提升当下推荐系统在数据稀疏和海量数据下的推荐质量和推荐的实时性。首先,本文将介绍推荐系统研究的背景、意义和国内外研究现状。其次,介绍与本文工作相关的理论和系统开发技术。在此基础上,进行基于自然语言处理模型Skip-Gram的推荐算法研究,设计了一种基于Transform-Embedding-Recommender框架的LN-N2V-TW-CF推荐算法,并使用在线教育和电影数据集进行推荐效果的验证和测试。最后,结合大数据相关技术和前后端系统开发技术,设计了一种基于离线模型和在线推荐的实时推荐框架,并实现了基于Apache Spark和Django框架的完整的实时性教育推荐系统应用。本文的主要成果有:(1)在推荐质量方面,在基于Transform-Embedding-Recommender的框架思想下,进行基于自然语言处理模型Skip-Gram的推荐算法研究;设计了一种基于学习网络(Learning Networks)转换、Node2Vec表征和考虑时间权重的基于物品的协同过滤推荐相结合的LN-N2V-TW-CF推荐算法。其中,学习网络的转换方式更好地捕捉了物品之间的拓扑与递进关系;Node2Vec能够更好的表征学习网络中的节点信息和捕捉节点之间的关系;结合引入时间权重的基于物品协同过滤的推荐算法捕捉了时间变化对用户兴趣的影响。相比一些已有的协同过滤推荐算法,本文所提出的算法在教育推荐场景和电影推荐场景下提高了推荐系统的准确率和召回率等指标。(2)在推荐实时性方面,为保证推荐系统的实时性和推荐的时效性,本文设计了一种离线模型和在线推荐相结合的实时推荐系统架构。为了加速网络表征部分的计算,本文将网络表征部分部署于Apache Spark分布式计算平台上,并结合Django框架实现具有Restful风格的推荐系统后端,实现离线模型更新和在线实时推荐相结合的分层实时推荐系统。最后通过前端演示了推荐系统与用户交互的界面,验证了算法的可落地性,最终实现了一个MOOC教育推荐系统应用。
点评网站用户影响力度量及用户动态行为预测方法研究
这是一篇关于用户影响力,用户行为信息,网络表征学习,协同过滤的论文, 主要内容为随着互联网与移动端技术的发展普及以及线上交互网站技术的成熟,各类在线点评网站服务已经延伸到人们生活的各个方面,涵盖了日常生活中的衣食住行。尤其是餐饮类在线点评网站已经成为用户普及率及使用率最高的一类网站,餐饮行业也逐渐向电子商务化发展,并且针对餐饮行业电子商务化的研究也成为前沿交叉学科的研究热点。用户就餐前在在线点评网站进行搜索,进行信息搜集与比对,从中获取有用的信息从而进行就餐决策已经成为一种流行趋势。但是伴随着餐饮行业的电子商务化,并且发展速度逐年加快的同时,在线点评网站不仅给用户带来便利也给用户带来了信息过载的困扰。对于用户来说,如何在海量数据中有效进行信息筛选,获取对自己有用的信息是用户的首要需求也是当下面临的主要难题。对于商家来说,如何使自己的餐厅在众多商家中脱颖而出,使自己的餐厅被更多的用户认可是大多数商家目前面临的主要困境。对于网站而言,维持网站热度并且促进网站持续健康发展是最根本的需求。为了解决上述问题,越来越多的学者通过数据挖掘、机器学习等方法解决餐饮行业电子商务化中遇到的问题。针对以上餐饮行业电子商务化发展过程中的问题,本文以Yelp在线点评网站为研究对象,以降低用户就餐决策成本、提高网站对用户就餐行为动态预测能力,进而提升网站推荐系统性能为主要目标,对在线点评网站的用户影响力及用户就餐行为进行分析,并改进了传统协同过滤推荐模型。首先通过用户影响力度量,计算出具有较高影响力的用户。可以帮助网站针对此类用户制定合理的激励政策使其保持活跃度并吸引更多的用户共同维持网站热度,同时还可以为普通用户降低一定的信息筛选时间成本。然后对用户就餐行为动态变化进行分析,从而探索用户就餐地理位置和口味变化趋势,对用户之后的就餐行为进行预测,为提高网站推荐系统性能提供依据。最终可以实现网站、商家和用户的三方共赢,有利于促进餐饮业的电子商务化发展,并促使Yelp网站电子商务化模式更加成熟。本文主要研究内容及成果包括:(1)本文改进了已有的用户影响力度量方法。基于已有的主观加权法和客观加权法确定用户影响力度量指标的权重计算方法,本研究首先通过结合Yelp网站用户属性构造用户影响力度量指标,然后提出了综合权重赋值法来确定各个度量指标的权重,再使用加权求和的方式对用户影响力进行计算。最后对计算结果进行对比分析证明,本文所提出的方法要优于单独使用主观加权法和客观加权法,更有助于网站度量用户影响力,识别高影响力用户。(2)本文对用户就餐行为信息进行挖掘分析,研究用户就餐行为的变化趋势,对用户的就餐行为进行网络构建,并引入信息熵对其进行度量。分别从用户就餐地理位置信息和用户就餐口味信息对用户就餐行为进行研究分析。构建了用户就餐地理位置动态变化网络和用户就餐口味动态变化网络,通过信息熵度量分析发现,用户的就餐地理位置和就餐口味具有有界性和偏好性,用户的就餐行为具有可预测性,这为下一步进行推荐算法的改进提供了基础。(3)本文对传统的协同过滤算法进行改进,提出了融合用户就餐行为信息的协同过滤推荐模型。首先在用户就餐行为信息分析的基础上,对用户就餐动态变化网络进行向量表征,刻画用户就餐行为偏好,并据此提出用户就餐偏好惯性系数定义。针对传统协同过滤算法只使用用户评分进行推荐及数据稀疏和冷启动问题,本文将用户就餐偏好惯性系数结合用户评分信息融入到传统协同过滤算法中,得到改进的融合用户就餐行为信息的协同过滤推荐模型。与其他常用推荐算法相比,本文的推荐算法性能有了明显提高。
基于学习网络表征的推荐系统实现及应用
这是一篇关于推荐系统,协同过滤,网络表征学习,大数据,实时性,技术增强学习的论文, 主要内容为现代社会已经进入了信息过载的时代,电商平台、User Generated Content社区、在线教育等平台每天都会产生海量的内容数据,用户与内容之间的交互也会产生大量的数据。因此如何帮助用户过滤海量信息,帮助用户快速的找到他们最可能感兴趣的内容或商品,是提升用户体验的关键。推荐系统作为一种信息过滤系统,能够结合用户对物品的反馈信息,向用户个性化的推荐他们可能感兴趣的物品。但是随着用户和物品越来越多,数据量越来越大且数据越来越稀疏,推荐系统面临着数据稀疏和海量数据带来的推荐质量降低、推荐的实时性下降等挑战。为提升推荐系统的推荐质量和用户体验,本文主要关注推荐算法和系统架构的设计,用以改善和提升当下推荐系统在数据稀疏和海量数据下的推荐质量和推荐的实时性。首先,本文将介绍推荐系统研究的背景、意义和国内外研究现状。其次,介绍与本文工作相关的理论和系统开发技术。在此基础上,进行基于自然语言处理模型Skip-Gram的推荐算法研究,设计了一种基于Transform-Embedding-Recommender框架的LN-N2V-TW-CF推荐算法,并使用在线教育和电影数据集进行推荐效果的验证和测试。最后,结合大数据相关技术和前后端系统开发技术,设计了一种基于离线模型和在线推荐的实时推荐框架,并实现了基于Apache Spark和Django框架的完整的实时性教育推荐系统应用。本文的主要成果有:(1)在推荐质量方面,在基于Transform-Embedding-Recommender的框架思想下,进行基于自然语言处理模型Skip-Gram的推荐算法研究;设计了一种基于学习网络(Learning Networks)转换、Node2Vec表征和考虑时间权重的基于物品的协同过滤推荐相结合的LN-N2V-TW-CF推荐算法。其中,学习网络的转换方式更好地捕捉了物品之间的拓扑与递进关系;Node2Vec能够更好的表征学习网络中的节点信息和捕捉节点之间的关系;结合引入时间权重的基于物品协同过滤的推荐算法捕捉了时间变化对用户兴趣的影响。相比一些已有的协同过滤推荐算法,本文所提出的算法在教育推荐场景和电影推荐场景下提高了推荐系统的准确率和召回率等指标。(2)在推荐实时性方面,为保证推荐系统的实时性和推荐的时效性,本文设计了一种离线模型和在线推荐相结合的实时推荐系统架构。为了加速网络表征部分的计算,本文将网络表征部分部署于Apache Spark分布式计算平台上,并结合Django框架实现具有Restful风格的推荐系统后端,实现离线模型更新和在线实时推荐相结合的分层实时推荐系统。最后通过前端演示了推荐系统与用户交互的界面,验证了算法的可落地性,最终实现了一个MOOC教育推荐系统应用。
基于异质信息网络的表征学习推荐方法研究
这是一篇关于异质信息网络,网络表征学习,推荐系统,动态推荐,三角嵌入的论文, 主要内容为随着移动互联网技术的不断发展,网络结构及其拓扑日益复杂,数据规模爆炸式扩张,使得如何迅速而准确地从海量信息中搜集和获取更多有价值的数据及其特征已经成为当前关注的热点。个性化推荐算法就是一种通过对用户历史活动资料进行分析,挖掘用户潜在偏好信息的有效方法。协同过滤推荐算法作为经典的个性化推荐算法,可以准确发现其喜好与倾向,并对其倾向的商品进行筛选、预测与推荐。然而,面对数据规模快速增长,以及日益复杂的推荐问题,协同过滤推荐算法存在一些无法回避的问题:仅考虑用户与项目间的矩阵交互;同时对用户数据稀疏性以及冷启动问题也缺少有效的解决策略。近年来,由多种属性节点与边链接构成的异质信息网络(Heterogeneous Information Network,简称HIN)可以融合复杂多源异构信息,具有强大的数据建模和分析能力,已被广泛研究应用于很多大数据分析与挖掘的复杂任务中。由于这种异质信息网络在分析和处理建模表征数据的异质性等诸多复杂问题上具有较高的应用灵活性,被国内外学者用于自动推荐系统的表征建模过程中。这些异质推荐算法多基于元路径获取用户的相关信息,同时也利用网络表征学习来进行表征融合。推荐性能提升的同时,也存在以下的问题:首先,传统协同过滤推荐方法仅考虑用户和商品的历史交互行为,无法利用异质信息网络中隐藏的复杂关系,导致可扩展性问题;针对用户历史信息稀疏,结合异质辅助信息在局部推理可能发生冲突,导致稀疏不一致性问题;其次,基于异质信息网络的推荐方法通常仅考虑异质信息网络中低阶交互,而忽略其中某些高阶关系,易带来信息缺失问题;最后,用户的兴趣偏好可能会随着时间的推移而发生变化,出现兴趣漂移问题,影响推荐效果。针对上述这些问题,本文提出了一系列关于异质信息网络推荐的研究方法,利用异质信息网络丰富的结构和语义信息进行推荐,主要工作内容如下:(1)针对传统协同过滤推荐方法的可扩展性问题,提出了一种异质信息融合网络嵌入的注意力偏好推荐方法(MFFHINE),通过联合优化矩阵分解模型和融合函数,可有效利用属性信息。进而采用了一种基于注意力机制的融合策略,将不同权重元路径产生的偏好特征有机融合,用于解决异质信息网络推理过程的局部稀疏不一致性问题。(2)针对基于异质信息网络推荐方法的信息缺失问题,提出了一种在异质信息网络中采用三角嵌入的高阶推荐方法(RLTE),通过多层级嵌入为指导的异质网络嵌入方法,分别利用skip-gram模型和局部三角化结构挖掘异质信息网络中隐藏的低阶和高阶关系,通过这些潜在信息的特征融合缓解信息缺失问题。(3)针对动态推荐过程中用户兴趣漂移的问题,提出了一种用时序因子追踪用户兴趣偏好的策略方法(DRLTE),结合三角高阶多层级信息融合进行动态推荐,解决兴趣漂移的不确定性问题。最后,全文工作以Python语言实现,并与相关的基准和SOTA推荐算法进行比较及参数分析,在真实大规模数据集实验也表明本文提出的相关模型方法有效可行。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码导航 ,原文地址:https://m.bishedaima.com/lunwen/56102.html