基于知识图谱的影视推荐算法
这是一篇关于推荐算法,知识图谱,向量嵌入,邻域聚合的论文, 主要内容为科技带来便利,同时数据量的激增也导致信息过载问题。面对纷繁的信息时,用户常难以迅速搜寻到所需,而搜索工具的使用需要一定预备知识,在一些场景中不太适用,在此背景下推荐系统应运而生。推荐系统会根据用户行为进行兴趣建模,无需关键字就能得到个性化推荐序列,如视频软件或电商平台的推荐项目,对电影评分后出现的“猜你喜欢”弹窗等。传统的推荐算法易受数据稀疏、冷启动等问题影响,难以保证结果的准确度。知识图谱是一种基于知识元组的新型检索技术,有着丰富的语义信息和结构关联性,可以为上述问题带来新的探索方向。本文对基于知识图谱的影视推荐算法展开研究,主要工作如下:(1)构建了中文电影知识图谱。目前公开的影视知识图谱多根据Movie Lens等外文电影数据集制作,本文尝试根据豆瓣电影信息构建中文影视知识图谱。首先,进行数据抓取,获得大量电影信息,存入本地数据库。然后,定义实体和关系类型,建立知识三元组。最后,将数据表导入图数据库Neo4j,进行知识图谱的可视化展示。(2)提出了基于知识图谱的推荐算法。受矩阵分解做推荐预测的思路启发,研究用户和电影的表示学习,改进基于嵌入的知识图谱应用方法。首先,对用户和三元组进行向量嵌入,提取用户偏好,作为权重聚合实体邻域,获得电影实体的最终表示向量,然后和用户向量一起参与评分预测。最后,在豆瓣电影与Movie Lens数据集上进行测试。结果显示,与两种同类算法对比,本文算法在性能指标和运行效率上更有优势。
基于元信息的志愿服务推荐系统研究与实现
这是一篇关于志愿服务,元信息,异质信息图谱,向量嵌入,混合推荐的论文, 主要内容为近十余年间,我国志愿服务领域持续处于高速发展阶段:截至2019年,中国志愿服务信息系统中已经积累了约1.2亿名志愿者、73万个志愿团体以及232万个志愿项目的海量数据。如此的数据规模充分表明志愿服务已经逐步发展成为我国社会服务领域的重要组成部分。然而,立足于移动互联网飞速发展的背景,与其他同样拥有海量服务对象的领域相比,志愿服务领域并没有受到足够的关注:就推荐应用而言,各业的服务提供商和研究者们已经在电商、视频、音乐等领域具备较为成熟的研究基础,并开发出相应的推荐系统以改善用户体验;相反地,到目前为止,手动筛选仍然是当下志愿者挑选志愿项目的主要方式,多数志愿服务网站仅能提供随机项目或热门项目推荐,并且在所推荐的项目列表中,甚至还会存在已经停止招募的无效推荐。面对志愿服务信息化、智能化发展相对滞后的现状,如何处理并应用志愿服务海量数据,更有效地反哺助力志愿服务领域发展,成为一项亟待解决的问题。本文聚焦于推荐应用,通过对志愿服务数据源开展多角度分析,归纳志愿服务领域于推荐系统研究的独特性及随之产生的问题;并结合近年来广受关注的知识图谱概念,对应地从算法模型与系统设计的角度提出解决方案,为志愿者提供个性化推荐服务。对志愿服务信息化和智慧城市建设具有一定的参考价值。论文的主要工作包括以下内容:一、对中国志愿服务数据源进行分析工作,分别从整体层面,志愿者角度,志愿项目角度,以及二者间交互关系角度四个方面总结该领域特征,存在的问题及可能存在的解决方案,为后续研究讨论奠定理论基础;同时,设计逐日模拟的测试方案,提出更具现实意义的“成功率”评价指标,并依照测试方案抽取实验数据集,为后续研究讨论奠定数据基础。二、基于志愿服务数据的多方位分析,提出基于异质元信息用户嵌入模型的推荐方法CMeta-User2vec,引入志愿者属性元信息构建多元异质信息图谱,结合Word2Vec模型将志愿者嵌入到低维向量空间,以应对志愿服务领域存在的数据稀疏性和冷启动问题。在抽取的实验数据集上以逐日模拟的方式进行测试,与近些年提出的同样可以应对类似问题的推荐算法如 CFKG、HI2Rec、Product2vec、metapath2vec等进行对比,从成功率、召回率、覆盖率等角度验证所提方法的有效性:在实验数据集上,所提方法的平均推荐成功率高达59.96%。最后,还通过补充实验验证了所提向量嵌入模型自身所具备的更广泛的应用普适性:如用于深度学习模型的输入向量预训练等。三、结合混合推荐系统于实际项目生产中的广泛应用,进一步丰富异质信息图谱,引入项目属性元信息构建层次异质信息图谱并在此基础上提出MulGRS混合推荐系统:对单体的传统协同过滤算法,PersonalRank随机游走算法等推荐模型进行适配性改进,以根据志愿者的项目参与状态划分不同情境构建相应的混合推荐模型,进而生成推荐。在这样的设计中,通过多算法的相互配合弥补单一模型的不足,以应对冷启动问题并提升整体的推荐成功率;底层的多层次网络存储结构帮助缓解数据稀疏性问题的同时,图结构相关的过滤操作也有助于提升各个推荐模型的执行效率。在同样的实验数据集上与传统Switching Hybrid、Weighted Hybrid、TransE-CF 等混合推荐系统进行对比,验证所提方法的有效性:在实验数据集上,所提方法的平均推荐成功率高达71.04%。最后,对比了所提两种方法的优劣利弊:不存在适配所有应用场景的方法,总是需要结合具体需求选择合适的推荐模型。四、基于所提出的两种方案,设计并实现志愿服务可视化推荐系统,为志愿者提供项目的多级推荐以及相关信息的个性化展示和检索服务。在多级推荐服务中,MulGRS为志愿者提供实时推荐,CMeta-User2vec为志愿者提供离线推荐,通过对服务器负载的监控进行推荐算法的切换,保证推荐服务的可用性。同时推荐结果将以“志愿者—中间实体—推荐项目”的最短推荐路径可视化形式呈现,提示志愿者推荐理由,增强推荐服务的可解释性。
基于元信息的志愿服务推荐系统研究与实现
这是一篇关于志愿服务,元信息,异质信息图谱,向量嵌入,混合推荐的论文, 主要内容为近十余年间,我国志愿服务领域持续处于高速发展阶段:截至2019年,中国志愿服务信息系统中已经积累了约1.2亿名志愿者、73万个志愿团体以及232万个志愿项目的海量数据。如此的数据规模充分表明志愿服务已经逐步发展成为我国社会服务领域的重要组成部分。然而,立足于移动互联网飞速发展的背景,与其他同样拥有海量服务对象的领域相比,志愿服务领域并没有受到足够的关注:就推荐应用而言,各业的服务提供商和研究者们已经在电商、视频、音乐等领域具备较为成熟的研究基础,并开发出相应的推荐系统以改善用户体验;相反地,到目前为止,手动筛选仍然是当下志愿者挑选志愿项目的主要方式,多数志愿服务网站仅能提供随机项目或热门项目推荐,并且在所推荐的项目列表中,甚至还会存在已经停止招募的无效推荐。面对志愿服务信息化、智能化发展相对滞后的现状,如何处理并应用志愿服务海量数据,更有效地反哺助力志愿服务领域发展,成为一项亟待解决的问题。本文聚焦于推荐应用,通过对志愿服务数据源开展多角度分析,归纳志愿服务领域于推荐系统研究的独特性及随之产生的问题;并结合近年来广受关注的知识图谱概念,对应地从算法模型与系统设计的角度提出解决方案,为志愿者提供个性化推荐服务。对志愿服务信息化和智慧城市建设具有一定的参考价值。论文的主要工作包括以下内容:一、对中国志愿服务数据源进行分析工作,分别从整体层面,志愿者角度,志愿项目角度,以及二者间交互关系角度四个方面总结该领域特征,存在的问题及可能存在的解决方案,为后续研究讨论奠定理论基础;同时,设计逐日模拟的测试方案,提出更具现实意义的“成功率”评价指标,并依照测试方案抽取实验数据集,为后续研究讨论奠定数据基础。二、基于志愿服务数据的多方位分析,提出基于异质元信息用户嵌入模型的推荐方法CMeta-User2vec,引入志愿者属性元信息构建多元异质信息图谱,结合Word2Vec模型将志愿者嵌入到低维向量空间,以应对志愿服务领域存在的数据稀疏性和冷启动问题。在抽取的实验数据集上以逐日模拟的方式进行测试,与近些年提出的同样可以应对类似问题的推荐算法如 CFKG、HI2Rec、Product2vec、metapath2vec等进行对比,从成功率、召回率、覆盖率等角度验证所提方法的有效性:在实验数据集上,所提方法的平均推荐成功率高达59.96%。最后,还通过补充实验验证了所提向量嵌入模型自身所具备的更广泛的应用普适性:如用于深度学习模型的输入向量预训练等。三、结合混合推荐系统于实际项目生产中的广泛应用,进一步丰富异质信息图谱,引入项目属性元信息构建层次异质信息图谱并在此基础上提出MulGRS混合推荐系统:对单体的传统协同过滤算法,PersonalRank随机游走算法等推荐模型进行适配性改进,以根据志愿者的项目参与状态划分不同情境构建相应的混合推荐模型,进而生成推荐。在这样的设计中,通过多算法的相互配合弥补单一模型的不足,以应对冷启动问题并提升整体的推荐成功率;底层的多层次网络存储结构帮助缓解数据稀疏性问题的同时,图结构相关的过滤操作也有助于提升各个推荐模型的执行效率。在同样的实验数据集上与传统Switching Hybrid、Weighted Hybrid、TransE-CF 等混合推荐系统进行对比,验证所提方法的有效性:在实验数据集上,所提方法的平均推荐成功率高达71.04%。最后,对比了所提两种方法的优劣利弊:不存在适配所有应用场景的方法,总是需要结合具体需求选择合适的推荐模型。四、基于所提出的两种方案,设计并实现志愿服务可视化推荐系统,为志愿者提供项目的多级推荐以及相关信息的个性化展示和检索服务。在多级推荐服务中,MulGRS为志愿者提供实时推荐,CMeta-User2vec为志愿者提供离线推荐,通过对服务器负载的监控进行推荐算法的切换,保证推荐服务的可用性。同时推荐结果将以“志愿者—中间实体—推荐项目”的最短推荐路径可视化形式呈现,提示志愿者推荐理由,增强推荐服务的可解释性。
基于元信息的志愿服务推荐系统研究与实现
这是一篇关于志愿服务,元信息,异质信息图谱,向量嵌入,混合推荐的论文, 主要内容为近十余年间,我国志愿服务领域持续处于高速发展阶段:截至2019年,中国志愿服务信息系统中已经积累了约1.2亿名志愿者、73万个志愿团体以及232万个志愿项目的海量数据。如此的数据规模充分表明志愿服务已经逐步发展成为我国社会服务领域的重要组成部分。然而,立足于移动互联网飞速发展的背景,与其他同样拥有海量服务对象的领域相比,志愿服务领域并没有受到足够的关注:就推荐应用而言,各业的服务提供商和研究者们已经在电商、视频、音乐等领域具备较为成熟的研究基础,并开发出相应的推荐系统以改善用户体验;相反地,到目前为止,手动筛选仍然是当下志愿者挑选志愿项目的主要方式,多数志愿服务网站仅能提供随机项目或热门项目推荐,并且在所推荐的项目列表中,甚至还会存在已经停止招募的无效推荐。面对志愿服务信息化、智能化发展相对滞后的现状,如何处理并应用志愿服务海量数据,更有效地反哺助力志愿服务领域发展,成为一项亟待解决的问题。本文聚焦于推荐应用,通过对志愿服务数据源开展多角度分析,归纳志愿服务领域于推荐系统研究的独特性及随之产生的问题;并结合近年来广受关注的知识图谱概念,对应地从算法模型与系统设计的角度提出解决方案,为志愿者提供个性化推荐服务。对志愿服务信息化和智慧城市建设具有一定的参考价值。论文的主要工作包括以下内容:一、对中国志愿服务数据源进行分析工作,分别从整体层面,志愿者角度,志愿项目角度,以及二者间交互关系角度四个方面总结该领域特征,存在的问题及可能存在的解决方案,为后续研究讨论奠定理论基础;同时,设计逐日模拟的测试方案,提出更具现实意义的“成功率”评价指标,并依照测试方案抽取实验数据集,为后续研究讨论奠定数据基础。二、基于志愿服务数据的多方位分析,提出基于异质元信息用户嵌入模型的推荐方法CMeta-User2vec,引入志愿者属性元信息构建多元异质信息图谱,结合Word2Vec模型将志愿者嵌入到低维向量空间,以应对志愿服务领域存在的数据稀疏性和冷启动问题。在抽取的实验数据集上以逐日模拟的方式进行测试,与近些年提出的同样可以应对类似问题的推荐算法如 CFKG、HI2Rec、Product2vec、metapath2vec等进行对比,从成功率、召回率、覆盖率等角度验证所提方法的有效性:在实验数据集上,所提方法的平均推荐成功率高达59.96%。最后,还通过补充实验验证了所提向量嵌入模型自身所具备的更广泛的应用普适性:如用于深度学习模型的输入向量预训练等。三、结合混合推荐系统于实际项目生产中的广泛应用,进一步丰富异质信息图谱,引入项目属性元信息构建层次异质信息图谱并在此基础上提出MulGRS混合推荐系统:对单体的传统协同过滤算法,PersonalRank随机游走算法等推荐模型进行适配性改进,以根据志愿者的项目参与状态划分不同情境构建相应的混合推荐模型,进而生成推荐。在这样的设计中,通过多算法的相互配合弥补单一模型的不足,以应对冷启动问题并提升整体的推荐成功率;底层的多层次网络存储结构帮助缓解数据稀疏性问题的同时,图结构相关的过滤操作也有助于提升各个推荐模型的执行效率。在同样的实验数据集上与传统Switching Hybrid、Weighted Hybrid、TransE-CF 等混合推荐系统进行对比,验证所提方法的有效性:在实验数据集上,所提方法的平均推荐成功率高达71.04%。最后,对比了所提两种方法的优劣利弊:不存在适配所有应用场景的方法,总是需要结合具体需求选择合适的推荐模型。四、基于所提出的两种方案,设计并实现志愿服务可视化推荐系统,为志愿者提供项目的多级推荐以及相关信息的个性化展示和检索服务。在多级推荐服务中,MulGRS为志愿者提供实时推荐,CMeta-User2vec为志愿者提供离线推荐,通过对服务器负载的监控进行推荐算法的切换,保证推荐服务的可用性。同时推荐结果将以“志愿者—中间实体—推荐项目”的最短推荐路径可视化形式呈现,提示志愿者推荐理由,增强推荐服务的可解释性。
基于知识图谱的影视推荐算法
这是一篇关于推荐算法,知识图谱,向量嵌入,邻域聚合的论文, 主要内容为科技带来便利,同时数据量的激增也导致信息过载问题。面对纷繁的信息时,用户常难以迅速搜寻到所需,而搜索工具的使用需要一定预备知识,在一些场景中不太适用,在此背景下推荐系统应运而生。推荐系统会根据用户行为进行兴趣建模,无需关键字就能得到个性化推荐序列,如视频软件或电商平台的推荐项目,对电影评分后出现的“猜你喜欢”弹窗等。传统的推荐算法易受数据稀疏、冷启动等问题影响,难以保证结果的准确度。知识图谱是一种基于知识元组的新型检索技术,有着丰富的语义信息和结构关联性,可以为上述问题带来新的探索方向。本文对基于知识图谱的影视推荐算法展开研究,主要工作如下:(1)构建了中文电影知识图谱。目前公开的影视知识图谱多根据Movie Lens等外文电影数据集制作,本文尝试根据豆瓣电影信息构建中文影视知识图谱。首先,进行数据抓取,获得大量电影信息,存入本地数据库。然后,定义实体和关系类型,建立知识三元组。最后,将数据表导入图数据库Neo4j,进行知识图谱的可视化展示。(2)提出了基于知识图谱的推荐算法。受矩阵分解做推荐预测的思路启发,研究用户和电影的表示学习,改进基于嵌入的知识图谱应用方法。首先,对用户和三元组进行向量嵌入,提取用户偏好,作为权重聚合实体邻域,获得电影实体的最终表示向量,然后和用户向量一起参与评分预测。最后,在豆瓣电影与Movie Lens数据集上进行测试。结果显示,与两种同类算法对比,本文算法在性能指标和运行效率上更有优势。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计货栈 ,原文地址:https://m.bishedaima.com/lunwen/55997.html