基于知识图谱补全的茶产品推荐研究
这是一篇关于茶产品,知识图谱补全,推荐模型,RSN,情感偏好的论文, 主要内容为中国是一个茶文化历史悠久的国家,茶产品的销量每年都在稳步提升。近年来,电商平台销售茶产品逐渐成为一种趋势,推荐系统的产生帮助用户在众多茶产品中,根据自身的喜好选择合适的产品。通过对茶产品相关信息的处理,推荐系统将符合用户需求的茶产品推荐给合适的用户,以提升用户的消费体验,增加商家的销售收入。当前的茶产品推荐系统尽管有了一定的发展,但仍然存在茶产品信息运用不充分,推荐性能不佳等问题。本文将知识图谱补全技术运用于茶产品推荐研究中,提出了一种基于知识图谱补全的茶产品推荐模型(Tea Product Recommendation Based on Knowledge Graph Completion,TRKGC)。模型在构建茶产品知识图谱基础上,运用从用户评论中提取的情感偏好指数,改进RSN知识图谱技术;运用R-GCN聚合节点邻域信息,并通过改进RSN的跳跃机制,捕获图谱路径上节点和边的信息,实现对用户和茶产品所在知识图谱的补全。最后比较补全节点与原有节点特征相似度,作为推荐的评价指标,进行茶产品的推荐。本文的研究工作主要有以下几点:(1)构建茶产品知识图谱,并进行可视化处理。首先,通过网络爬虫获取主流电商平台相关茶产品数据,提取用户对茶产品的评论等信息;然后,运用Word2Vec获取评论特征向量,并计算用户的情感偏好指数,以构建知识图谱数据集;在此基础上,运用Neo4j建立茶产品知识图谱的图数据库,同时进行可视化处理。(2)提出一种基于知识图谱补全技术的茶产品推荐模型(TRKGC)。在构建的茶产品知识图谱上,首先,运用R-GCN模型聚合用户和待推荐茶产品的邻域信息;然后,从用户评论中提取的情感偏好指数,来丰富图谱中相关路径的边信息,以改进RSN知识图谱补全技术,并通过RSN的跳跃机制对缺失的三元组进行补全;最后,比较补全节点和原节点的相似度,作为推荐指标,实现对茶产品的推荐。(3)评价TRKGC模型的有效性。通过从邻域节点的聚合范围、情感偏好指数等多方面进行实验,对本文所提出的TRKGC模型进行验证与评价。实验结果表明,与其它已有知识图谱推荐模型相比,茶产品知识图谱补全推荐模型TRKGC在NGDC及MRR等推荐指标上具有一定的优势。
基于注意力机制的鲁棒因子分解推荐模型
这是一篇关于推荐模型,特征工程,鲁棒性,对抗攻击,对抗样本,对抗训练的论文, 主要内容为随着互联网的发展和数据量的激增,如何从海量数据中快速筛选出用户感兴趣的商品和信息变得愈发迫切。人们对推荐系统的性能和鲁棒性要求也越来越高。同时,数据的爆发式增长使得特征数量也迅速增加,给推荐模型带来很大的挑战,而人工进行特征工程或处理特征之间的交互关系则非常耗时并且有很高的人工成本。如何利用机器学习模型自动地学习特征之间的关系,高效地从高维且高度稀疏的特征中学习到有用的信息成为了富有挑战性的课题。因子分解机模型通过对特征的二阶特征交互进行建模提供了一个高效的解决方案,但是仍然不能充分有效地学习到特征的高阶非线性的交互信息。虽然很多研究针对因子分解机模型提出了改进方案,但通常是假设特征的表征向量是相互独立的。此外,在利用大量特征输入构造推荐模型时,现有的研究仍然缺乏对有关推荐模型鲁棒性问题的讨论。针对这些问题和挑战,提出了一种基于注意力机制的因子分解推荐模型AttFM。通过结合多头自注意力网络和因子分解机模型的二阶交互网络,AttFM模型能够根据特征所处上下文环境对其表征向量进行动态适配,对特征进行差异化表达,具备更强的表达能力。实验结果表明,AttFM模型在常用公开数据集上均取得了更高的AUC值,推荐效果更优异。尽管AttFM模型取得了较好的推荐效果,但是有研究表明基于深度神经网络的机器学习模型鲁棒性较低,在实际应用中容易受到对抗样本的干扰。因此,设计了首个针对推荐领域的基于贪心策略的黑盒对抗攻击方法,测试了AttFM模型的鲁棒性。同时,在多个推荐模型上的对抗攻击实验表明该攻击方法具有一定的普适性。进一步地,通过生成一定数量的对抗样本并对所提出的推荐模型AttFM进行对抗训练,能够在保证AUC值基本不变的情况下显著提升AttFM模型的鲁棒性。
Research on Movie Recommendation Method Based on Convolution Neural Network and Long Short Term Memory Network
这是一篇关于推荐模型,神经网络,Text-CNN,LSTM,动态兴趣的论文, 主要内容为随着计算机技术尤其是网络技术的迅速发展,网络上的信息呈指数增长,信息过载问题越来越严重。对于用户而言,要想从海量数据中找到符合要求的数据可能就需要花费大量的时间。因此,推荐系统的研发迫在眉睫。推荐系统可以通过分析用户的特征以及历史的行为记录,从而分析出用户的兴趣进而对用户进行推荐。目前,推荐系统已经广泛应用于社会的各个领域,如电商、音乐、电影以及新闻推荐等。在电影领域,解决信息过载的一个重要方法就是电影推荐系统,它能根据用户的个人信息、平日的浏览痕迹以及评分内容等给用户推荐其可能会感兴趣的电影。在电影推荐系统中,推荐模型起到了至关重要的作用,它甚至会在一定的程度上决定推荐的质量。常见的推荐模型有很多,比如基于内容的推荐,协同过滤推荐以及混合推荐等。基于内容的推荐利用用户已选择的项目来寻找其他类似属性的项目进行推荐;协同过滤推荐利用用户与项目之间的交互信息为用户进行推荐。但是由于传统的推荐方法采用的浅层模型依赖于人工设计特征,其在提取数据特征时的有效性和可扩展性非常有限;此外,传统的推荐模型也无法学习到用户和项目的深层次特征。随着互联网中越来越多的数据能够被感知获取,包括文本、标签在内的多源异构数据,它们中都蕴含着丰富的用户行为信息和用户个性化需求信息,因此传统的推荐方法面临着巨大的挑战。近年来,深度学习在自然语言、图像处理等多个领域已经取得了突破性进展,为推荐系统的研究也带来了新的机会。深度学习能够学习一种深层次非线性网络结构来表征用户和项目之间的关系,获得它们的深层次特征表示,并且深度学习能够将多源异构数据映射到一个相同的隐空间,获得数据的统一表示,在此基础上融合传统的推荐方法.就能有效利用多源异构数据,并获得用户和项目的深层次特征表示,提高推荐系统的性能以及用户满意度。因此本文基于MovieLens的数据集,提出了基于神经网络的特征提取方法并与传统的推荐模型相结合对用户进行个性化推荐。根据MovieLens数据集的特征,系统首先对数据进行清理,将其中的半结构化数据、非结构化数据转化为神经网络可以处理的数据形式,并且将整体的数据集按照用户的评分时间顺序分为三大部分:训练集、验证集和测试集,训练集用于模型的训练,找出最优的模型参数;验证集用于模型的调参,找到最适合的超参数;测试集则用于体现模型的泛化性能。具体来说,数据集中包括了用户信息,电影信息以及用户对电影的评分信息,其中用户信息包括了用户的性别、年龄、职业等,电影信息包括了电影类别、标题等,评分信息中包括了用户对电影的评分数据,用户信息和电影信息分别能体现用户特征和电影特征,而评分信息能过体现用户对电影的兴趣。因此,系统首先根据用户性别、年龄、职业以及电影类别,将其中的非数字类型的字段转换为嵌入矩阵的索引,将其作为输入传入嵌入层,得到各自的嵌入层特征,拼接之后输入全连接层得到用户特征;对于电影特征,由于电影可以有多个类型,因此系统先将其处理成multi-hot编码的形式,并与嵌入层矩阵相乘得到电影类型特征,而对于电影标题,需要利用Text-CNN从中提取出电影的潜在文本特征,之后将各个特征拼接起来输入全连接层,获得电影特征向量。在分别得到用户特征以及电影特征之后,将其连接输入全连接层获得用户对电影的兴趣特征,并预测用户对电影的评分,将预测结果与真实评分做回归处理,采用MSE来评估模型的好坏。在训练集上训练完毕之后,在验证集上进行验证,从而找到最优超参数,包括学习率、卷积核的数量、神经元的数量以及模型深度等。在得到比较好的超参数之后,利用全部训练数据集以及验证数据集重新训练模型,并最终在测试集上得到模型的性能,并利用该模型提取出用户对电影的兴趣特征。利用得到的用户兴趣特征计算用户兴趣之间的余弦距离从而得到用户之间的相似度,针对特定的目标用户找到与其兴趣相似的邻居用户,对目标用户未看过的电影,将该用户与邻居用户之间的相似度与邻居用户对该电影的兴趣相乘作为目标用户对这部电影的感兴趣程度,并对其进行排序,找到目标用户最感兴趣的N部电影,对用户进行推荐。我们利用precision,recall以及F1值作为模型的评价指标,并将这一模型与传统的推荐模型进行对比,可以发现本系统提出的模型在推荐准确度上的确有所提高。在上述模型中我们通过用户的历史行为数据来预测用户对未知电影的兴趣偏好,但是在该模型中我们假设用户的兴趣是不变的并且没有考虑到用户历史行为的时间顺序以及用户兴趣的时间动态性。因此,我们又提出了一种基于用户动态兴趣的模型。根据用户行为体现用户兴趣的假设,将用户对电影的近期评分序列输入到LSTM网络中,从而提取出用户的短期兴趣特征。具体来说,本模型将用户近期评分的电影序列输入嵌入层,将高维稀疏的近期评分电影序列映射为低维稠密的近期评分电影嵌入向量,然后再将其输入到LSTM网络中,获得近期评分的电影序列的变化规律,也就是体现了用户的短期兴趣特征。之后,结合上个模型中根据用户基本特性提取出的用户特征,我们可以将其看作用户的长期兴趣特征,将用户的长、短期兴趣特征相结合,输入全连接层得到用户的动态兴趣特征,然后再与电影特征串联起来,并输入一个全连接层来预测用户对电影的评分情况,将得到的结果与真实的评分做回归,利用MSE值来评判模型的好坏。接着,在训练集上训练模型并在验证集上进行验证,以便找到最优超参数,包括学习率、序列长度、隐藏层结点个数,网络深度等。在得到最优模型之后,我们利用全部的训练集以及验证集数据对模型进行重新训练,最终在测试集上得到模型的评价标准,并提取出用户对电影的兴趣特征。在得到用户对电影的兴趣特征之后,依然计算用户之间的cosine相似度找到目标用户的邻居,并根据邻居对电影的感兴趣程度得到目标用户对电影的兴趣,并对其进行排序进top-N推荐。我们用precision,recall,F1值作为推荐模型好坏的评价标准,并分析了当推荐电影的数量不同时,模型的推荐性能是否发生变化。最后,我们将本模型与传统的推荐算法模型以及上一章中所提出的模型进行对比,发现本模型在推荐准确度上的确有所提高。此外,本文还设计了一个电影推荐系统,使得用户可以通过浏览器登录系统并浏览电影相关信息,系统也会根据用户的登录信息对用户进行个性化推荐。该系统主要是基于B/S架构,主要包括三部分内容:表示层,逻辑层以及数据层。其中,表示层以浏览网页的形式与用户或者管理者进行交互,为其提供了各式服务包括注册、登录、浏览、添加等。逻辑层是表示层和数据层之间连接的桥梁,是整个体系结构的核心模块,主要又可以分为信息管理、智能推荐以及数据分析处理等。数据层是用于实现数据的存储和读取操作,在本系统中主要包括了用户数据、电影数据以及用户评分数据。具体来说,用户通过网页输入用户名以及密码等相关信息,这些信息会传送到后台进行验证,判断在用户信息表中是否已经存在该用户的注册信息,若未存在该用户的相关信息或者用户名和密码并不对应则返回登录失败;若用户名和密码相对应则该用户即可登录进入系统主页面。在进入主页面之后用户可浏览相关电影信息也可以查看到与自己相关的个人信息,并且系统会根据该用户的个人信息为其生成个性化推荐,主要包括三方面的内容:其它用户近期看的最多的前20部电影,其它用户近期平均打分最高的前20部电影以及根据前两章的推荐算法计算得到的该用户可能会喜欢的10部电影。与传统的推荐模型相比,本文提出的模型在性能上均有一定的提高,但仍存在一些不足。首先,本文没有考虑用户行为的时间间隔。如果在特征提取中加入实际的时间间隔信息,可以帮助模型更好地了解用户感兴趣的变化规律。其次,在训练数据量大、隐藏层节点多的情况下,神经网络的训练需要大量的时间。如何提高网络的培训效率是一个值得进一步研究的问题。最后,本文提出的算法仅适用于电影推荐系统,不适用于其他领域,需要进一步改进模型的通用性。
数据驱动的可视化推荐方法研究
这是一篇关于可视化推荐,数据可视化,机器学习,可视化设计,推荐模型的论文, 主要内容为随着大数据时代的到来,数据的价值对于人们愈发重要,人们无时无刻都在产生数据。数据可视化是将数据的联系与趋势,十分生动的、美观的呈现给人们,让使用者发掘数据中的信息。但是在数据可视化的过程当中,高额的学习成本和数据处理的工作量过大的问题,成为数据可视化发展的难题。而如今的可视化系统,旨在解决可视化过程中的编码问题,无法解决数据分析,可视化呈现方式以及可视化推荐的问题。针对数据利用率低,可视化成本高和可视化结果的准确性问题,本文对数据驱动的自动可视化技术进行了深入的研究。本文首先从可视化的基础理论和相关技术出发,根据国内外的研究现状总结了可视化推荐的技术在自动生成可视化结果时面临的挑战。针对这些问题,本文对可视化的数据进行分析,提取数据特征,并采用机器学习的方式建立数据驱动的可视化模型,以解决可视化在选择上的问题,让机器代替人们进行可视化设计决策。并在此基础上,设计可视化推荐系统,自动生成出可视化结果推荐给用户,以解决可视编码和可视推荐的问题。最后通过不同类型的数据,与其他可视化推荐模型的结果对比验证,以验证可视化推荐方面的准确性的问题。本文的贡献主要在以下三方面:(1)数据驱动的可视化推荐模型:本文提出了一种可视化推荐模型,并建立了基于数据驱动的可视化特征集,以机器学习的排名算法作为模型的整体框架,优化了算法的使用,用于分析生成良好的可视化结果。同时,为了提升模型的整体效率与推荐的准确率,还在模型中应用了权重参数,对推荐的模型进行加权排名,解决可视选择的问题。最后通过验证证明,本模型在可视化推荐方面,可以进行有效的结果推荐,并能提高推荐结果的准确率与效率。(2)可视化推荐系统:本文在推荐模型的基础上设计并实现了基于web的可视化推荐系统。通过对可视化推荐系统的设计,将系统进行模块划分,系统被设计成了5个功能模块,实现了数据导向的可视化结果推荐。通过本系统,使用者可以通过输入数据获得自动推荐的准确的可视化生成结果,同时也可以通过对结果进行评价以影响推荐排名。(3)纵向对比实验和横向对比实验:为了验证系统推荐结果的准确性,本文采用不同的指标评价推荐结果的准确性,更全面的对模型和系统进行评估。通过对比实验,一方面可以比较推荐模型结果的准确性,另一方面可以比较用户对不同可视化系统的偏好程度。
基于知识图谱补全的茶产品推荐研究
这是一篇关于茶产品,知识图谱补全,推荐模型,RSN,情感偏好的论文, 主要内容为中国是一个茶文化历史悠久的国家,茶产品的销量每年都在稳步提升。近年来,电商平台销售茶产品逐渐成为一种趋势,推荐系统的产生帮助用户在众多茶产品中,根据自身的喜好选择合适的产品。通过对茶产品相关信息的处理,推荐系统将符合用户需求的茶产品推荐给合适的用户,以提升用户的消费体验,增加商家的销售收入。当前的茶产品推荐系统尽管有了一定的发展,但仍然存在茶产品信息运用不充分,推荐性能不佳等问题。本文将知识图谱补全技术运用于茶产品推荐研究中,提出了一种基于知识图谱补全的茶产品推荐模型(Tea Product Recommendation Based on Knowledge Graph Completion,TRKGC)。模型在构建茶产品知识图谱基础上,运用从用户评论中提取的情感偏好指数,改进RSN知识图谱技术;运用R-GCN聚合节点邻域信息,并通过改进RSN的跳跃机制,捕获图谱路径上节点和边的信息,实现对用户和茶产品所在知识图谱的补全。最后比较补全节点与原有节点特征相似度,作为推荐的评价指标,进行茶产品的推荐。本文的研究工作主要有以下几点:(1)构建茶产品知识图谱,并进行可视化处理。首先,通过网络爬虫获取主流电商平台相关茶产品数据,提取用户对茶产品的评论等信息;然后,运用Word2Vec获取评论特征向量,并计算用户的情感偏好指数,以构建知识图谱数据集;在此基础上,运用Neo4j建立茶产品知识图谱的图数据库,同时进行可视化处理。(2)提出一种基于知识图谱补全技术的茶产品推荐模型(TRKGC)。在构建的茶产品知识图谱上,首先,运用R-GCN模型聚合用户和待推荐茶产品的邻域信息;然后,从用户评论中提取的情感偏好指数,来丰富图谱中相关路径的边信息,以改进RSN知识图谱补全技术,并通过RSN的跳跃机制对缺失的三元组进行补全;最后,比较补全节点和原节点的相似度,作为推荐指标,实现对茶产品的推荐。(3)评价TRKGC模型的有效性。通过从邻域节点的聚合范围、情感偏好指数等多方面进行实验,对本文所提出的TRKGC模型进行验证与评价。实验结果表明,与其它已有知识图谱推荐模型相比,茶产品知识图谱补全推荐模型TRKGC在NGDC及MRR等推荐指标上具有一定的优势。
面向移动端的外卖商品推荐模型管理与监控系统的设计与实现
这是一篇关于推荐模型,移动端,模型管理,模型监控,自动召回的论文, 主要内容为随着移动互联网技术的飞速发展,网络平台上的信息量呈现指数级增长,特别是自疫情爆发以来,以到店为主的线下消费场景受到重创,人们的消费观念逐渐向更为便捷的线上消费转变。绝大部分互联网公司为捕捉用户消费倾向,提高企业经济效益,往往会在用户终端植入交互式推荐的元素,然而,对于推荐决策的核心——推荐模型,业界缺乏一种完备且高效的管理与监控工具,以应对模型多终端上线的场景或规避模型上线后效果未达预期所带来的风险。针对上述问题,本文设计与实现了一款面向移动端的外卖商品推荐模型管理与监控系统,主要服务于公司外卖业务,旨在帮助算法开发人员有效管理与监控模型训练、发布、召回的一整套流程,并在线上效果未达预期时及时做出干预行为。本系统采集用户手势数据和商品数据,同时借助“道格拉斯-普克”算法过滤无效手势数据,并通过Redis将特征数据下发给算法开发人员。本系统将算法开发人员构建并训练的原始模型分别转换成能够在Android和iOS系统上运行的模型并发布至用户终端。本系统提供一套完备的可视化监控机制,帮助算法开发人员实时感知线上模型的运行状况。此外,若某一版本模型上线后效果未达预期,本系统将启动预警或召回机制,自动预警或召回该模型并通知算法开发人员。本系统基于React框架和Spring Boot框架实现前端Web平台和后端业务服务,维护了系统良好扩展性。前端借助ECharts组件实现数据可视化,后端主要可分为特征管理、模型管理、发布管理和模型监控四个模块,各模块借助限流熔断等措施保障系统可用性,并通过RPC的形式对外提供服务。目前,本系统已部署至公司私有云平台并上线运行,算法开发人员可通过个人MIS账户登入系统。长期试运行表明,本系统显著提高了算法开发人员的模型开发与发布效率,并能够在某一版本模型运行效果未达预期时自动触发预警或召回机制,有效规避线上生产风险,满足交付预期。
木材产业生态链平台的研究与实现
这是一篇关于木材产业生态链,大宗交易,监管模式,推荐模型,聚类集成的论文, 主要内容为木材产业是我国经济的重要组成部分,提高木材企业的竞争力,有利于促进木材产业的整体发展。为了拥抱“互联网+”以及电子商务,应为木材企业提供符合该行业实际需要的线上木材交易平台,帮助它们提高竞争力及影响力;同时,当前我国政府政策对木材企业的原料来源及加工工艺等提出了严格的要求,因此结合国内生态环保政策、木材产业链、木材大宗交易模式三方面的特色开发出的线上平台具有较强的实际意义。本文通过在传统木材产业链的基础上融入对生态环境的关怀,研究了木材产业生态链的概念,并将该概念与木材大宗交易中的“卖方挂牌”模式相结合,改良出了一种B2B交易模式:在木材供货商与采购商的大宗交易中加入第三方,由第三方负责监管木材产品从木材产业生态链首端到尾端过程中的所有环节,通过合同约束各方行为,保证最终的产品“原料清白、加工环保、质量可靠”。在上述基础上,为进一步帮助优秀木材供货商扩大影响力,本文研究了基于超级扩展谱聚类集成算法的木材供货商推荐模型,该模型使用木材采购商对供货商的评分大数据作为输入,通过聚类集成模型筛选出优秀供货商并推荐到平台首页。在真实数据集上运行的模型选择实验结果表明,超级扩展谱聚类集成算法在评分大数据上的聚类效果优于单一聚类算法及其它经典聚类集成算法,使用该算法能更有效地筛选出优秀供货商。在充分研究当前国内外木材线上交易平台特性、木材产业链相关概念、木材产业环保政策以及聚类集成算法的基础上,本文基于SSM及分布式服务框架实现了木材产业生态链平台。通过测试,该平台满足了需求分析及系统设计时的预期要求,能较好地服务木材生态链上的各类角色,引入的木材供货商推荐机制能帮助优秀供货商获得更多的用户流量,有利于促进本平台内供货商的竞争与进步。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设客栈 ,原文地址:https://m.bishedaima.com/lunwen/46191.html