基于流处理和深度学习的推荐系统研究
这是一篇关于推荐系统,Flink,注意力机制,FFM,Graph Embedding,FTRL的论文, 主要内容为近些年由于互联网的快速发展,其在为我们提供便利的同时也到导致了“信息过载”的问题,而推荐系统就是为了在海量数据的情况下将用户感兴趣的物品快速准确地推荐给用户。近些年深度学习与流处理框架在推荐领域被广泛应用,相比于传统推荐模型,深度学习推荐模型表达能力更强。相比于传统的大数据处理框架,流处理框架能够更加及时地获取用户兴趣的实时变化,提升推荐系统推荐的实时性与准确性。目前的推荐系统存在以下几点问题:(1)模型输出部分对交叉特征无差别求和,忽视了不同特征对结果影响的重要程度不同(2)深度学习模型难以有效地学习高阶的组合特征(3)传统Embedding编码方式难以对图结构候选集编码(4)目前大数据处理框架在用户数据收集上实时性不足。针对以上问题,本文主要工作如下:1.针对模型对输入特征无差别求和的问题本文提出了一种基于注意力机制的AFFM(Attentional Field-aware Factorization Macheine)模型。AFFM模型使用了线性与非线性双网络并行训练的结构,在模型中引入了注意力机制使得模型能够对不同特征计算出不同的权重,提升重要特征对推荐结果的影响。针对模型无法有效学习高阶特征的问题引入FFM(Field-aware Factorization Machines)作为AFFM模型的线性侧算法实现提升模型的特征交叉能力,FFM引入了特征域感知使模型能够更加有效的学习高阶组合特征,提高模型表达能力。2.针对传统Embedding无法很好的处理处理图结构特征数据的问题,本文引入了Graph Embedding的编码方式对图结构中的节点进行Embedding编码。通过Graph Embedding生成的节点Embedding包含了图中的关系信息以及邻近节点局部相似性特征,使得模型推荐结果更加准确。3.针对推荐系统实时性不高,用户兴趣无法实时反映到推荐结果的问题,本文使用流式计算框架Flink实时收集用户行为数据并更新模型,同时引入了FTRL(Follow The Regularized Lead)在线学习算法优化实时推荐,FTRL优化算法能够解决模型稀疏性的问题,提升模型推荐的实时性与精确性。4.对本文推荐系统进行需求分析,设计并实现基于流处理与深度学习的推荐系统,系统包含系统业务模块、推荐模块与数据收集模块,其中系统业务模块使用Spring Cloud实现,推荐模块使用Graph Embedding进行特征Embedding向量的生成与召回层实现,使用AFFM模型作为离线推荐排序层实现,并使用FTRL算法对实时推荐进行优化。
基于流处理和深度学习的推荐系统研究
这是一篇关于推荐系统,Flink,注意力机制,FFM,Graph Embedding,FTRL的论文, 主要内容为近些年由于互联网的快速发展,其在为我们提供便利的同时也到导致了“信息过载”的问题,而推荐系统就是为了在海量数据的情况下将用户感兴趣的物品快速准确地推荐给用户。近些年深度学习与流处理框架在推荐领域被广泛应用,相比于传统推荐模型,深度学习推荐模型表达能力更强。相比于传统的大数据处理框架,流处理框架能够更加及时地获取用户兴趣的实时变化,提升推荐系统推荐的实时性与准确性。目前的推荐系统存在以下几点问题:(1)模型输出部分对交叉特征无差别求和,忽视了不同特征对结果影响的重要程度不同(2)深度学习模型难以有效地学习高阶的组合特征(3)传统Embedding编码方式难以对图结构候选集编码(4)目前大数据处理框架在用户数据收集上实时性不足。针对以上问题,本文主要工作如下:1.针对模型对输入特征无差别求和的问题本文提出了一种基于注意力机制的AFFM(Attentional Field-aware Factorization Macheine)模型。AFFM模型使用了线性与非线性双网络并行训练的结构,在模型中引入了注意力机制使得模型能够对不同特征计算出不同的权重,提升重要特征对推荐结果的影响。针对模型无法有效学习高阶特征的问题引入FFM(Field-aware Factorization Machines)作为AFFM模型的线性侧算法实现提升模型的特征交叉能力,FFM引入了特征域感知使模型能够更加有效的学习高阶组合特征,提高模型表达能力。2.针对传统Embedding无法很好的处理处理图结构特征数据的问题,本文引入了Graph Embedding的编码方式对图结构中的节点进行Embedding编码。通过Graph Embedding生成的节点Embedding包含了图中的关系信息以及邻近节点局部相似性特征,使得模型推荐结果更加准确。3.针对推荐系统实时性不高,用户兴趣无法实时反映到推荐结果的问题,本文使用流式计算框架Flink实时收集用户行为数据并更新模型,同时引入了FTRL(Follow The Regularized Lead)在线学习算法优化实时推荐,FTRL优化算法能够解决模型稀疏性的问题,提升模型推荐的实时性与精确性。4.对本文推荐系统进行需求分析,设计并实现基于流处理与深度学习的推荐系统,系统包含系统业务模块、推荐模块与数据收集模块,其中系统业务模块使用Spring Cloud实现,推荐模块使用Graph Embedding进行特征Embedding向量的生成与召回层实现,使用AFFM模型作为离线推荐排序层实现,并使用FTRL算法对实时推荐进行优化。
面向机械加工线产品质量分析的知识图谱构建
这是一篇关于加工线知识图谱,质量分析,FTRL,CATBoost的论文, 主要内容为机械产品加工线随着工业的不断发展和进步实现了自动化和信息化。加工线加工/检测过程中的每一步操作都会产生数据,如果不能对这些数据加以有效利用,那么不但浪费数据,而且是对存储资源的消耗。加工线数据的存储、查询及从中获取诸如合格率等质量指标的分析无疑是工业生产过程中人们关注的重点问题。面向机械加工线产品质量分析的知识图谱可以对产生的数据进行处理和存储,进行质量分析,得到产品合格率、关键工位等信息,还可以以直观方便的方法实现数据的查询。构建这样一个知识图谱首先需要针对加工线的特性进行实体、属性的提取,并且分析数据提取数据的隐藏属性。在数据处理阶段引入One-Hot编码技术和FTRL算法对数据进行预处理起到了数据降维的作用。随后的质量分析引入CATBoost算法对预处理后的数据进行知识挖掘,对工件的质量信息(合格率)进行分析,并且对比不同的方法验证FTRL算法结合CATBoost算法的效果。同时根据不同特征加工对工件最终质量合格的贡献度分析出关键工位,并且基于上述分析提取出工件是否合格和是否为关键工位的属性。基于前两步提取的知识和加工线专业知识进行实体、关系和属性的详细定义,构建了加工线知识图谱,采用Neo4j数据库实现数据的存储和查询,支持增加、删除、查询、修改操作以便于加工线知识图谱的管理。最终基于实际加工线数据建立了一个具有加工线数据存储、查询以及获取工件质量等相关指标功能的知识图谱。
个性化信息推荐系统的设计与实现
这是一篇关于个性化推荐系统,推荐算法,DSSM,FTRL的论文, 主要内容为伴随移动互联网与微型计算终端的兴盛,信息化时代的来临大大增强了人们接受信息的数量。如今,信息过载发展为互联网中最严重的问题之一,大部分发布在互联网中的信息逃不过被淹没的命运,用户面对庞大的信息体量也难以定位到自己想要的信息。推荐系统的诞生部分解决了这个困境。本系统(个性化信息推荐系统)为二者提供了一个解决方案,通过健壮灵活的推荐系统架构设计,为开发运营人员提供可以快速配置推荐策略的推荐系统后台。同时该系统本质上是服务于信息消费者,为用户提供个性化的信息方案。经过对本系统的分析,本系统设计为用户画像、在线推荐引擎、离线计算、流量分配四个模块。(1)用户画像模块:从用户行为日志中提取用户画像,生成用户人口统计学画像和不同时间窗口下的用户兴趣画像。(2)在线推荐引擎模块:向读者推荐个性化信息列表,推荐流程设计为候选生成、选择召回、规则过滤、精确打分、融合排序四个步骤。选择召回使用了基于DSSM的预估模型,精确打分使用了基于LR的停留时长预估模型同时使用FTRL方法进行训练。(3)离线计算模块:离线计算在线推荐引擎中所使用到的模型,为在线推荐功能提供模型参数,设计以下四个功能:日志加工、特征生成、样本生成以及模型训练。(4)流量分配模块:管理整个系统的流量分配,该模块基于谷歌重叠实验框架,使用域、层、实验的多层嵌套流量分层结构,使用用户ID、设备cookie、访问日期、随机的4种取模分配和基于实验属性的条件分配进行流量的分配。本系统采用分布式架构保证系统的可用性、一致性、健壮性和可扩展性,使用大数据技术处理海量数据,保证系统的低延迟和高响应。经过功能测试和非功能测试表明该系统满足设计需求,系统响应时间小于1秒,信息推荐结果点击率在15%以上。
基于流处理和深度学习的推荐系统研究
这是一篇关于推荐系统,Flink,注意力机制,FFM,Graph Embedding,FTRL的论文, 主要内容为近些年由于互联网的快速发展,其在为我们提供便利的同时也到导致了“信息过载”的问题,而推荐系统就是为了在海量数据的情况下将用户感兴趣的物品快速准确地推荐给用户。近些年深度学习与流处理框架在推荐领域被广泛应用,相比于传统推荐模型,深度学习推荐模型表达能力更强。相比于传统的大数据处理框架,流处理框架能够更加及时地获取用户兴趣的实时变化,提升推荐系统推荐的实时性与准确性。目前的推荐系统存在以下几点问题:(1)模型输出部分对交叉特征无差别求和,忽视了不同特征对结果影响的重要程度不同(2)深度学习模型难以有效地学习高阶的组合特征(3)传统Embedding编码方式难以对图结构候选集编码(4)目前大数据处理框架在用户数据收集上实时性不足。针对以上问题,本文主要工作如下:1.针对模型对输入特征无差别求和的问题本文提出了一种基于注意力机制的AFFM(Attentional Field-aware Factorization Macheine)模型。AFFM模型使用了线性与非线性双网络并行训练的结构,在模型中引入了注意力机制使得模型能够对不同特征计算出不同的权重,提升重要特征对推荐结果的影响。针对模型无法有效学习高阶特征的问题引入FFM(Field-aware Factorization Machines)作为AFFM模型的线性侧算法实现提升模型的特征交叉能力,FFM引入了特征域感知使模型能够更加有效的学习高阶组合特征,提高模型表达能力。2.针对传统Embedding无法很好的处理处理图结构特征数据的问题,本文引入了Graph Embedding的编码方式对图结构中的节点进行Embedding编码。通过Graph Embedding生成的节点Embedding包含了图中的关系信息以及邻近节点局部相似性特征,使得模型推荐结果更加准确。3.针对推荐系统实时性不高,用户兴趣无法实时反映到推荐结果的问题,本文使用流式计算框架Flink实时收集用户行为数据并更新模型,同时引入了FTRL(Follow The Regularized Lead)在线学习算法优化实时推荐,FTRL优化算法能够解决模型稀疏性的问题,提升模型推荐的实时性与精确性。4.对本文推荐系统进行需求分析,设计并实现基于流处理与深度学习的推荐系统,系统包含系统业务模块、推荐模块与数据收集模块,其中系统业务模块使用Spring Cloud实现,推荐模块使用Graph Embedding进行特征Embedding向量的生成与召回层实现,使用AFFM模型作为离线推荐排序层实现,并使用FTRL算法对实时推荐进行优化。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计客栈 ,原文地址:https://m.bishedaima.com/lunwen/55605.html