多视角融合的搜索广告相关性研究
这是一篇关于相关性,搜索广告,文本,广告商品,用户意图,商品属性,CTR的论文, 主要内容为搜索广告是广告系统的—种特定应用方式,根据用户的查询词向用户推送相关商品的广告。随着搜索引擎技术的不断发展,搜索广告在广告系统中所占份额也越来越大,其带来的经济效益也远远高于其他广告。搜索广告的相关性指推送商品广告与用户查询词的相关程度。由于搜索广告以用户查询词为依据,研究该相关性的意义极其重要。是否能够为用户推荐相关性更好的商品广告,使用户对搜索结果页面更满意,已经成为搜索引擎的重要目标。本文总结了搜索引擎与推荐系统目前的研究现状,以及国内外关于相关性的研究方法。并结合拼多多公司业务的需求提出了一种多视角融合的搜索广告相关性提升的方法,用以解决具体的相关性问题。本文设计与实现的保障高相关性的系统,作为搜索广告平台业务应用层的一部分,保证了公司相关性的要求,提高了用户体验度。针对相关性服务系统,本文从数据处理方案的设计、相关性多视角融合算法的设计以及相关性服务的设计三大模块去解决相关性的问题。针对本文提出的多视角融合的相关性研究,包含了文本相关性的角度、广告商品扩展推荐相关性的角度、商品属性排序相关性的角度以及用户意图识别相关性的角度。本文针对每个角度一一进行了设计与实现,从而实现最终的多视角融合的相关性。本文多视角融合的相关性研究在传统的机器学习模型基础上,结合了神经网络与深度模型的应用。目前,本项目已经正式上线运行。本文的方案对于拼多多公司搜索广告平台的点击率提高了 1.23%,消耗上涨1.44%,垃圾广告解决率提高了约40%。
广告需求方管理平台的设计与实现
这是一篇关于广告需求方平台,DSP,CTR,实时竞价的论文, 主要内容为随着互联网广告规模的迅速发展,计算广告这种由广告与互联网相应结合而发展起来的研究领域开始火热起来。计算广告通过对目标用户浏览的内容的一系列计算得到与之最匹配的广告内容并进行精准投放,这种方式的投放可以提升投放广告的点击率(Click Through Rate,CTR),从而增加广告主网站的点击量或商品的成交量。目前计算广告的主流为实时竞价的程序化交易广告,而需求方平台管理平台(demand side Platform,DSP)则是广告主参与实时竞价重要前提。广告主可以通过DSP定制广告需求从而指导广告的精准化投放,实现广告主与媒体方的最大化收益。本文的主要目的,就是在深度理解广告主投放广告业务需求的基础上,设计并实现一个竞价广告管理系统,此系统可以帮助广告主整合完成广告投放的一系列流程。使广告主可以根据展示的投放效果轻松调整投放策略,无需再花费大量时间和精力使用多账号管理自己的广告诉求。通过对系统的详细分析,本文从技术上选用了Spark作为分布式计算框架、Nginx反向代理服务器以及Springboot框架进行系统后台开发工作,利用Elasticsearch提供检索广告服务。从功能上将广告需求方管理平台划分为了用户管理模块、账户管理模块、广告管理模块、效果展示模块、检索模块、排序模块六个模块。其中前四个模块属于DSP平台中的广告管理平台部分,广告主需要使用这四个模块的功能进行用户登录、账户充值、广告策略制定、广告物料上传和效果报表查看等操作;后两个检索模块和排序模块属于平台广告投放引擎部分,DSP接收到一个广告曝光请求后,需要经过广告投放引擎检索模块倒排索引构建、排序模块CTR点击率预估建模等一系列的计算和筛选,最终确定一个能保证平台和广告主收益、和曝光请求相似度最高、用户点击可能性最大的广告进行展示。
基于用户行为特征的智能推荐系统研究与应用
这是一篇关于深度学习,CTR,CIN,推荐模型,因子分解机的论文, 主要内容为互联网、云计算、人工智能经过几十年来惊人的发展,已经从方方面面覆盖到了我们的日常生活之中。而其中具有极大商业潜能的智能推荐技术,备受各大互联网公司青睐,与之相关的研究也数不胜数。在这样得天独厚的条件下,智能推荐系统已经能轻易的通过大数据分析,根据每一个人喜好、现状,为人们的选择给出最合适意见。在智能推荐系统的研究中,陆续经过多个阶段的发展。从早期使用协同过滤模型进行推荐,到机器学习模型的兴起尝试融入机器学习,再到最后CTR(Click Through Rate)推荐模型脱颖而出超越经典机器学习模型。本文着眼于CTR模型,在CTR模型中引入高阶显性特征交叉项,并对该模型做出改进研究以应用于商品推荐系统中。本文的主要研究内容包括如下:1.对于现在经典的Wide and Deep架构的CTR推荐模型进行分析,该类架构模型在面对追求模型高泛用性和数据快速拟合的冲突时,可以很好的把握两者之间的平衡以获得更优秀的性能。然后在此基础上分析引入CIN(Compressed Interaction Network)网络结构,CIN模型能对输入特征之间的高阶显性交互进行有效利用,不仅大大增强了模型的可解释性,也使模型的准确率得到较大提升。2.对引入CIN网络的CTR模型,在criteo广告数据集上进行实验研究。首先对模型的CIN网络层数、feature map维度、正则化系数等超参数进行调优,探索模型潜在性能。然后优化模型的输入、输出结构,使模型能更有效的处理复杂、多样的数据输入,以及充分利用CIN模型部分的处理结果。最后,通过实验结果对比证明,改进后的CTR模型与未改进前模型相比在logloss指标和AUC指标得到了显著提升。3.基于以上研究,结合实践建立一个基于CTR模型分析用户行为特征的金融信息推荐系统。该推荐系统可以通过用户群体的点击,购买,收藏等行为特征,结合用户的基本信息,提供合理的信息推荐。本系统主要关注解决如何在web系统中收集存储CTR数据集,如何利用CTR模型实现推荐功能,以及合理利用人工特征训练模型等应用问题。
基于用户、商品和上下文特征的推荐系统算法研究
这是一篇关于推荐系统,上下文信息,CTR,特征组合,自适应因子分解网络(AFN)的论文, 主要内容为在互联网蓬勃发展的今天,线上广告、新闻、购物、娱乐等与人们的日常生活息息相关。但是,移动互联网产生海量信息,而人们浏览的信息量有限,如何在复杂多样的信息中挑选目标数据成为挑战。推荐系统通过引导人们购物、新闻浏览、娱乐成为了移动互联网的主流技术,提高推荐系统的精确性对解决人们的挑选困难成为重点关注的话题。为了提高系统点击率(CTR)预估的精确性,需要从庞大的用户历史行为记录中挖掘能指导模型预估点击率的有效信息。为此,论文旨在搭建新模型,来提升点击率的预估精确度。针对推荐系统特征组合问题,充分利用用户、商品和上下文信息,在推荐系统Deep FM模型基础上,提出了改进的点击率预估模型,具体研究工作如下:首先,为了让数据适应模型,纠正或删除不适用于模型的记录,本文对数据进行预处理。数据预处理的方法包括删除唯一属性、解决缺失值、离群值处理、特征编码、数据正则化、选择特征分析主要成分等;为了降低计算成本,将数据变换为更能代表预测模型潜在问题的特征,论文对数据集的数据进行特征工程处理。特征工程处理分两步,一是选择特征、二是特征数字化。对类别变量使用独热编码进行数字化,得到机器学习易于利用的形式。其次,论文对基于因子分解机的CTR预测神经网络(Deep FM)、自适应因子分解网络(AFN)进行研究,创新性地提出了一个融合自适应分解网络的因子分解机神经网络,简称AFN+Deep FM模型。推荐系统数据经常是高维的、多领域的、稀疏的、多类型的、关联却又很少的,而AFN+Deep FM模型中的矩阵分解法能充分挖掘上下文信息进行学习。一方面,Deep FM模型的深度学习模块能从已知的特征中找到有隐藏关系的特征,将它们进行高阶特征交互,以提高模型预估效果。另一方面,AFN模型在前馈神经网络前添加对数转换层,自适应地对输入的特征进行交互输出不同阶的特征组合,前馈神经网络对不同阶的特征组合进行高阶特征交互,AFN模型在不同阶的特征向量组合中挖掘更多的信息,对点击率预估的指导能力变强。因此AFN+Deep FM模型弥补了因子分解机(FM)仅仅能实现一阶、二阶的低阶特征交互的缺陷,挖掘更多的信息,以实现融合模型性能提升。最后,论文对所提出的AFN+Deep FM模型进行了实验验证。模型在Criteo数据集上和Avazu数据集上训练学习,最终AUC值相对其他几个主流模型有所提升,Log Loss值相对其他模型有所下降,证明了AFN+Deep FM模型的有效性。综上,本文提出的AFN+Deep FM模型既进行低阶特征组合、对输入的特征进行高阶特征组合,又对不同阶的特征组合进行高阶交互,充分挖掘信息,提高模型CTR预估准确度。
多视角融合的搜索广告相关性研究
这是一篇关于相关性,搜索广告,文本,广告商品,用户意图,商品属性,CTR的论文, 主要内容为搜索广告是广告系统的—种特定应用方式,根据用户的查询词向用户推送相关商品的广告。随着搜索引擎技术的不断发展,搜索广告在广告系统中所占份额也越来越大,其带来的经济效益也远远高于其他广告。搜索广告的相关性指推送商品广告与用户查询词的相关程度。由于搜索广告以用户查询词为依据,研究该相关性的意义极其重要。是否能够为用户推荐相关性更好的商品广告,使用户对搜索结果页面更满意,已经成为搜索引擎的重要目标。本文总结了搜索引擎与推荐系统目前的研究现状,以及国内外关于相关性的研究方法。并结合拼多多公司业务的需求提出了一种多视角融合的搜索广告相关性提升的方法,用以解决具体的相关性问题。本文设计与实现的保障高相关性的系统,作为搜索广告平台业务应用层的一部分,保证了公司相关性的要求,提高了用户体验度。针对相关性服务系统,本文从数据处理方案的设计、相关性多视角融合算法的设计以及相关性服务的设计三大模块去解决相关性的问题。针对本文提出的多视角融合的相关性研究,包含了文本相关性的角度、广告商品扩展推荐相关性的角度、商品属性排序相关性的角度以及用户意图识别相关性的角度。本文针对每个角度一一进行了设计与实现,从而实现最终的多视角融合的相关性。本文多视角融合的相关性研究在传统的机器学习模型基础上,结合了神经网络与深度模型的应用。目前,本项目已经正式上线运行。本文的方案对于拼多多公司搜索广告平台的点击率提高了 1.23%,消耗上涨1.44%,垃圾广告解决率提高了约40%。
基于用户、商品和上下文特征的推荐系统算法研究
这是一篇关于推荐系统,上下文信息,CTR,特征组合,自适应因子分解网络(AFN)的论文, 主要内容为在互联网蓬勃发展的今天,线上广告、新闻、购物、娱乐等与人们的日常生活息息相关。但是,移动互联网产生海量信息,而人们浏览的信息量有限,如何在复杂多样的信息中挑选目标数据成为挑战。推荐系统通过引导人们购物、新闻浏览、娱乐成为了移动互联网的主流技术,提高推荐系统的精确性对解决人们的挑选困难成为重点关注的话题。为了提高系统点击率(CTR)预估的精确性,需要从庞大的用户历史行为记录中挖掘能指导模型预估点击率的有效信息。为此,论文旨在搭建新模型,来提升点击率的预估精确度。针对推荐系统特征组合问题,充分利用用户、商品和上下文信息,在推荐系统Deep FM模型基础上,提出了改进的点击率预估模型,具体研究工作如下:首先,为了让数据适应模型,纠正或删除不适用于模型的记录,本文对数据进行预处理。数据预处理的方法包括删除唯一属性、解决缺失值、离群值处理、特征编码、数据正则化、选择特征分析主要成分等;为了降低计算成本,将数据变换为更能代表预测模型潜在问题的特征,论文对数据集的数据进行特征工程处理。特征工程处理分两步,一是选择特征、二是特征数字化。对类别变量使用独热编码进行数字化,得到机器学习易于利用的形式。其次,论文对基于因子分解机的CTR预测神经网络(Deep FM)、自适应因子分解网络(AFN)进行研究,创新性地提出了一个融合自适应分解网络的因子分解机神经网络,简称AFN+Deep FM模型。推荐系统数据经常是高维的、多领域的、稀疏的、多类型的、关联却又很少的,而AFN+Deep FM模型中的矩阵分解法能充分挖掘上下文信息进行学习。一方面,Deep FM模型的深度学习模块能从已知的特征中找到有隐藏关系的特征,将它们进行高阶特征交互,以提高模型预估效果。另一方面,AFN模型在前馈神经网络前添加对数转换层,自适应地对输入的特征进行交互输出不同阶的特征组合,前馈神经网络对不同阶的特征组合进行高阶特征交互,AFN模型在不同阶的特征向量组合中挖掘更多的信息,对点击率预估的指导能力变强。因此AFN+Deep FM模型弥补了因子分解机(FM)仅仅能实现一阶、二阶的低阶特征交互的缺陷,挖掘更多的信息,以实现融合模型性能提升。最后,论文对所提出的AFN+Deep FM模型进行了实验验证。模型在Criteo数据集上和Avazu数据集上训练学习,最终AUC值相对其他几个主流模型有所提升,Log Loss值相对其他模型有所下降,证明了AFN+Deep FM模型的有效性。综上,本文提出的AFN+Deep FM模型既进行低阶特征组合、对输入的特征进行高阶特征组合,又对不同阶的特征组合进行高阶交互,充分挖掘信息,提高模型CTR预估准确度。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计工坊 ,原文地址:https://m.bishedaima.com/lunwen/50195.html