面向新闻推荐的特定偏差研究及其应用
这是一篇关于新闻推荐,曝光偏差,用户偏好,因果推断,倾向得分的论文, 主要内容为新闻推荐系统在满足用户的个性化新闻浏览需求和适应日益增长的新闻数量方面有较好的应用。然而,当前个性化的新闻推荐算法通常是基于观测性的用户隐式反馈数据而非实验性数据,因此存在许多偏差。例如,用户对新闻的选择偏差、系统对新闻的曝光偏差等。此外,新闻的强时效性使得用户的新闻浏览偏好具有高度动态性等特点。为了解决以上问题,本文提出了融合因果推断的曝光点击新闻推荐模型和融合时序信息的曝光匹配新闻推荐模型,并基于这两类推荐模型设计并开发了一个新闻推荐系统。在融合因果推断的曝光点击新闻推荐模型的研究方面,本文对新闻推荐中“曝光-点击”场景下的观测数据进行因果建模,构建反事实结构因果图,用于区分新闻曝光倾向与用户曝光偏好对用户点击倾向的影响,并在计算“曝光-点击”因果效应部分,使用改进的倾向得分估计方法计算用户的点击倾向得分,最终通过建模用户和新闻信息,生成新闻推荐列表。在六个公开数据上实现了该推荐模型,并与多个基准模型进行对比实验,验证了提出的模型在提高推荐性能的基础上,有效缓解了基于隐式反馈数据新闻推荐算法中的曝光偏差的问题。在融合时序信息的曝光匹配新闻推荐模型研究方面,本文利用新闻的标题(即新闻的曝光部分)来生成新闻的曝光表示,利用用户点击过的新闻列表中的曝光信息,获得用户对新闻曝光偏好表示。将用户历史记录中的时间间隔信息也作为用户新闻曝光偏好建模的输入,进而表示出用户对新闻点击偏好的动态性。实验结果表明,该模型更能准确表示出用户对新闻的点击偏好,并提升推荐性能。最后,以提出的两类新闻推荐模型为基础,结合实际应用场景,设计并开发了新闻推荐系统,完成了新闻的在线浏览、个性化新闻推荐和新闻发布等功能,验证了本文提出的推荐模型在实际应用场景下的可行性。
基于双视角纠偏的推荐模型
这是一篇关于推荐系统,协同过滤,因果推断,后门调整,流行度偏差的论文, 主要内容为推荐系统的出现是为了缓解信息过载的问题,帮助用户快速、准确地找到其感兴趣的内容。当下,推荐系统已在电子商务、社交平台、个性化广告推荐等领域发挥着重要作用,成为了现代互联网应用场景中不可或缺的一部分。传统推荐系统大多关注于如何利用机器学习模型更好地拟合历史交互数据。然而推荐系统中的历史交互数据往往是观察性的,而非实验性数据。作为观察性的用户行为数据天生存在各种各样的偏差,因为用户产生行为是基于曝光的物品,使得观察到的数据混合了系统的曝光机制和用户的自由选择。另外推荐系统作为一个反馈循环系统,不但会导致偏差而且会放大偏差,造成马太效应。因此传统推荐方法不考虑其内在偏差而盲目拟合数据,不仅会损害用户的满意度还会损害物品提供方的利益。观测数据中存在多种偏差,其中较为典型的是流行度偏差。适度地利用流行度偏差是可以提高模型准确性的,但在循环推荐中放大的流行度偏差会降低推荐系统的预测性能。因此第一个问题是如何去除流行度偏差,如果将有偏的观测数据直接作为模型输入的话,训练好的嵌入向量不能准确地表征用户和物品,导致推荐性能较差。第二个问题是如何利用流行度偏差,因为盲目去除流行度偏差,过度推荐不受欢迎的物品,会损害用户的体验。近几年,研究者将研究重心转向探索偏差对推荐系统的影响上,但目前为止,处理流行度偏差的策略都仅从物品的视角进行纠偏,未能考虑全面。针对上述情况,本文构建符合数据生成机制的因果图,基于该因果图提出了双视角纠偏的推荐模型,并在大规模真实数据集上验证提出方法的有效性。本文的主要贡献总结如下:·本文为了去除对推荐系统产生不利影响的流行度偏差,构建了一个双偏去混模型(Double Bias Deconfounding,DBD)。DBD模型受因果图启发,从物品和用户两个视角分析偏差对推荐系统的影响。在训练阶段,利用因果推断中的后门调整技术构建双视角去偏模型。改进贝叶斯个性化排序损失函数,使其可以同时利用物品流行度和用户活跃度两方面信息训练模型。在训练阶段剥离产生不利影响的流行度偏差,实验证明该方法可以提升推荐系统性能。·本文为了利用有利的流行度偏差,消除训练集和测试集之间分布偏移问题,构建了一个双偏去混及调整模型(Double Bias Deconfounding and Adjusting,DBDA)。DBDA模型是在DBD模型的基础上建立的,从物品和用户两个视角进行去偏。在推断阶段从物品和用户双视角进行干预,构建纠偏模型。在为同一用户推荐不同物品时,双视角干预等价于对物品流行度进行干预,通过比较3种不同流行度预测公式的干预效果,探讨不同公式对最终推荐效果的影响。在推断阶段通过调整流行度偏差,找出用户潜在感兴趣的物品,实验证明了该方法的有效性和稳定性。并通过消融实验,验证了DBDA模型中各个组件的必要性。综上所述,本文先是构建因果图指导模型在训练阶段从物品和用户双视角去除流行度偏差,后从双视角的角度对偏差进行干预找出潜在受欢迎的物品。利用流行度偏差来缓解数据在训练集和测试集之间分布偏移的问题,使得模型更具鲁棒性和可解释性。
基于因果推断的优惠券精准发放方法研究
这是一篇关于因果推断,精准营销的论文, 主要内容为随着网络购物和电子支付的发展,电子优惠券成为了网络消费中常用的优惠手段。不论是新冠疫情期间银行和电子商务平台合作推出的“消费券”,还是每年“双十一”各大电商平台的“满减券”,都极大的带动了消费,对社会经济的发展和平台盈利有着重要的作用。本文则是在这样的背景下,研究优惠券精准发放的方法。不同于目前常用的优惠券使用概率预测,本文从因果推断方法入手,希望解决优惠券精准发放中的痛点——极易命中自然转化的人群,无法将自然转化和受到优惠券刺激而产生转化的人群区分开来。本文基于AB实验数据展开研究,主要目标是预测样本的个体处理效应或者拆分人群使得人群的条件处理效应最大。为了达到这样的目标,本文使用了元学习、基于树模型的因果推断、基于机器学习的因果推断等模型。针对业界可能碰到的单策略人群选择和多策略人群选择两种情况,本文分别做了单干预因果推断和多干预因果推断。在单干预因果推断场景中,本文提出根据业务经验引入用户活跃度或者用户价值作为模型特征。活跃度或用户价值的计算方式是依据关键特征对用户做聚类,将用户类别活跃度或用户价值标签。此外,根据特征的含义对特征做交叉项,使得模型更具有解释意义。接着应用元学习、基于树模型的因果推断、基于机器学习的因果推断等模型输出人群策略。在多干预因果推断场景中,本文对每个实验组建立单干预因果推断模型,得到样本在不同实验组的处理效应估计,再将样本分配到处理效应为正且最大的策略中去。由于该场景下单干预因果推断模型的评估指标不再适用,本文提出了以随机分配的转化和表现最优的实验组的转化为基线的模型评估方法。在实证研究中,本文选取了某优惠券策略的AB实验数据,数据包含一个对照组和两个实验组,分别为无优惠策略、买一赠一券、折扣券。首先,本文对数据做了因果性分析,依据业务经验将用户拆分成不同的亚组,通过亚组分析检验实验组用户的表现是否显著优于对照组用户。通过比例检验,发现实验组确实存在转化率提升不显著的用户群体。在模型变量的选择中,本文引入了基于用户历史消费行为聚类的用户价值类别,并对特征做离散变量间的交叉项以及连续变量和离散变量间的交叉项。接着,本文以无优惠策略组和买一赠一券组为例,进行了单干预因果推断模型的建立,发现元学习中的R-learner、基于KL散度的树模型和基于极端梯度提升树的双机器学习模型效果比较好。此外,对比因果推断模型业界常用的概率预测模型,因果推断能够更好的区分营销敏感人群,实现成本发放效率的提升。最后,本文对数据集做了多干预因果推断模型的建立,并应用本文提出的模型评估指标进行模型评价,发现元学习的效果优于基于树模型的因果推断和基于机器学习的因果推断,其中R-learner的效果更好。综上,本文得到以下三个结论:第一,用因果推断模型来做敏感人群的圈选、实现优惠券的精准发放是行之有效的。相比于业界常用的优惠券使用概率预测模型,该方法能够通过预估个体处理效应更好的区分自然转化的人群和收到优惠券激励而转化的人群;相比于亚组分析,该方法能够适应更多特征的场景。第二,将一些业务经验带入变量选择中是有利于模型建立的,比如依据用户的历史行为做活跃度或用户价值的划分。这些依据业务经验建立的变量,在模型的特征中重要度排名靠前。第三,在多干预的因果推断场景下,本文提出的模型评价方法,通过计算随机分配、选择表现最优的实验组及各模型策略的转化,不仅能够实现模型间的效果对比,更能实现模型效果与业界常用方法的效果对比,有助于更好的判断模型策略的可用性和实用性。
反差森林:约束下的多维连续因果推断策略
这是一篇关于因果推断,策略学习,推荐系统,短视频的论文, 主要内容为在短视频平台的生态中,短视频类目曝光比是一种对推荐系统和内容制作起到宏观指导作用的重要工具。由于为每位用户各自确定独特的视频曝光比例的问题非常复杂,并且现有离线数据中的数据分布存在严重的“选择偏差”情况,所以本文考虑应用能够识别混合处理效益的因果推断算法来解决该问题。然而,若将各类视频曝光比作为处理变量,则会使得因果问题中的处理变量具有连续、高维、带约束的特点,而这样的情况在目前的因果推断技术领域并没有成熟的解决方案。因此,本文提出了一种基于因果决策树模型的“反差森林”算法,通过在分裂准则函数的构造中采用连续值离散化、启发式维度遍历等思想,解决了上述存在的问题,并在业务上得以高效应用。为了验证反差森林模型在特定场景下的性能,本文对因果推断相关领域的先进方法做了适用于该问题的微调,再将它们与反差森林对比。本文通过对比各方法在分别由模拟数据与合成数据构成的两个数据集上的表现,说明了反差森林算法在该场景下具有独特的优越性能。同时,反差森林作为一种独立的算法模型,也具有扩展到任意相似场景的能力。
反差森林:约束下的多维连续因果推断策略
这是一篇关于因果推断,策略学习,推荐系统,短视频的论文, 主要内容为在短视频平台的生态中,短视频类目曝光比是一种对推荐系统和内容制作起到宏观指导作用的重要工具。由于为每位用户各自确定独特的视频曝光比例的问题非常复杂,并且现有离线数据中的数据分布存在严重的“选择偏差”情况,所以本文考虑应用能够识别混合处理效益的因果推断算法来解决该问题。然而,若将各类视频曝光比作为处理变量,则会使得因果问题中的处理变量具有连续、高维、带约束的特点,而这样的情况在目前的因果推断技术领域并没有成熟的解决方案。因此,本文提出了一种基于因果决策树模型的“反差森林”算法,通过在分裂准则函数的构造中采用连续值离散化、启发式维度遍历等思想,解决了上述存在的问题,并在业务上得以高效应用。为了验证反差森林模型在特定场景下的性能,本文对因果推断相关领域的先进方法做了适用于该问题的微调,再将它们与反差森林对比。本文通过对比各方法在分别由模拟数据与合成数据构成的两个数据集上的表现,说明了反差森林算法在该场景下具有独特的优越性能。同时,反差森林作为一种独立的算法模型,也具有扩展到任意相似场景的能力。
基于双视角纠偏的推荐模型
这是一篇关于推荐系统,协同过滤,因果推断,后门调整,流行度偏差的论文, 主要内容为推荐系统的出现是为了缓解信息过载的问题,帮助用户快速、准确地找到其感兴趣的内容。当下,推荐系统已在电子商务、社交平台、个性化广告推荐等领域发挥着重要作用,成为了现代互联网应用场景中不可或缺的一部分。传统推荐系统大多关注于如何利用机器学习模型更好地拟合历史交互数据。然而推荐系统中的历史交互数据往往是观察性的,而非实验性数据。作为观察性的用户行为数据天生存在各种各样的偏差,因为用户产生行为是基于曝光的物品,使得观察到的数据混合了系统的曝光机制和用户的自由选择。另外推荐系统作为一个反馈循环系统,不但会导致偏差而且会放大偏差,造成马太效应。因此传统推荐方法不考虑其内在偏差而盲目拟合数据,不仅会损害用户的满意度还会损害物品提供方的利益。观测数据中存在多种偏差,其中较为典型的是流行度偏差。适度地利用流行度偏差是可以提高模型准确性的,但在循环推荐中放大的流行度偏差会降低推荐系统的预测性能。因此第一个问题是如何去除流行度偏差,如果将有偏的观测数据直接作为模型输入的话,训练好的嵌入向量不能准确地表征用户和物品,导致推荐性能较差。第二个问题是如何利用流行度偏差,因为盲目去除流行度偏差,过度推荐不受欢迎的物品,会损害用户的体验。近几年,研究者将研究重心转向探索偏差对推荐系统的影响上,但目前为止,处理流行度偏差的策略都仅从物品的视角进行纠偏,未能考虑全面。针对上述情况,本文构建符合数据生成机制的因果图,基于该因果图提出了双视角纠偏的推荐模型,并在大规模真实数据集上验证提出方法的有效性。本文的主要贡献总结如下:·本文为了去除对推荐系统产生不利影响的流行度偏差,构建了一个双偏去混模型(Double Bias Deconfounding,DBD)。DBD模型受因果图启发,从物品和用户两个视角分析偏差对推荐系统的影响。在训练阶段,利用因果推断中的后门调整技术构建双视角去偏模型。改进贝叶斯个性化排序损失函数,使其可以同时利用物品流行度和用户活跃度两方面信息训练模型。在训练阶段剥离产生不利影响的流行度偏差,实验证明该方法可以提升推荐系统性能。·本文为了利用有利的流行度偏差,消除训练集和测试集之间分布偏移问题,构建了一个双偏去混及调整模型(Double Bias Deconfounding and Adjusting,DBDA)。DBDA模型是在DBD模型的基础上建立的,从物品和用户两个视角进行去偏。在推断阶段从物品和用户双视角进行干预,构建纠偏模型。在为同一用户推荐不同物品时,双视角干预等价于对物品流行度进行干预,通过比较3种不同流行度预测公式的干预效果,探讨不同公式对最终推荐效果的影响。在推断阶段通过调整流行度偏差,找出用户潜在感兴趣的物品,实验证明了该方法的有效性和稳定性。并通过消融实验,验证了DBDA模型中各个组件的必要性。综上所述,本文先是构建因果图指导模型在训练阶段从物品和用户双视角去除流行度偏差,后从双视角的角度对偏差进行干预找出潜在受欢迎的物品。利用流行度偏差来缓解数据在训练集和测试集之间分布偏移的问题,使得模型更具鲁棒性和可解释性。
基于因果推断的优惠券精准发放方法研究
这是一篇关于因果推断,精准营销的论文, 主要内容为随着网络购物和电子支付的发展,电子优惠券成为了网络消费中常用的优惠手段。不论是新冠疫情期间银行和电子商务平台合作推出的“消费券”,还是每年“双十一”各大电商平台的“满减券”,都极大的带动了消费,对社会经济的发展和平台盈利有着重要的作用。本文则是在这样的背景下,研究优惠券精准发放的方法。不同于目前常用的优惠券使用概率预测,本文从因果推断方法入手,希望解决优惠券精准发放中的痛点——极易命中自然转化的人群,无法将自然转化和受到优惠券刺激而产生转化的人群区分开来。本文基于AB实验数据展开研究,主要目标是预测样本的个体处理效应或者拆分人群使得人群的条件处理效应最大。为了达到这样的目标,本文使用了元学习、基于树模型的因果推断、基于机器学习的因果推断等模型。针对业界可能碰到的单策略人群选择和多策略人群选择两种情况,本文分别做了单干预因果推断和多干预因果推断。在单干预因果推断场景中,本文提出根据业务经验引入用户活跃度或者用户价值作为模型特征。活跃度或用户价值的计算方式是依据关键特征对用户做聚类,将用户类别活跃度或用户价值标签。此外,根据特征的含义对特征做交叉项,使得模型更具有解释意义。接着应用元学习、基于树模型的因果推断、基于机器学习的因果推断等模型输出人群策略。在多干预因果推断场景中,本文对每个实验组建立单干预因果推断模型,得到样本在不同实验组的处理效应估计,再将样本分配到处理效应为正且最大的策略中去。由于该场景下单干预因果推断模型的评估指标不再适用,本文提出了以随机分配的转化和表现最优的实验组的转化为基线的模型评估方法。在实证研究中,本文选取了某优惠券策略的AB实验数据,数据包含一个对照组和两个实验组,分别为无优惠策略、买一赠一券、折扣券。首先,本文对数据做了因果性分析,依据业务经验将用户拆分成不同的亚组,通过亚组分析检验实验组用户的表现是否显著优于对照组用户。通过比例检验,发现实验组确实存在转化率提升不显著的用户群体。在模型变量的选择中,本文引入了基于用户历史消费行为聚类的用户价值类别,并对特征做离散变量间的交叉项以及连续变量和离散变量间的交叉项。接着,本文以无优惠策略组和买一赠一券组为例,进行了单干预因果推断模型的建立,发现元学习中的R-learner、基于KL散度的树模型和基于极端梯度提升树的双机器学习模型效果比较好。此外,对比因果推断模型业界常用的概率预测模型,因果推断能够更好的区分营销敏感人群,实现成本发放效率的提升。最后,本文对数据集做了多干预因果推断模型的建立,并应用本文提出的模型评估指标进行模型评价,发现元学习的效果优于基于树模型的因果推断和基于机器学习的因果推断,其中R-learner的效果更好。综上,本文得到以下三个结论:第一,用因果推断模型来做敏感人群的圈选、实现优惠券的精准发放是行之有效的。相比于业界常用的优惠券使用概率预测模型,该方法能够通过预估个体处理效应更好的区分自然转化的人群和收到优惠券激励而转化的人群;相比于亚组分析,该方法能够适应更多特征的场景。第二,将一些业务经验带入变量选择中是有利于模型建立的,比如依据用户的历史行为做活跃度或用户价值的划分。这些依据业务经验建立的变量,在模型的特征中重要度排名靠前。第三,在多干预的因果推断场景下,本文提出的模型评价方法,通过计算随机分配、选择表现最优的实验组及各模型策略的转化,不仅能够实现模型间的效果对比,更能实现模型效果与业界常用方法的效果对比,有助于更好的判断模型策略的可用性和实用性。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码客栈 ,原文地址:https://m.bishedaima.com/lunwen/56032.html