基于矩阵分解和Xgboost的电影个性化推荐系统研究
这是一篇关于电影推荐,矩阵填充,特征构造,用户聚类的论文, 主要内容为二十一世纪以来,随着互联网和电影产业的不断发展,网上的电影资源也越来越丰富,但同时用户从海量的电影中迅速地找到符合自己需求的电影也变得更加困难。为了使用户能够快速地找到自己喜爱的电影,协同过滤和个性化推荐系统应运而生。常用的推荐算法有基于用户或基于项目的协同过滤推荐算法,矩阵分解等,以上算法都是基于用户项目评分矩阵产生推荐。由于用户评分的客观因素,用户项目评分矩阵往往会非常稀疏,使得推荐效果不佳,进而导致用户的推荐体验较差。为了对传统协同过滤的推荐算法的效果进行改进,使得用户更精准地找到符合自己要求的电影,本文提出了基于矩阵分解和Xgboost的电影个性化电影推荐算法。该算法首先利用SVD++算法对用户评分矩阵进行处理,初步对评分矩阵进行缺失值填充,再利用填充完整的用户项目评分矩阵,根据评分向量对用户和电影进行聚类,继而再计算每个用户对于每一类用户两组评分向量之间的相似度,构造每个用户关于每类用户的相似度特征,对电影也做类似的处理。同时,在模型中加入用户和电影的属性(如用户年龄,性别,电影类别等),构造一个有监督模型,并利用Xgboost集成算法对有监督模型进行训练,从而得到推荐模型并对用户的评分进行预测。本文将所提出的MFXGB推荐算法应用于Movie Lens100k数据集中,并和传统的协同过滤推荐算法产生的结果进行对比,结果显示MFXGB的推荐效果好于传统的推荐算法。本文进一步验证了在MFXGB推荐算法中,对缺失的用户评分矩阵进行填充以及加入用户和电影的自身属性对算法有明显的提升作用。最后通过该推荐算法,产生的top10推荐列表具有较好的准确率和召回率。
基于XGBoost的O2O优惠券使用预测研究及应用
这是一篇关于O2O,优惠券,特征构造,特征选择,XGBoost的论文, 主要内容为近年来,随着电商行业的蓬勃发展,越来越多的人关注O2O(Online To Offline)电子商务模式。优惠券作为O2O模式吸引顾客的一种重要营销手段,常被商家和电商平台所采用。然而,优惠券被发放后,无法预估用户是否会使用该优惠券,可能会造成资源的浪费等问题。只有通过分析用户的历史消费行为,提前判断该用户是否会使用优惠券,以此作为优惠券的发放依据,才能在减少浪费资源的同时提高营销能力。所以,对优惠券的使用预测研究具有一定的现实应用意义。本文应用特征工程完成了数据集上的特征构造,提出了一种特征选择算法MIRFS(Mutual Information-Random Forest-Sequential Backward Selection),并使用该算法对所构造的特征实施了特征选择。为解决正负样本不平衡问题,基于XGBoost算法提出了一种预测算法BG-XGBoost(Balanced Bagging Classifier&Genetic AlgorithmXGBoost),并基于此算法构建了O2O优惠券使用预测模型。最后,设计并实现了O2O优惠券使用预测系统。本文的主要研究内容如下:(1)对O2O优惠券的研究背景、研究意义以及国内外研究现状进行分析;研究了数据挖掘技术、特征工程技术及其相关算法的理论与原理。(2)对原数据集进行数据预处理、打标以及划分,并对预处理后的数据集进行数据统计分析和可视化分析。基于原始特征结合数据分析结果进行特征构造,得到5个基础特征群(即用户特征群、商家特征群、优惠券特征群、时间特征群和距离特征群)和2个组合特征群(即用户-优惠券特征群和用户-商家特征群),共计111个特征。(3)提出了一种特征选择算法MIRFS,并利用该算法对所构造的111个特征进行特征选择,从中选择出48个评价得分高的特征。为了验证MIRFS算法的有效性,基于特征选择前后的样本数据,采用AUC、F1值和训练时间等评估指标,选择XGBoost、Random Forest、GBDT和Light GBM四种算法进行了建模对比。实验结果表明,四个算法在使用MIRFS特征选择后的样本数据上的分类性能均得到了一定的提升。(4)为处理正负样本不平衡问题,提出一种基于XGBoost的BG-XGBoost预测算法,并以此构建了O2O优惠券使用预测模型。实验结果表明,使用BG-XGBoost算法构建的预测模型,AUC达到了0.8642,提升了1.41%,F1值提高了6.39%,说明本文提出的BG-XGBoost算法比其他集成学习算法能够更好地处理正负样本不平衡问题。(5)设计并实现了一个O2O优惠券使用预测系统。
基于XGBoost的O2O优惠券使用预测研究及应用
这是一篇关于O2O,优惠券,特征构造,特征选择,XGBoost的论文, 主要内容为近年来,随着电商行业的蓬勃发展,越来越多的人关注O2O(Online To Offline)电子商务模式。优惠券作为O2O模式吸引顾客的一种重要营销手段,常被商家和电商平台所采用。然而,优惠券被发放后,无法预估用户是否会使用该优惠券,可能会造成资源的浪费等问题。只有通过分析用户的历史消费行为,提前判断该用户是否会使用优惠券,以此作为优惠券的发放依据,才能在减少浪费资源的同时提高营销能力。所以,对优惠券的使用预测研究具有一定的现实应用意义。本文应用特征工程完成了数据集上的特征构造,提出了一种特征选择算法MIRFS(Mutual Information-Random Forest-Sequential Backward Selection),并使用该算法对所构造的特征实施了特征选择。为解决正负样本不平衡问题,基于XGBoost算法提出了一种预测算法BG-XGBoost(Balanced Bagging Classifier&Genetic AlgorithmXGBoost),并基于此算法构建了O2O优惠券使用预测模型。最后,设计并实现了O2O优惠券使用预测系统。本文的主要研究内容如下:(1)对O2O优惠券的研究背景、研究意义以及国内外研究现状进行分析;研究了数据挖掘技术、特征工程技术及其相关算法的理论与原理。(2)对原数据集进行数据预处理、打标以及划分,并对预处理后的数据集进行数据统计分析和可视化分析。基于原始特征结合数据分析结果进行特征构造,得到5个基础特征群(即用户特征群、商家特征群、优惠券特征群、时间特征群和距离特征群)和2个组合特征群(即用户-优惠券特征群和用户-商家特征群),共计111个特征。(3)提出了一种特征选择算法MIRFS,并利用该算法对所构造的111个特征进行特征选择,从中选择出48个评价得分高的特征。为了验证MIRFS算法的有效性,基于特征选择前后的样本数据,采用AUC、F1值和训练时间等评估指标,选择XGBoost、Random Forest、GBDT和Light GBM四种算法进行了建模对比。实验结果表明,四个算法在使用MIRFS特征选择后的样本数据上的分类性能均得到了一定的提升。(4)为处理正负样本不平衡问题,提出一种基于XGBoost的BG-XGBoost预测算法,并以此构建了O2O优惠券使用预测模型。实验结果表明,使用BG-XGBoost算法构建的预测模型,AUC达到了0.8642,提升了1.41%,F1值提高了6.39%,说明本文提出的BG-XGBoost算法比其他集成学习算法能够更好地处理正负样本不平衡问题。(5)设计并实现了一个O2O优惠券使用预测系统。
基于XGBoost的O2O优惠券使用预测研究及应用
这是一篇关于O2O,优惠券,特征构造,特征选择,XGBoost的论文, 主要内容为近年来,随着电商行业的蓬勃发展,越来越多的人关注O2O(Online To Offline)电子商务模式。优惠券作为O2O模式吸引顾客的一种重要营销手段,常被商家和电商平台所采用。然而,优惠券被发放后,无法预估用户是否会使用该优惠券,可能会造成资源的浪费等问题。只有通过分析用户的历史消费行为,提前判断该用户是否会使用优惠券,以此作为优惠券的发放依据,才能在减少浪费资源的同时提高营销能力。所以,对优惠券的使用预测研究具有一定的现实应用意义。本文应用特征工程完成了数据集上的特征构造,提出了一种特征选择算法MIRFS(Mutual Information-Random Forest-Sequential Backward Selection),并使用该算法对所构造的特征实施了特征选择。为解决正负样本不平衡问题,基于XGBoost算法提出了一种预测算法BG-XGBoost(Balanced Bagging Classifier&Genetic AlgorithmXGBoost),并基于此算法构建了O2O优惠券使用预测模型。最后,设计并实现了O2O优惠券使用预测系统。本文的主要研究内容如下:(1)对O2O优惠券的研究背景、研究意义以及国内外研究现状进行分析;研究了数据挖掘技术、特征工程技术及其相关算法的理论与原理。(2)对原数据集进行数据预处理、打标以及划分,并对预处理后的数据集进行数据统计分析和可视化分析。基于原始特征结合数据分析结果进行特征构造,得到5个基础特征群(即用户特征群、商家特征群、优惠券特征群、时间特征群和距离特征群)和2个组合特征群(即用户-优惠券特征群和用户-商家特征群),共计111个特征。(3)提出了一种特征选择算法MIRFS,并利用该算法对所构造的111个特征进行特征选择,从中选择出48个评价得分高的特征。为了验证MIRFS算法的有效性,基于特征选择前后的样本数据,采用AUC、F1值和训练时间等评估指标,选择XGBoost、Random Forest、GBDT和Light GBM四种算法进行了建模对比。实验结果表明,四个算法在使用MIRFS特征选择后的样本数据上的分类性能均得到了一定的提升。(4)为处理正负样本不平衡问题,提出一种基于XGBoost的BG-XGBoost预测算法,并以此构建了O2O优惠券使用预测模型。实验结果表明,使用BG-XGBoost算法构建的预测模型,AUC达到了0.8642,提升了1.41%,F1值提高了6.39%,说明本文提出的BG-XGBoost算法比其他集成学习算法能够更好地处理正负样本不平衡问题。(5)设计并实现了一个O2O优惠券使用预测系统。
基于XGBoost的O2O优惠券使用预测研究及应用
这是一篇关于O2O,优惠券,特征构造,特征选择,XGBoost的论文, 主要内容为近年来,随着电商行业的蓬勃发展,越来越多的人关注O2O(Online To Offline)电子商务模式。优惠券作为O2O模式吸引顾客的一种重要营销手段,常被商家和电商平台所采用。然而,优惠券被发放后,无法预估用户是否会使用该优惠券,可能会造成资源的浪费等问题。只有通过分析用户的历史消费行为,提前判断该用户是否会使用优惠券,以此作为优惠券的发放依据,才能在减少浪费资源的同时提高营销能力。所以,对优惠券的使用预测研究具有一定的现实应用意义。本文应用特征工程完成了数据集上的特征构造,提出了一种特征选择算法MIRFS(Mutual Information-Random Forest-Sequential Backward Selection),并使用该算法对所构造的特征实施了特征选择。为解决正负样本不平衡问题,基于XGBoost算法提出了一种预测算法BG-XGBoost(Balanced Bagging Classifier&Genetic AlgorithmXGBoost),并基于此算法构建了O2O优惠券使用预测模型。最后,设计并实现了O2O优惠券使用预测系统。本文的主要研究内容如下:(1)对O2O优惠券的研究背景、研究意义以及国内外研究现状进行分析;研究了数据挖掘技术、特征工程技术及其相关算法的理论与原理。(2)对原数据集进行数据预处理、打标以及划分,并对预处理后的数据集进行数据统计分析和可视化分析。基于原始特征结合数据分析结果进行特征构造,得到5个基础特征群(即用户特征群、商家特征群、优惠券特征群、时间特征群和距离特征群)和2个组合特征群(即用户-优惠券特征群和用户-商家特征群),共计111个特征。(3)提出了一种特征选择算法MIRFS,并利用该算法对所构造的111个特征进行特征选择,从中选择出48个评价得分高的特征。为了验证MIRFS算法的有效性,基于特征选择前后的样本数据,采用AUC、F1值和训练时间等评估指标,选择XGBoost、Random Forest、GBDT和Light GBM四种算法进行了建模对比。实验结果表明,四个算法在使用MIRFS特征选择后的样本数据上的分类性能均得到了一定的提升。(4)为处理正负样本不平衡问题,提出一种基于XGBoost的BG-XGBoost预测算法,并以此构建了O2O优惠券使用预测模型。实验结果表明,使用BG-XGBoost算法构建的预测模型,AUC达到了0.8642,提升了1.41%,F1值提高了6.39%,说明本文提出的BG-XGBoost算法比其他集成学习算法能够更好地处理正负样本不平衡问题。(5)设计并实现了一个O2O优惠券使用预测系统。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设港湾 ,原文地址:https://m.bishedaima.com/lunwen/56058.html