基于深度学习的商品个性化推荐系统设计与实现
这是一篇关于个性化推荐,协同过滤,DeepFM,NeuMF的论文, 主要内容为随着计算机技术迅速发展和我国网民人数高达9.04亿,网购成为人们购物的首选。传统推荐算法在商品爆炸式增长的情况下进行个性化推荐时,一直面临着数据稀疏、商品冷启动和用户兴趣难挖掘等问题。本文利用深度学习具有非线性学习能力,在推荐系统中能自动进行特征学习挖掘出用户及物品间的隐含和潜在特征,解决了用户兴趣难挖掘问题。用one-hot编码和Embedding嵌入层把高维稀疏的数据特征转化为低维稠密型特征,解决了数据的维度高和稀疏性问题。本文的主要工作如下:(1)对深度学习和推荐系统相关技术的研究分析。本文选择深度学习推荐模型DeepFM(DNN、FM)和基于神经网络的协同过滤算法模型NeuMF(GMF、MLP),并对模型特点详细介绍。(2)通过爬虫技术获取Tmall商城数据作为本实验数据集,用one-hot编码和Embedding嵌入层降维后的数据输入深度学习模型中训练。实验结果DeepFM的AUC分别比DNN和FM提高了2.66%和1.91%,损失函数值分别降低了12.1%和8.10%;NeuMF模型的损失函数值分别比GMF和MLP降低了18.75%、12.64%,HR命中率值分布提高了8.32%、5.61%。(3)对推荐系统进行需求分析和设计,用Django开发框架设计商品个性化推荐系统。系统把训练好的推荐模型应用到系统中实现了不同推荐模块的选择功能,深度学习模型高阶特征学习能力解决数据稀疏性问题。多推荐模型和热门商品推荐功能解决了用户兴趣商品推荐,同时提高了系统的鲁棒性。后台管理系统实现了对商品和用户管理功能。
基于深度学习的商品个性化推荐系统设计与实现
这是一篇关于个性化推荐,协同过滤,DeepFM,NeuMF的论文, 主要内容为随着计算机技术迅速发展和我国网民人数高达9.04亿,网购成为人们购物的首选。传统推荐算法在商品爆炸式增长的情况下进行个性化推荐时,一直面临着数据稀疏、商品冷启动和用户兴趣难挖掘等问题。本文利用深度学习具有非线性学习能力,在推荐系统中能自动进行特征学习挖掘出用户及物品间的隐含和潜在特征,解决了用户兴趣难挖掘问题。用one-hot编码和Embedding嵌入层把高维稀疏的数据特征转化为低维稠密型特征,解决了数据的维度高和稀疏性问题。本文的主要工作如下:(1)对深度学习和推荐系统相关技术的研究分析。本文选择深度学习推荐模型DeepFM(DNN、FM)和基于神经网络的协同过滤算法模型NeuMF(GMF、MLP),并对模型特点详细介绍。(2)通过爬虫技术获取Tmall商城数据作为本实验数据集,用one-hot编码和Embedding嵌入层降维后的数据输入深度学习模型中训练。实验结果DeepFM的AUC分别比DNN和FM提高了2.66%和1.91%,损失函数值分别降低了12.1%和8.10%;NeuMF模型的损失函数值分别比GMF和MLP降低了18.75%、12.64%,HR命中率值分布提高了8.32%、5.61%。(3)对推荐系统进行需求分析和设计,用Django开发框架设计商品个性化推荐系统。系统把训练好的推荐模型应用到系统中实现了不同推荐模块的选择功能,深度学习模型高阶特征学习能力解决数据稀疏性问题。多推荐模型和热门商品推荐功能解决了用户兴趣商品推荐,同时提高了系统的鲁棒性。后台管理系统实现了对商品和用户管理功能。
基于深度学习的电影推荐系统研究与实现
这是一篇关于注意力机制,Embedding,推荐系统,DeepFM,LSTM的论文, 主要内容为随着互联网的飞速发展,数据信息呈指数级的增长,用户很容易迷失在海量数据中,这就是“信息过载”。尤其在电影领域,此类问题更加突出。作为缓解信息过载的有效手段,推荐系统被广泛研究。同时推荐系统能增加用户对互联网平台的黏性,为企业带来巨大利润,几乎成为互联网企业的“标配”。由此可见推荐系统具有巨大的研究价值。本文以电影推荐为背景展开研究,针对推荐场景中几个普遍存在的实际问题,提出了一些思想与算法。具体内容如下:(1)在推荐的召回阶段,通常使用深度结构语义模型(Deep Structured Semantic Model,DSSM)为每个用户和物品生成一个嵌入向量(Embedding),再使用近邻向量搜索算法进行向量召回,该模型也被称为DSSM双塔召回模型。然而这种双塔模型在生成用户嵌入向量时,将用户基本属性特征和用户行为特征混合输入,导致行为特征可能覆盖用户基本属性特征,使得用户嵌入向量难以表达基本属性特征;此外双塔召回模型直接将用户行为序列当作用户兴趣输入模型,将所有行为序列同等对待,没有区分行为的重要程度,使得用户嵌入向量的表达用户兴趣的能力不足。本文提出一种改进DSSM双塔召回模型,使用两个神经网络替代原始双塔模型中的用户塔,分别处理属性特征和行为特征,避免用户强行为特征覆盖属性特征。同时在处理行为特征的神经网络中,增加用户兴趣标签,使用注意力机制将用户行为和用户兴趣标签结合,对用户兴趣建模,增强嵌入向量的表达用户兴趣的能力。为了验证效果,本文在Movie Lens-1M和Netflix两个公开数据集上进行实验,与其他常用召回模型对比分析,实验表明,本文提出的召回模型具有更好的性能。(2)在推荐排序阶段,本文针对经典推荐模型深度因子分解机(Deep Factorization Machine,Deep FM)模型的不足,提出了一种新的模型Deep AFM-LSTM。Deep FM模型在进行特征组合时,没有区分特征的重要程度,可能引入无用噪声,使得模型收敛慢,影响模型性能;同时Deep FM将用户行为孤立对待,忽略了用户行为前后的关联信息。本文提出的模型在Deep FM基础上引入了注意力机制,自适应学习二阶特征组合的输出权重,避免无效特征对模型带来的噪声影响,加快模型收敛;此外在模型中加入长短期记忆网络(Long Short Term Memory,LSTM),学习用户行为序列中的隐含信息,充分挖掘数据特征。实验表明,该模型具有良好的推荐性能。最后,结合本文提出的推荐召回模型和推荐排序模型,实现了一个功能完善,交互良好的电影推荐系统。图36幅,表9个,参考文献60篇。
基于学习方法的广告投放转化效果优化研究
这是一篇关于广告转化效果,随机森林,DeepFM,边缘计算,迁移学习的论文, 主要内容为随着互联网和网络广告的发展,广告主对网络广告的要求也不断提高,其广告投放行为更趋于理性,也愈发追求基于广告转化来付费的投放方式。然而,转化用户预测偏差大、转化结果计算的高时延以及广告主的用户冷启动等问题,导致广告投放的转化效果并不理想。为了提升广告投放的转化效果,本文设计了基于学习方法的广告投放转化效果优化模型,具体如下:1.设计了基于RF+Deep FM的广告曝光转化率预测模型。本文提出了广告曝光转化率来代替广告转化率,以规避数据稀疏和样本选择偏差对转化用户预测的影响。同时设计了基于随机森林(Random Forest,RF)和Deep FM的算法模型对广告曝光转化率做精准预测,进一步提升广告转化用户的预测精准度。2.设计了基于计算迁移的实时边缘计算模型。本文设计了设备终端-计算节点-数据中心的实时边缘计算架构,来提升广告转化结果计算的实时性和可靠性。并在该边缘计算构架的基础上,通过计算迁移来进一步降低广告转化结果的计算时延,同时该计算迁移模型还能有效地降低广告平台计算节点的负载。低时延的广告转化结果计算能够实时判断广告投放转化效果,避免无效的广告投放。3.设计了基于用户兴趣度迁移学习的跨领域推荐方法。广告用户通过广告进入到广告主的应用中,由于缺乏历史行为数据,广告主的推荐系统无法对其进行个性化推荐,使得部分用户没能进行有效转化便流失了,即用户冷启动。为此,本文设计了一种用户兴趣度的迁移学习方法,通过迁移广告平台的用户兴趣度来解决广告主的用户冷启动问题,以促进广告用户转化,提升广告的转化效果。经实验证明,本文提出的广告曝光转化率相较于广告转化率,在转化用户预测上更胜一筹,具体来说,AUC值提升了0.0730,Logloss损失值降低了0.0614。同时,本文设计的RF+Deep FM的算法模型相较于单一Deep FM模型在转化用户预测上也有着不俗的表现,AUC值提升了0.0218,Logloss损失值降低了0.0430。基于计算迁移的广告转化结果计算模型在计算时延降低了0.86s,此外,还有效地降低了广告平台计算节点的服务负载。通过用户兴趣度迁移学习的跨领域推荐可有效解决广告主的用户冷启动问题,促进广告用户转化,实验表明,该跨领域推荐方法使得广告主的投放应用的下载注册率提升了4.3%。
基于矩阵分解和DeepFM的跨域推荐算法
这是一篇关于矩阵分解,跨域推荐,非负约束,辅助域,DeepFM的论文, 主要内容为随着机器学习技术的进步,推荐算法已融入到生活的各个方面,能够根据用户历史数据分析预测用户喜好,从而快速从海量信息中抽取用户感兴趣的信息。但单域推荐算法只能根据单一平台收集的数据为用户推荐,长时间会陷入固定门类中无法跳出。跨域推荐算法的出现缓解了该问题,将其它平台的相同用户数据作为辅助域,对模型的预测精度进行优化。矩阵分解作为跨域推荐算法的主流技术之一,目前已取得了大量成果。然而,当前矩阵分解算法分解出的潜在因子存在无意义的负数评分,对模型的参数拟合存在干扰,且分解速度较慢。此外,跨域推荐算法需要如何更优地融合不同本质属性的数据集也存在着优化空间。因此,本文从推荐系统中的矩阵分解和跨域推荐两方面进行研究,论文的主要工作如下:首先,提出了一种非负稀疏矩阵分解算法RENMF。针对矩阵分解算法存在的负数干扰问题,通过引入激活函数ReLU改进了传统的潜在因子分解算法,利用修正线性单元的非线性激活函数保证了矩阵分解的非负约束。同时,针对矩阵分解算法分解大规模矩阵时收敛速度较慢的问题,充分利用ReLU函数求导快速的特性与数值近似方法进一步提高了算法收敛速度。其次,提出了一种基于矩阵分解和DeepFM的跨域推荐算法RDF-CDR。针对跨域推荐算法的融合辅助域的问题,通过特征向量扩展方法实现了对不同本质的辅助域属性和目标域属性的特征对齐与数据集融合。同时,针对跨域推荐算法的预测准确率优化的问题,融合了提出的RENMF模型与经典的DeepFM模型,通过神经网络学习高阶非线性交叉特征保证了较高预测准确率,且算法的计算耗时较少。
基于GBDT和注意力机制的广告点击率预测的研究与应用
这是一篇关于点击率预测,GBDT,注意力机制,DeepFM,数据挖掘的论文, 主要内容为计算广告的核心问题——点击率预测,指的是预测用户是否会对某个广告产生点击行为,既是互联网企业盈利的关键一环,也是工业界和学术界的重点研究方向。同时,随着深度学习技术的发展,许多研究机构也开始将深度学习技术应用在点击率预测模型中。本文通过对现有的点击率预估模型进行深入的研究和总结,发现无论是传统的机器学习模型还是深度学习模型,在特征交互上都存在一定的不足,尤其缺乏对不同特征重要性的考虑。针对上述问题,本文创新地提出一种融合了GBDT、Deep FM、注意力机制的模型,即GBDT-Deep AFM模型。通过现有的真实广告点击率数据,对模型的效果进行了验证,本文的主要工作展开如下:(1)本文对使用的数据集进行了数据探索与特征工程,图表分析了数据集的特点以及部分特征的统计情况,并在业务理解的基础上,对数据集进行了衍生特征构造和统计型特征构造。(2)针对现有模型在特征交互上缺乏对特征重要性的考量,本文提出了GBDT-Deep AFM模型,模型在Deep FM模型的基础上加入注意力机制,使模型能够考虑到不同特征对模型预测结果的影响程度不同,同时又加入了GBDT模型,最终模型可以结合各个子模型的优点,更好地挖掘数据中的深层次信息。通过设计并实现离线实验,结果表明GBDT-Deep AFM模型的在AUC和Logloss都有较好的表现,具有良好的学习和泛化能力,在数据集上有较好的预测结果。(3)最后根据GBDT-DeepAFM模型,设计并实现了一个商品推荐系统,即将模型进行了应用,又利用系统更加直观的展示了模型的推荐效果。
面向患者的中成药推荐系统
这是一篇关于推荐系统,面向患者,中成药,DPCNN,DeepFM的论文, 主要内容为随着互联网电商和智能医学辅助诊断技术的发展,越来越多患者通过电商平台购买符合自己病症的药品。人们在网上购买药品时,往往面临盲目挑选、无专业人士指导的问题。根据2017年19省医疗机构用药错误大数据分析来看,其中用药错误有60.95%来自医生,34.57%来自药师。在实际诊疗过程中,若因用药错误导致治疗时机的延误或身体不可逆的伤害,会对个人和整个家庭造成巨大的损失。现阶段药品推荐系统主要面向医生,可辅助医生进行快速决策,进而提高医生的工作效率。但面向互联网、电商平台,以及医疗资源较为紧张的地区,则需要面向患者的中成药推荐系统,从而提高诊断准确率和治疗效果。针对常见药品推荐算法中预测准确率不高、需构建大量用户药品评分向量的问题,为了实现面向患者的中成药推荐、提升推荐用药的准确率,充分调研了深度学习文本分类模型、推荐系统排序模型,特别是相关模型在中医诊断学中的应用,并在此基础上分别开展了中医证型召回分类与中医证型排序算法的研究。本文主要研究工作及创新点如下:(1)提出了基于文本卷积神经网络的中医证型召回模型。模型的主体设计思想参考深度金字塔文本卷积结构,为了提高模型的召回准确率,构建了嵌入式融合患者特征的深度金字塔文本卷积神经网络。模型采用嵌入层融合患者的症状特征和基本信息特征,利用多尺度的卷积核实现文本区域基本特征的提取,随后采用连续的等长卷积块完成文本信息的长距离关联,通过重复下采样操作以及近路连接提取出复杂的上下文信息特征,提升了中医证型候选集合召回结果的准确率。(2)提出了基于深度学习的中医证型推荐排序模型。为了加强对患者交叉特征信息的利用,模型以DeepFM为基础结构,结合患者的当前特征与召回后的候选证型进行排序预测。由因子分解层和隐含层对低高阶特征分别处理,并将两者的输出进行拼接处理,完成低阶特征和高阶特征的融合。通过残差连接加深网络深度,加速模型的训练。最后依据预测的中医证型找出相应药品,完成中成药推荐系统的排序推荐。(3)分析面向患者的中成药推荐系统的功能及性能需求,采用高独立性、低耦合等设计理念,设计并实现了面向患者的中成药推荐系统,可辅助患者在海量的信息中找到最对症的药品。通过对系统计算效率、平台性能和可视化框架的综合分析,确定了以Flask为后端框架,JavaScript为前端语言,Echarts为可视化组件,MySQL为数据库的主要技术路线。通过PyTorch完成了中医证型分类模型和排序模型的构造工作,在此基础上搭建出面向患者的中成药推荐系统。并对实际案例进行测试,结果表明了面向患者的中成药推荐模型的性能符合推荐的预期效果。
基于深度学习的电影推荐系统研究与实现
这是一篇关于注意力机制,Embedding,推荐系统,DeepFM,LSTM的论文, 主要内容为随着互联网的飞速发展,数据信息呈指数级的增长,用户很容易迷失在海量数据中,这就是“信息过载”。尤其在电影领域,此类问题更加突出。作为缓解信息过载的有效手段,推荐系统被广泛研究。同时推荐系统能增加用户对互联网平台的黏性,为企业带来巨大利润,几乎成为互联网企业的“标配”。由此可见推荐系统具有巨大的研究价值。本文以电影推荐为背景展开研究,针对推荐场景中几个普遍存在的实际问题,提出了一些思想与算法。具体内容如下:(1)在推荐的召回阶段,通常使用深度结构语义模型(Deep Structured Semantic Model,DSSM)为每个用户和物品生成一个嵌入向量(Embedding),再使用近邻向量搜索算法进行向量召回,该模型也被称为DSSM双塔召回模型。然而这种双塔模型在生成用户嵌入向量时,将用户基本属性特征和用户行为特征混合输入,导致行为特征可能覆盖用户基本属性特征,使得用户嵌入向量难以表达基本属性特征;此外双塔召回模型直接将用户行为序列当作用户兴趣输入模型,将所有行为序列同等对待,没有区分行为的重要程度,使得用户嵌入向量的表达用户兴趣的能力不足。本文提出一种改进DSSM双塔召回模型,使用两个神经网络替代原始双塔模型中的用户塔,分别处理属性特征和行为特征,避免用户强行为特征覆盖属性特征。同时在处理行为特征的神经网络中,增加用户兴趣标签,使用注意力机制将用户行为和用户兴趣标签结合,对用户兴趣建模,增强嵌入向量的表达用户兴趣的能力。为了验证效果,本文在Movie Lens-1M和Netflix两个公开数据集上进行实验,与其他常用召回模型对比分析,实验表明,本文提出的召回模型具有更好的性能。(2)在推荐排序阶段,本文针对经典推荐模型深度因子分解机(Deep Factorization Machine,Deep FM)模型的不足,提出了一种新的模型Deep AFM-LSTM。Deep FM模型在进行特征组合时,没有区分特征的重要程度,可能引入无用噪声,使得模型收敛慢,影响模型性能;同时Deep FM将用户行为孤立对待,忽略了用户行为前后的关联信息。本文提出的模型在Deep FM基础上引入了注意力机制,自适应学习二阶特征组合的输出权重,避免无效特征对模型带来的噪声影响,加快模型收敛;此外在模型中加入长短期记忆网络(Long Short Term Memory,LSTM),学习用户行为序列中的隐含信息,充分挖掘数据特征。实验表明,该模型具有良好的推荐性能。最后,结合本文提出的推荐召回模型和推荐排序模型,实现了一个功能完善,交互良好的电影推荐系统。图36幅,表9个,参考文献60篇。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设向导 ,原文地址:https://m.bishedaima.com/lunwen/48016.html