面向不平衡与稀疏数据的推荐算法研究
这是一篇关于推荐算法,类别不均衡,数据稀疏,相似性计算的论文, 主要内容为随着信息产业飞速发展,人们网上购物越来越多,信息过载问题随之产生,尤其是电商领域。推荐系统产生不仅可以提高用户购物体验,同时能够增加商家收益,达到双赢目的。针对用户基本数据中性别缺失严重并且带有性别标签的样本存在类别不平衡、评论等级数据稀疏以及相似性计算量过大等问题,本文对电商购物平台的用户行为数据进行分析,提出一种面向不平衡与稀疏数据的商品推荐模型。本文主要工作内容如下:1.针对电商平台用户基本数据中性别缺失严重、带有性别标签的样本存在类别不平衡等问题,本文提出一种SMOTERF的性别预测方法。该方法首先利用SMOTE算法处理性别标签样本不平衡的问题,得到性别标签平衡的数据;然后利用随机森林模型进行训练;最后利用训练好的模型对缺失性别标签的样本进行预测。通过采用不同的模型分别对原始数据、随机过采样均衡化处理的数据、SMOTE采样均衡化处理的数据进行实验对比,结果分析表明经过SMOTE采样后利用随机森林模型进行性别预测的F1值最高,说明本文提出方法的有效性。2.针对电商平台中用户-商品评论等级数据稀疏性的问题,本文提出一种动态交叉填充DCF方法。该方法首先将用户基本信息与点击行为进行关联,通过关联后的数据计算用户相似性,利用商品信息数据计算商品相似性;然后,每次将二者中相似性最大的添加到集合中并降序排序,依次按照集合中大于设定阈值的相似性进行动态交叉填充;最后,基于上步填充的数据重复上述过程进行动态交叉填充,缓解数据的稀疏程度,为基于商品的推荐模型构建提供良好的实验数据。3.针对推荐过程中相似性计算量过大的问题,本文提出利用一种改进的PKMeans聚类算法来减小相似性计算量,提高推荐效率。基于此,构建本文的推荐模型。首先利用改进的PKMeans算法对填充后用户-商品评论等级数据按照商品进行聚类;然后只对同一簇中样本进行相似性计算;最后结合性别因素,将与该商品的相似度大于设定阈值的商品进行推荐。实验结果进一步表明本文所提面向不平衡与稀疏数据的推荐模型效率以及准确度更高。
基于知识图谱的学生实训方向推荐方法研究
这是一篇关于知识图谱,推荐算法,混合聚类,权重标签,相似性计算的论文, 主要内容为数据呈爆发式增长的时代,推荐算法在大数据环境下逐渐变得热门,个性化推荐系统作为目前广泛使用的信息过滤手段,主动为用户推荐感兴趣的内容,有效缩减了决策时间成本,同时个性化推荐可以让推荐更加贴合用户偏好,使推荐达到“千人千面”的效果。知识图谱是数据驱动时代下人工智能的重要分支,也是让机器具有认知能力的基石。基于知识图谱的推荐算法可以为推荐算法提供丰富的先验知识提高推荐的精确性、多样性和可解释性。参考中北大学软件学院本科的培养方式,每届大三学生都需要选择实训方向,然而每年都有大部分学生在选择实训方向时而迷茫,本文结合实际情况,以学生信息构建知识图谱为基础,改进现有推荐算法,提出了新的个性化推荐方法并应用于学生实训方向推荐中,避免了大家盲目从众选方向的问题,也避免出现个别方向冷门和爆满的情况,具有实际意义和应用价值。本文围绕构建学生信息知识图谱和改进个性化推荐算法为主线展开研究,本文的主要工作包括:(1)构建学生信息知识图谱。设计并整理学生兴趣调查问卷,对三个年级两千多学生的信息进行数据处理后,利用Neo4j图数据库构建学生相关信息的知识图谱,以历年学院设置的实训方向为基础结合软件行业最新发展趋势设置实训方向。(2)改进推荐算法。协同过滤推荐算法是目前最常用的推荐方法,在此基础上,本文先将数据利用Canopy和Bi-Kmeans进行混合聚类,考虑到用户兴趣会发生变化,在计算用户兴趣偏好时将TF-IDF方法中增加时间系数,计算出用户兴趣偏好得到融合用户兴趣的混合聚类模型,然后将用户个人属性融合到个性化推荐中得到新的相似性计算模型。最后将构建好的知识图谱和推荐算法应用到学生实训方向推荐系统中。(3)设计并实现学生实训方向推荐系统。系统中展示了实训相关信息;生成用户画像;以成绩为主要推荐依据,个人兴趣等统计调查的信息进行辅助推荐,针对学生用户生成实训方向推荐列表。
基于矩阵分解的协同过滤推荐算法研究
这是一篇关于推荐算法,矩阵分解,相似性计算,深度学习,最长公共子序列的论文, 主要内容为随着网络信息技术的快速发展,信息过载成为大数据时代的一个普遍问题,推荐系统(Recommendation Systems)在解决信息过载问题上发挥着至关重要的作用。但网络上可访问的数据量急速增长导致数据稀疏问题,这意味着明确的评分反馈并不总是可用的,而且主流的推荐算法都忽略了近期偏好对用户相似性以及推荐结果排名的影响。这些问题都成为了影响协同过滤(Collaborative Filtering)推荐算法推荐精度的因素。本文基于以上问题进行了深入研究,考虑与用户相关的更多信息,包括用户间的非联合评分项、项目在消费时的顺序或用户与项目之间的整个交互模式等,对协同过滤推荐算法的用户相似性计算以及矩阵分解方法进行改进。论文研究的主要内容如下:(1)对推荐系统的基本原理、分类进行了详细的阐述,并对传统相似性算法以及矩阵分解方法深入分析,研究了基于模型的协同过滤推荐算法的特点,并以此为根据给出了矩阵分解模型的基本求解流程。(2)针对传统协同过滤推荐方法中用户评分信息密度稀疏导致推荐准确度不高的问题,提出一种基于KL散度的概率矩阵分解推荐算法。该算法首先综合用户间的联合评分项以及非联合评分项,利用KL散度得到相似用户排名,使得相似用户间的特征向量更加接近。并在概率矩阵分解过程中维持这种关系,从而提高模型的预测精度。(3)针对用户评分信息密度稀疏以及推荐结果排序问题,提出一种基于最长公共子序列的深度神经网络矩阵分解推荐算法。该算法将用户信息作为类序列,采用最长公共子序列算法寻找相似用户,让近期更符合用户兴趣的推荐结果出现在更靠前的位置,使得相似用户间的隐藏特征向量更加接近。并在运用深度神经网络学习用户和项目之间的隐藏特征时结合相似用户,进一步提高模型的预测精度。最后在MovieLens 1M和Epinions数据集上进行对比实验,实验结果表明本文所提出的两种基于矩阵分解的协同过滤推荐算法在各项性能指标上均表现优秀,充分验证了本文所提出的算法在稀疏数据集上推荐效果的有效性。图[19]表[7]参[75]
面向不平衡与稀疏数据的推荐算法研究
这是一篇关于推荐算法,类别不均衡,数据稀疏,相似性计算的论文, 主要内容为随着信息产业飞速发展,人们网上购物越来越多,信息过载问题随之产生,尤其是电商领域。推荐系统产生不仅可以提高用户购物体验,同时能够增加商家收益,达到双赢目的。针对用户基本数据中性别缺失严重并且带有性别标签的样本存在类别不平衡、评论等级数据稀疏以及相似性计算量过大等问题,本文对电商购物平台的用户行为数据进行分析,提出一种面向不平衡与稀疏数据的商品推荐模型。本文主要工作内容如下:1.针对电商平台用户基本数据中性别缺失严重、带有性别标签的样本存在类别不平衡等问题,本文提出一种SMOTERF的性别预测方法。该方法首先利用SMOTE算法处理性别标签样本不平衡的问题,得到性别标签平衡的数据;然后利用随机森林模型进行训练;最后利用训练好的模型对缺失性别标签的样本进行预测。通过采用不同的模型分别对原始数据、随机过采样均衡化处理的数据、SMOTE采样均衡化处理的数据进行实验对比,结果分析表明经过SMOTE采样后利用随机森林模型进行性别预测的F1值最高,说明本文提出方法的有效性。2.针对电商平台中用户-商品评论等级数据稀疏性的问题,本文提出一种动态交叉填充DCF方法。该方法首先将用户基本信息与点击行为进行关联,通过关联后的数据计算用户相似性,利用商品信息数据计算商品相似性;然后,每次将二者中相似性最大的添加到集合中并降序排序,依次按照集合中大于设定阈值的相似性进行动态交叉填充;最后,基于上步填充的数据重复上述过程进行动态交叉填充,缓解数据的稀疏程度,为基于商品的推荐模型构建提供良好的实验数据。3.针对推荐过程中相似性计算量过大的问题,本文提出利用一种改进的PKMeans聚类算法来减小相似性计算量,提高推荐效率。基于此,构建本文的推荐模型。首先利用改进的PKMeans算法对填充后用户-商品评论等级数据按照商品进行聚类;然后只对同一簇中样本进行相似性计算;最后结合性别因素,将与该商品的相似度大于设定阈值的商品进行推荐。实验结果进一步表明本文所提面向不平衡与稀疏数据的推荐模型效率以及准确度更高。
基于门控图神经网络特征提取的序列推荐研究
这是一篇关于门控图神经网络,特征记忆存储,相似性计算,序列推荐的论文, 主要内容为信息由一个个数据构成,数据间差异性顺序关系可以表达出不同的信息内容,将顺序关系决定表达信息内容的数据统称为序列数据。在互联网上,用户通过网络浏览商品、点击商品、对比商品最后购买商品,完成消费行为。用户对商品的操作被记录为交互数据,通过分析用户交互数据可以挖掘到用户的偏好,投其所好的给予用户消费建议。交互数据具有一个共同的特征:稀疏性。数据稀疏性主要来自两方面,一方面用户数量远小于商品数量,两者是一对多的关系;另一方面用户历史交互记录不完整,分析用户层面的原因:用户不登录浏览或者是新用户注册,留存的用户行为信息不足以进行偏好分析。商品数量庞大、用户信息不完整,导致交互数据稀疏。将交互数据划分为序列可以有效降低数据稀疏性对推荐生成的影响,在此应用背景下本文研究关于序列数据推荐问题。本文主要依据用户点击交互行为序列数据进行推荐研究,采用门控图神经网络(Graph Neural Networks with GRU,GGNN)进行特征嵌入,分三个阶段对序列推荐系统进行了研究:第一阶段提出基于门控图神经网络对Item结构特征提取的会话推荐模型(SISFGRS)。利用序列数据划分出的短序列(也称会话数据),依据点击先后顺序生成有向图,经过GGNN进行图结构的特征捕获。门控图神经网络可以捕获图结构整体信息并融合节点信息生成特征向量,就此提出用户点击产生的会话图反映会话制造者的当前兴趣偏好,提取为用户特征向量;全部的会话构成商品(Item)转换结构图,对结构图进行特征提取,反映Item的特征向量。借助门控图神经网络提取用户特征向量和Item特征向量,解决了会话推荐中由于用户信息不足造成的匿名问题。第二阶段提出基于知识图谱结构优化GGNN序列推荐(KGQRS)。利用知识图谱存储思想,针对第一阶段方法GGNN提取计算的Item特征向量进行存储,视为终端查询结果(尾实体);第一阶段方法训练好的用户特征向量作为索引地址(中间类别属性),本阶段称为用户类别;新输入的序列数据视为查询向量(头实体)。整个推荐过程即可描述为新用户的点击序列被捕获分析,与原有的用户类别(用户特征向量)进行相似性计算,在存储矩阵中匹配查询找到相似用户对应的喜好Item,作为推荐结果返回值。预先存储功能提升了推荐计算速度,也缓解了推荐冷启动的难题。第三阶段提出基于GGNN特征提取的距离相似性优化算法(SIMDGRS)。利用经典的相似性计算无法满足稀疏数据特征向量在方向和大小上的多维度相似,因此引入空间距离相似性优化算法。将门控神经网络提取到的特征向量映射到低维向量空间中,利用目标点到计算点的方向投影距离作为相似指标,综合了距离和方向多维的相似,提升了在交互数据稀疏问题中序列推荐的准确性。以上三个阶段针对于序列推荐的研究依托于GGNN特征提取进行数据处理,本文在真实数据集上利用提出的优化方法针对提出的关于序列推荐的三个研究进行了实验验证,实验结果均证明了所提方法在提升序列推荐性能的有效性。
基于矩阵分解的协同过滤推荐算法研究
这是一篇关于推荐算法,矩阵分解,相似性计算,深度学习,最长公共子序列的论文, 主要内容为随着网络信息技术的快速发展,信息过载成为大数据时代的一个普遍问题,推荐系统(Recommendation Systems)在解决信息过载问题上发挥着至关重要的作用。但网络上可访问的数据量急速增长导致数据稀疏问题,这意味着明确的评分反馈并不总是可用的,而且主流的推荐算法都忽略了近期偏好对用户相似性以及推荐结果排名的影响。这些问题都成为了影响协同过滤(Collaborative Filtering)推荐算法推荐精度的因素。本文基于以上问题进行了深入研究,考虑与用户相关的更多信息,包括用户间的非联合评分项、项目在消费时的顺序或用户与项目之间的整个交互模式等,对协同过滤推荐算法的用户相似性计算以及矩阵分解方法进行改进。论文研究的主要内容如下:(1)对推荐系统的基本原理、分类进行了详细的阐述,并对传统相似性算法以及矩阵分解方法深入分析,研究了基于模型的协同过滤推荐算法的特点,并以此为根据给出了矩阵分解模型的基本求解流程。(2)针对传统协同过滤推荐方法中用户评分信息密度稀疏导致推荐准确度不高的问题,提出一种基于KL散度的概率矩阵分解推荐算法。该算法首先综合用户间的联合评分项以及非联合评分项,利用KL散度得到相似用户排名,使得相似用户间的特征向量更加接近。并在概率矩阵分解过程中维持这种关系,从而提高模型的预测精度。(3)针对用户评分信息密度稀疏以及推荐结果排序问题,提出一种基于最长公共子序列的深度神经网络矩阵分解推荐算法。该算法将用户信息作为类序列,采用最长公共子序列算法寻找相似用户,让近期更符合用户兴趣的推荐结果出现在更靠前的位置,使得相似用户间的隐藏特征向量更加接近。并在运用深度神经网络学习用户和项目之间的隐藏特征时结合相似用户,进一步提高模型的预测精度。最后在MovieLens 1M和Epinions数据集上进行对比实验,实验结果表明本文所提出的两种基于矩阵分解的协同过滤推荐算法在各项性能指标上均表现优秀,充分验证了本文所提出的算法在稀疏数据集上推荐效果的有效性。图[19]表[7]参[75]
电子商务个性化推荐系统研究
这是一篇关于个性化推荐系统,协同过滤,相似性计算,兴趣点差异,新项目问题的论文, 主要内容为Web2.0时代,电子商务得到飞速的发展。但是随着电子商务发展不可避免的带来了“信息超载”问题,解决这一问题的方法就是使用个性化推荐系统。电子商务个性化推荐系统(Personalized Recommendation Systems for E-Commerce)是利用电子商务网站向客户提供信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。优质的个性化推荐系统带来了巨大的经济价值和社会价值的同时,也能提高电子商务网站在当今激烈的市场竞争环境下的存活能力。 本文详细介绍了个性化推荐系统中常用的几种推荐算法如:协同过滤推荐算法、基于内容的推荐算法、基于网格的推荐算法等,并一一介绍和分析它们的优缺点,其中协同过滤推荐算法是当今存在最久且使用最广的推荐算法。针对传统的协同过滤推荐算法中存在的问题:相似性计算中并没有考虑单个用户兴趣点之间的差异、用户间共同评分项目过少对相似性计算结果带来的偏差以及新项目问题,提出了相应的改进算法。在改进的协同过滤算法中,使用在一定程度上反映出单个用户兴趣点差异的项目相关性去修正Pearson系数,然后将这个修正的Pearson系数与用户共同评分的条件概率进行相乘,得到最终的相似性结果。对于新项目问题,在基于项目的协同过滤推荐算法基础上通过项目相关性的计算来修正原来的基于项目的协同过滤推荐算法对于新项目无法获取最邻项目集这一问题。然后在MovieLens数据集中验证这个改进的协同过滤算法和新项目问题解决方案,通过与传统的协同过滤推荐算法比较精确度得出了改进的协同过滤推荐算法的确提高了推荐结果的精度,此外,通过计算新项目问题的解决方案在MovieLens数据集中的MAE值得出该解决方案能在一定程度上解决新项目问题,从而得出本文提出的该解决方案是有效、可行的。 最后将这个改进的协同过滤推荐算法使用在一个团购平台项目中,介绍了相应的推荐模块的设计和实现,最终达到实用的目的。
面向不平衡与稀疏数据的推荐算法研究
这是一篇关于推荐算法,类别不均衡,数据稀疏,相似性计算的论文, 主要内容为随着信息产业飞速发展,人们网上购物越来越多,信息过载问题随之产生,尤其是电商领域。推荐系统产生不仅可以提高用户购物体验,同时能够增加商家收益,达到双赢目的。针对用户基本数据中性别缺失严重并且带有性别标签的样本存在类别不平衡、评论等级数据稀疏以及相似性计算量过大等问题,本文对电商购物平台的用户行为数据进行分析,提出一种面向不平衡与稀疏数据的商品推荐模型。本文主要工作内容如下:1.针对电商平台用户基本数据中性别缺失严重、带有性别标签的样本存在类别不平衡等问题,本文提出一种SMOTERF的性别预测方法。该方法首先利用SMOTE算法处理性别标签样本不平衡的问题,得到性别标签平衡的数据;然后利用随机森林模型进行训练;最后利用训练好的模型对缺失性别标签的样本进行预测。通过采用不同的模型分别对原始数据、随机过采样均衡化处理的数据、SMOTE采样均衡化处理的数据进行实验对比,结果分析表明经过SMOTE采样后利用随机森林模型进行性别预测的F1值最高,说明本文提出方法的有效性。2.针对电商平台中用户-商品评论等级数据稀疏性的问题,本文提出一种动态交叉填充DCF方法。该方法首先将用户基本信息与点击行为进行关联,通过关联后的数据计算用户相似性,利用商品信息数据计算商品相似性;然后,每次将二者中相似性最大的添加到集合中并降序排序,依次按照集合中大于设定阈值的相似性进行动态交叉填充;最后,基于上步填充的数据重复上述过程进行动态交叉填充,缓解数据的稀疏程度,为基于商品的推荐模型构建提供良好的实验数据。3.针对推荐过程中相似性计算量过大的问题,本文提出利用一种改进的PKMeans聚类算法来减小相似性计算量,提高推荐效率。基于此,构建本文的推荐模型。首先利用改进的PKMeans算法对填充后用户-商品评论等级数据按照商品进行聚类;然后只对同一簇中样本进行相似性计算;最后结合性别因素,将与该商品的相似度大于设定阈值的商品进行推荐。实验结果进一步表明本文所提面向不平衡与稀疏数据的推荐模型效率以及准确度更高。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码小屋 ,原文地址:https://m.bishedaima.com/lunwen/49162.html