5个研究背景和意义示例,教你写计算机Hellinger距离论文

今天分享的是关于Hellinger距离的5篇计算机毕业论文范文, 如果你的论文涉及到Hellinger距离等主题,本文能够帮助到你 面向稀疏数据的混合推荐算法研究 这是一篇关于Hellinger距离

今天分享的是关于Hellinger距离的5篇计算机毕业论文范文, 如果你的论文涉及到Hellinger距离等主题,本文能够帮助到你

面向稀疏数据的混合推荐算法研究

这是一篇关于Hellinger距离,Manhattan距离,数据稀疏性,相似性模型,邻居利用率,协同过滤,推荐算法的论文, 主要内容为随着信息技术的高速发展以及互联网的普及,社会的信息化特征也逐步凸显出来。互联网在为用户带来便捷的同时也给人们带来了一定的困扰,主要表现为互联网中信息泛滥,人们无法在短时间内快速有效的找到自身所需要的内容,即所谓的“信息过载”问题。而协同过滤算法目前推荐领域中研究最成熟、应用最广泛的一种推荐技术。相似性度量以及用户偏好预测是协同过滤算法的两大核心要点。虽然现有研究已经提出了多种相似性模型、预测方法,但它们中仍存在一些问题:一是传统的用户相似性模型仅利用了共同评分项来计算用户间的相似性,使得数据集的稀疏性问题变得更为严重,多数项目相似性方法也存在类似缺陷。二是仅将用户评分信息作为数据源去衡量用户相似性,而忽略了项目自身的一些属性,使得相似性计算结果的可解释性较差。三是虽然利用相似性模型为目标用户(目标项目)找到了高质量的邻居,但仅有很小一部分邻居可参与预测过程,导致预测结果的可靠性较差。本文针对上述问题进行了深入研究,主要工作和研究内容如下。第一,提出适应稀疏环境的相似性度量方法。大多数用户相似性模型在计算用户相似性时要求两个用户对同一项目进行过评分操作。类似的,大多数项目相似性模型在计算项目相似性时要求两个项目由同一用户评论过,加剧了数据集的稀疏性。本文分别将海林格(Hellinger)距离、曼哈顿(Manhattan)距离引入用户与项目的相似性计算中,从概率分布的角度衡量用户、项目间的相似性,打破了传统相似性方法的约束,在一定程度上缓解了数据集的稀疏性问题。第二,设计多维度用户相似性模型。传统的协同过滤算法只依靠用户评分值计算用相似性,维度单一,度量的全面性不足。本文构造了一个用户-标签矩阵,并基于此提出一种混合用户评分与项目标签的用户相似性模型。与传统用户相似性模型相比。本文所提出的用户相似性模型更加全面、可解释性更强。此外,由于商品标签的数量远远小于商品的数量,因此本文所提出的相似性模型也具有较高的效率。第三,提出两种改进的预测方法。传统的基于用户的评分预测模型要求邻居用户需评论过目标项目,但由于数据集的稀疏性,很难保证所有的邻居用户评论过目标项目。为此,本文提出了一种新的基于用户的评分预测模型。该模型中,对于未评论过目标项目的邻居用户,则使用该用户评论过的项目中与目标项目最相似的项目去替代目标项目。类似的,传统的基于项目的评分预测模型要求目标用户需评论过邻居项目,由于数据集的稀疏性,大多数邻居项目也同样不满足该约束条件。于是,本文设计了一种新的基于项目的评分预测模型,该模型采用了一种新的寻找最近邻居项目的策略,即在目标用户评论过的项目中寻找目标项目的邻居项目,这样可以保证目标用户评论过邻居集中的每一个项目。实验结果表明,本文所提出的两种预测模型在显著性提升了邻居利用率的同时,也能有效提高推荐准确性。

基于Hellinger距离相似性度量的协同过滤推荐算法研究

这是一篇关于Hellinger距离,协同过滤,个性化推荐,相似性度量,数据分类的论文, 主要内容为近年来,随着互联网的快速发展,人们已经进入了大数据时代,各种信息数据都在实现着爆炸式的指数型增长,数据信息量处于过载状态。个性化推荐系统作为解决信息过载问题的有效手段,现已经广泛地应用到如电商平台,电影推荐,音乐推荐等各个领域当中,对于推荐算法的不断优化和改进,不仅能够提高用户体验,还能带来一定的商业价值,推动其他行业的发展。在推荐系统中推荐算法是最为关键的部分,良好的推荐算法能快速且较为准确的预测用户行为。如此之多的个性化推荐算法当中,协同过滤算法由于其简单,高效,准确的特点,从众多的个性化推荐算法中脱颖而出,成为目前应用最为广泛应用,最为经典的推荐技术。由于数据量的不断增大,这使得协同过滤算法面临数据稀疏和系统冷启动等难题。国内外科研学者对于此难题也都提出了各自的解决办法,通过避免或者缓解上述问题,能够有效提高推荐结果的准确性。本文提出一种新颖的相似度度量方式,基于Hellinger距离相似度的推荐算法,该方法有别于目前协同过滤算法中常用到的相似性度量方法,通过从评分概率分布的角度计算项目间的相似度。为了验证该方法的有效性,本文设计了三个对比实验。首先,将传统的相似性计算方法得到的推荐结果与本文基于Hellinger距离的相似性度量得到推荐结果进行对比,实验结果表明本文相似性度量方法应用于协同过滤推荐算法中是可行的,且算法有着良好准确度。其次,本文提出将数据集分类粒化的方法,在分类后的数据集合中计算项目相似度,通过与未分类数据对比实验,验证了经分类处理后的相似性度量能提高算法准确度。最后,将本文算法和Slope One算法进行对比实验,探究其与经典协同过滤推荐算法的整体表现差异。本文提出的方法能够有效地避免相似度计算过程中评分矩阵的数据稀疏性问题,并且相似度计算结果更加精确。

基于Hellinger距离相似性度量的协同过滤推荐算法研究

这是一篇关于Hellinger距离,协同过滤,个性化推荐,相似性度量,数据分类的论文, 主要内容为近年来,随着互联网的快速发展,人们已经进入了大数据时代,各种信息数据都在实现着爆炸式的指数型增长,数据信息量处于过载状态。个性化推荐系统作为解决信息过载问题的有效手段,现已经广泛地应用到如电商平台,电影推荐,音乐推荐等各个领域当中,对于推荐算法的不断优化和改进,不仅能够提高用户体验,还能带来一定的商业价值,推动其他行业的发展。在推荐系统中推荐算法是最为关键的部分,良好的推荐算法能快速且较为准确的预测用户行为。如此之多的个性化推荐算法当中,协同过滤算法由于其简单,高效,准确的特点,从众多的个性化推荐算法中脱颖而出,成为目前应用最为广泛应用,最为经典的推荐技术。由于数据量的不断增大,这使得协同过滤算法面临数据稀疏和系统冷启动等难题。国内外科研学者对于此难题也都提出了各自的解决办法,通过避免或者缓解上述问题,能够有效提高推荐结果的准确性。本文提出一种新颖的相似度度量方式,基于Hellinger距离相似度的推荐算法,该方法有别于目前协同过滤算法中常用到的相似性度量方法,通过从评分概率分布的角度计算项目间的相似度。为了验证该方法的有效性,本文设计了三个对比实验。首先,将传统的相似性计算方法得到的推荐结果与本文基于Hellinger距离的相似性度量得到推荐结果进行对比,实验结果表明本文相似性度量方法应用于协同过滤推荐算法中是可行的,且算法有着良好准确度。其次,本文提出将数据集分类粒化的方法,在分类后的数据集合中计算项目相似度,通过与未分类数据对比实验,验证了经分类处理后的相似性度量能提高算法准确度。最后,将本文算法和Slope One算法进行对比实验,探究其与经典协同过滤推荐算法的整体表现差异。本文提出的方法能够有效地避免相似度计算过程中评分矩阵的数据稀疏性问题,并且相似度计算结果更加精确。

基于Hellinger距离相似性度量的协同过滤推荐算法研究

这是一篇关于Hellinger距离,协同过滤,个性化推荐,相似性度量,数据分类的论文, 主要内容为近年来,随着互联网的快速发展,人们已经进入了大数据时代,各种信息数据都在实现着爆炸式的指数型增长,数据信息量处于过载状态。个性化推荐系统作为解决信息过载问题的有效手段,现已经广泛地应用到如电商平台,电影推荐,音乐推荐等各个领域当中,对于推荐算法的不断优化和改进,不仅能够提高用户体验,还能带来一定的商业价值,推动其他行业的发展。在推荐系统中推荐算法是最为关键的部分,良好的推荐算法能快速且较为准确的预测用户行为。如此之多的个性化推荐算法当中,协同过滤算法由于其简单,高效,准确的特点,从众多的个性化推荐算法中脱颖而出,成为目前应用最为广泛应用,最为经典的推荐技术。由于数据量的不断增大,这使得协同过滤算法面临数据稀疏和系统冷启动等难题。国内外科研学者对于此难题也都提出了各自的解决办法,通过避免或者缓解上述问题,能够有效提高推荐结果的准确性。本文提出一种新颖的相似度度量方式,基于Hellinger距离相似度的推荐算法,该方法有别于目前协同过滤算法中常用到的相似性度量方法,通过从评分概率分布的角度计算项目间的相似度。为了验证该方法的有效性,本文设计了三个对比实验。首先,将传统的相似性计算方法得到的推荐结果与本文基于Hellinger距离的相似性度量得到推荐结果进行对比,实验结果表明本文相似性度量方法应用于协同过滤推荐算法中是可行的,且算法有着良好准确度。其次,本文提出将数据集分类粒化的方法,在分类后的数据集合中计算项目相似度,通过与未分类数据对比实验,验证了经分类处理后的相似性度量能提高算法准确度。最后,将本文算法和Slope One算法进行对比实验,探究其与经典协同过滤推荐算法的整体表现差异。本文提出的方法能够有效地避免相似度计算过程中评分矩阵的数据稀疏性问题,并且相似度计算结果更加精确。

面向稀疏数据的混合推荐算法研究

这是一篇关于Hellinger距离,Manhattan距离,数据稀疏性,相似性模型,邻居利用率,协同过滤,推荐算法的论文, 主要内容为随着信息技术的高速发展以及互联网的普及,社会的信息化特征也逐步凸显出来。互联网在为用户带来便捷的同时也给人们带来了一定的困扰,主要表现为互联网中信息泛滥,人们无法在短时间内快速有效的找到自身所需要的内容,即所谓的“信息过载”问题。而协同过滤算法目前推荐领域中研究最成熟、应用最广泛的一种推荐技术。相似性度量以及用户偏好预测是协同过滤算法的两大核心要点。虽然现有研究已经提出了多种相似性模型、预测方法,但它们中仍存在一些问题:一是传统的用户相似性模型仅利用了共同评分项来计算用户间的相似性,使得数据集的稀疏性问题变得更为严重,多数项目相似性方法也存在类似缺陷。二是仅将用户评分信息作为数据源去衡量用户相似性,而忽略了项目自身的一些属性,使得相似性计算结果的可解释性较差。三是虽然利用相似性模型为目标用户(目标项目)找到了高质量的邻居,但仅有很小一部分邻居可参与预测过程,导致预测结果的可靠性较差。本文针对上述问题进行了深入研究,主要工作和研究内容如下。第一,提出适应稀疏环境的相似性度量方法。大多数用户相似性模型在计算用户相似性时要求两个用户对同一项目进行过评分操作。类似的,大多数项目相似性模型在计算项目相似性时要求两个项目由同一用户评论过,加剧了数据集的稀疏性。本文分别将海林格(Hellinger)距离、曼哈顿(Manhattan)距离引入用户与项目的相似性计算中,从概率分布的角度衡量用户、项目间的相似性,打破了传统相似性方法的约束,在一定程度上缓解了数据集的稀疏性问题。第二,设计多维度用户相似性模型。传统的协同过滤算法只依靠用户评分值计算用相似性,维度单一,度量的全面性不足。本文构造了一个用户-标签矩阵,并基于此提出一种混合用户评分与项目标签的用户相似性模型。与传统用户相似性模型相比。本文所提出的用户相似性模型更加全面、可解释性更强。此外,由于商品标签的数量远远小于商品的数量,因此本文所提出的相似性模型也具有较高的效率。第三,提出两种改进的预测方法。传统的基于用户的评分预测模型要求邻居用户需评论过目标项目,但由于数据集的稀疏性,很难保证所有的邻居用户评论过目标项目。为此,本文提出了一种新的基于用户的评分预测模型。该模型中,对于未评论过目标项目的邻居用户,则使用该用户评论过的项目中与目标项目最相似的项目去替代目标项目。类似的,传统的基于项目的评分预测模型要求目标用户需评论过邻居项目,由于数据集的稀疏性,大多数邻居项目也同样不满足该约束条件。于是,本文设计了一种新的基于项目的评分预测模型,该模型采用了一种新的寻找最近邻居项目的策略,即在目标用户评论过的项目中寻找目标项目的邻居项目,这样可以保证目标用户评论过邻居集中的每一个项目。实验结果表明,本文所提出的两种预测模型在显著性提升了邻居利用率的同时,也能有效提高推荐准确性。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码工坊 ,原文地址:https://m.bishedaima.com/lunwen/56053.html

相关推荐

发表回复

登录后才能评论