给大家分享7篇关于混合相似度的计算机专业论文

今天分享的是关于混合相似度的7篇计算机毕业论文范文, 如果你的论文涉及到混合相似度等主题,本文能够帮助到你 基于稀疏矩阵的推荐算法研究 这是一篇关于协同过滤推荐,数据稀疏

今天分享的是关于混合相似度的7篇计算机毕业论文范文, 如果你的论文涉及到混合相似度等主题,本文能够帮助到你

基于稀疏矩阵的推荐算法研究

这是一篇关于协同过滤推荐,数据稀疏,相似填充法,k-means聚类,混合相似度的论文, 主要内容为在这个互联网技术引领潮流的时代,网络空间中数据和信息的数量多到难以统计,人们迫切的需要从海量的信息数据中“检索”出需要的内容。推荐系统通过将物品与信息联系起来成为了“信息检索”的一把利剑。在实际应用中以电子商务为例,高质量的推荐系统一方面可以帮助电子商务平台提高销售量,另一方面还可以提高顾客对电子商务平台的满意度。本文以研究协同过滤推荐算法为基础,针对该算法中的不足提出改进措施。首先根据相似用户和相似项目评分也相似的原则提出一种基于相似的数据填充法解决数据的稀疏性;在此基础上,为了缓解个性化推荐系统扩展性差的问题,利用k-means聚类方法找到目标用户的聚类簇从而缩小目标用户寻找最近邻用户的范围,可以减少计算的时间复杂度和提高推荐系统的线上稳定性;最后针对传统个性化推荐系统中常用的相似度计算方法只能计算用户评分的相似度,提出了考虑用户项目类型偏好和用户自身属性的混合相似度计算方法。通过上述方法的改进在moivelens-latest-samll数据集上进行实验分析,得出最优的k值与最近邻个数是21和8,然后以MSE作为算法评测指标,对改进的推荐算法与传统推荐算法进行结果比较,得到的MSE平均值分别为0.54和0.57,从而证明了利用该方法建立的推荐模型可以有效的提高推荐系统的质量。

基于时序信息的协同过滤算法研究

这是一篇关于协同过滤,序列建模,Word2vec,马尔可夫链,混合相似度的论文, 主要内容为近年来,推荐系统发展迅速,在诸如淘宝、京东、亚马逊等各大电商平台上随处可见,它在一定程度上给商家带来了可观的经济收益,同时也帮助用户更好地选择商品。传统推荐算法主要研究用户与物品之间的关系,然后给用户推荐最符合他们兴趣爱好的物品集。但在现实生活中,用户的历史行为隐含着某些辅助信息,例如相邻物品间的关系等信息。比如一个Java开发工程师,随着工作时间的增加,其阅读的书籍逐渐由入门类书籍过渡到更加专业的书籍;对于一个新进社员,购买衣服的品味与学生时代也可能有所不同。所以在传统推荐算法的基础上,关注用户的全局时序信息或短期时序信息,将更有利于捕捉用户未来的行为和偏好。传统推荐算法在用户对物品的偏好信息建模上考虑的信息比较单一,如经典的矩阵分解MF(matrix factorization)把用户的历史行为信息看作是一个用户与物品的评分矩阵,然后通过因式分解将其分解成两个低维的用户、物品潜在特征矩阵来学习用户和物品之间的关系。然而,很多大型网站后台对注册用户的行为记录都附带时间戳,由此产生了大量可供时序推荐算法使用的数据。首先,传统推荐算法RSVD(regularized Singular value decomposition)缺乏对时序信息的建模,于是本文在RSVD的基础上引入自然语言处理中的序列建模方法Word2vec来捕捉时序信息,进而提出了TRSVD模型,并在两个真实的数据集上验证了模型的有效性;同时考虑到不同数据集中用户的物品序列间时间跨度不同的问题,在TRSVD的基础上,进一步改进算法,提出了TRSVD+模型,该模型能够有效地预测用户对物品的评分,在推荐精度上取得了比RSVD和TRSVD更好的效果。其次,本文在传统序列推荐算法Fossil(fusing similarity models with Markov chains)的基础上进行改进。因为Fossil模型中短期序列项的权重只关注目标物品(即被预测物品)前个相对位置上的物品对它的权值贡献,相对位置的权重贡献较为笼统。为此,我们提出了基于混合相似度的序列敏感模型S-FMSM(sequence-aware factored mixed similarity model),该模型综合考虑了目标物品前个特定物品对它的权值贡献。此外,我们考虑到机器学习中常用的损失函数有基于成对偏好假设的损失函数和基于逐点偏好假设的损失函数,于是,我们设计了包含两种不同目标函数的S-FMSM模型,并在六个真实的数据集上与五个经典的推荐算法(包含时序与非时序)进行了比较,实验结果表明所提出的S-FMSM模型是较为有效的。

基于时序信息的协同过滤算法研究

这是一篇关于协同过滤,序列建模,Word2vec,马尔可夫链,混合相似度的论文, 主要内容为近年来,推荐系统发展迅速,在诸如淘宝、京东、亚马逊等各大电商平台上随处可见,它在一定程度上给商家带来了可观的经济收益,同时也帮助用户更好地选择商品。传统推荐算法主要研究用户与物品之间的关系,然后给用户推荐最符合他们兴趣爱好的物品集。但在现实生活中,用户的历史行为隐含着某些辅助信息,例如相邻物品间的关系等信息。比如一个Java开发工程师,随着工作时间的增加,其阅读的书籍逐渐由入门类书籍过渡到更加专业的书籍;对于一个新进社员,购买衣服的品味与学生时代也可能有所不同。所以在传统推荐算法的基础上,关注用户的全局时序信息或短期时序信息,将更有利于捕捉用户未来的行为和偏好。传统推荐算法在用户对物品的偏好信息建模上考虑的信息比较单一,如经典的矩阵分解MF(matrix factorization)把用户的历史行为信息看作是一个用户与物品的评分矩阵,然后通过因式分解将其分解成两个低维的用户、物品潜在特征矩阵来学习用户和物品之间的关系。然而,很多大型网站后台对注册用户的行为记录都附带时间戳,由此产生了大量可供时序推荐算法使用的数据。首先,传统推荐算法RSVD(regularized Singular value decomposition)缺乏对时序信息的建模,于是本文在RSVD的基础上引入自然语言处理中的序列建模方法Word2vec来捕捉时序信息,进而提出了TRSVD模型,并在两个真实的数据集上验证了模型的有效性;同时考虑到不同数据集中用户的物品序列间时间跨度不同的问题,在TRSVD的基础上,进一步改进算法,提出了TRSVD+模型,该模型能够有效地预测用户对物品的评分,在推荐精度上取得了比RSVD和TRSVD更好的效果。其次,本文在传统序列推荐算法Fossil(fusing similarity models with Markov chains)的基础上进行改进。因为Fossil模型中短期序列项的权重只关注目标物品(即被预测物品)前个相对位置上的物品对它的权值贡献,相对位置的权重贡献较为笼统。为此,我们提出了基于混合相似度的序列敏感模型S-FMSM(sequence-aware factored mixed similarity model),该模型综合考虑了目标物品前个特定物品对它的权值贡献。此外,我们考虑到机器学习中常用的损失函数有基于成对偏好假设的损失函数和基于逐点偏好假设的损失函数,于是,我们设计了包含两种不同目标函数的S-FMSM模型,并在六个真实的数据集上与五个经典的推荐算法(包含时序与非时序)进行了比较,实验结果表明所提出的S-FMSM模型是较为有效的。

基于语义相似度的领域智能问答系统研究与实现

这是一篇关于语义相似度,智能问答,注意力机制,交互网络,混合相似度的论文, 主要内容为互联网技术的高速发展带来了网络中数据量激增,如何高效地帮助用户在互联网的海量数据中获取特定领域的信息是一个重要问题,智能问答系统正是解决这一问题的有效方法。智能问答系统以一问一答形式,精确地回答用户的提问,智能问答系统通过与用户进行交互,为用户提供个性化的信息服务。语义相似度(Semantic Similarity)是通过计算两个文本的相似程度,来研究不同文本之间关系的一种技术,是自然语言处理领域的一个重要的研究方向。尤其是在智能问答系统的信息交互中有着效率与准确度的优势。在目前的大部分智能问答系统中,尤其是特定领域的智能问答系统,由于传统方法大多基于关系进行问答,对于知识库以及问句的预处理效率不高,因此设计并研发一套基于语义相似度的领域智能问答系统是非常必要的。对于智能问答流程中关键的三元组排序问题,本文采用语义相似度方法解决该问题,将三元组排序分为粗粒度三元组排序和细粒度属性三元组排序两个任务。针对粗粒度三元组排序,本文提出了基于注意力交互网络的语义文本匹配模型(Text Semantic Matching Model based on Attentional Inter-Networks,简称TSM-AIN),来进行三元组排序。首先,该模型融合了表示型网络的匹配抽取与交互型网络中的交互矩阵;其次,采用混合共同注意力机制接收复杂特征信息,并强化文本对中重要文本的特征信息,从而实现文本对之间的信息交换;然后,使用混合共同注意力模块输出的高维特征,通过动态注意力匹配矩阵的循环网络,来处理文本对之间的关键特征表示,并保存关键特征。对于细粒度属性三元组排序,本文提出了基于混合相似度计算的三元组属性匹配算法(Attribute Matching Algorithm based on Mixed Similarity Calculation,简称AM-MSC),对粗粒度三元组排序后的结果进行最终排序。最后,通过与其他模型算法进行对比实验,验证了本文所提出模型与算法的可行性与有效性。基于上述关键技术,本文设计并实现了基于语义相似度的领域智能问答系统。本系统提供了通用领域和特定领域两种智能问答方式,系统的主要功能包括数据集成、知识库构建、智能问答以及用户管理。该系统采用B/S架构搭建,使用Python语言开发完成。最后,通过系统测试表明,本文所构建的系统实现全部需求,并提供了通用领域和特定领域(如:金融领域)的智能问答功能和服务。

基于Spark的协同过滤算法的改进与实现

这是一篇关于协同过滤算法,Spark,混合相似度,推荐服务,实时的论文, 主要内容为随着移动互联网、物联网、云计算等技术的快速发展,全球数据量呈爆炸式增长,大数据时代已经到来。“信息过载”是目前人们所面临的主要问题,在电商、音乐视频、新闻等领域频发这种问题。个性化推荐引擎是信息过滤的一种手段,在解决信息过载问题中具有重要的研究与应用价值。个性化推荐最常使用的推荐技术是基于协同过滤的推荐技术。但传统的协同过滤算法存在一些问题。为克服这些问题,本文对协同过滤算法进行改进,同时为了实现海量数据的处理,需要推荐系统结合大数据处理框架。Spark作为新一代的计算框架,非常适合迭代计算和流处理。因此,将Spark作为推荐系统的计算框架再合适不过。首先,针对传统协同过滤推荐算法在数据稀疏的情况下存在的性能缺陷和相似性度量方法的不足,本文改进得到一种基于多层次混合相似度的协同过滤推荐算法。该算法结合用户评分相似度、用户兴趣相似度和用户特征相似度等三个层次来度量用户之间的相似度,同时根据用户评论数量来动态调整权重,此外还改进了推荐策略。实验结果表明改进后的算法提高了用户的推荐精度,有效地缓解了这些问题所带来的影响。其次,为新用户和老用户提供了不同的推荐服务,老用户采用改进的算法和ALS算法来实现推荐;新用户则根据用户提供的信息采取不同推荐策略来实现推荐,同时解决了算法本身存在的冷启动问题。为更好地结合Spark平台,将这些推荐策略都并行实现,设计出了基于Spark的推荐系统。最后,对于推荐系统来说,能更快更好地提供推荐服务至关重要,为模拟实时推荐的过程,本文将Kafka集群作为消息的生产者,用于生产简单的用户信息,Spark Streaming流处理框架作为消息的消费者,为用户提供实时推荐服务,通过模拟实验,证明了系统推荐模块具有实时性。

基于差分隐私保护的协同过滤推荐算法研究

这是一篇关于推荐系统,隐私保护,协同过滤算法,差分隐私,混合相似度的论文, 主要内容为推荐系统通过挖掘用户数据之间的关系发现用户潜在的消费趋势,为用户提供个性化的信息推荐,极大地提高了用户在海量数据中获取信息的效率。然而,推荐系统在挖掘用户数据时,因所涉及的数据含有用户隐私信息,存在隐私泄露的风险,同时,推荐系统存在的评分片面、主观性强、评分矩阵稀疏性等因素影响了推荐的精确度。如何提高推荐系统的推荐精度,保护用户的隐私信息,是当前推荐系统需要解决的关键问题。针对上述问题,本文基于协同过滤推荐算法,研究用户特征相似性优化方法,并采用差分隐私实现隐私保护,主要的研究内容如下:(1)针对协同过滤推荐算法中存在上述精确度和隐私泄漏的问题,给出一种基于混合相似度和差分隐私的协同过滤推荐算法。在多种相似度基础上进行加权计算构造混合相似度,提高推荐精度;以混合相似度作为质心更新和分类条件,利用改进的K-means算法将与目标用户相似度高的用户进行聚类;采用枚举方法在目标用户集中划分子集,并基于混合相似度构建效用函数,利用差分隐私指数机制在各子集中选择邻居集合,保护用户隐私;最后在邻居集合中选择出评分值最高的项目进行推荐。实验结果表明,该算法在保护用户隐私的同时,有效提高了推荐的精确度。(2)为更好地解决上述基于差分隐私的协同过滤推荐算法中的稀疏矩阵问题,将基于项目的协同过滤算法与基于用户的协同过滤算法结合,给出一种基于差分隐私的混合协同过滤推荐算法。该算法首先考虑项目的标签属性等信息,并将其作为项目相似度的重要因素;利用差分隐私技术将拉普拉斯噪声添加到项目平均得分和原始评分矩阵中保护用户隐私,并采用加权平均值法计算和填充评分矩阵中的缺失值,解决稀疏性问题;最后基于用户的协同过滤算法选择用户邻居并进行个性化推荐。实验结果表明,该方法能有效保护隐私数据,并具有较好的推荐精度。

基于差分隐私保护的协同过滤推荐算法研究

这是一篇关于推荐系统,隐私保护,协同过滤算法,差分隐私,混合相似度的论文, 主要内容为推荐系统通过挖掘用户数据之间的关系发现用户潜在的消费趋势,为用户提供个性化的信息推荐,极大地提高了用户在海量数据中获取信息的效率。然而,推荐系统在挖掘用户数据时,因所涉及的数据含有用户隐私信息,存在隐私泄露的风险,同时,推荐系统存在的评分片面、主观性强、评分矩阵稀疏性等因素影响了推荐的精确度。如何提高推荐系统的推荐精度,保护用户的隐私信息,是当前推荐系统需要解决的关键问题。针对上述问题,本文基于协同过滤推荐算法,研究用户特征相似性优化方法,并采用差分隐私实现隐私保护,主要的研究内容如下:(1)针对协同过滤推荐算法中存在上述精确度和隐私泄漏的问题,给出一种基于混合相似度和差分隐私的协同过滤推荐算法。在多种相似度基础上进行加权计算构造混合相似度,提高推荐精度;以混合相似度作为质心更新和分类条件,利用改进的K-means算法将与目标用户相似度高的用户进行聚类;采用枚举方法在目标用户集中划分子集,并基于混合相似度构建效用函数,利用差分隐私指数机制在各子集中选择邻居集合,保护用户隐私;最后在邻居集合中选择出评分值最高的项目进行推荐。实验结果表明,该算法在保护用户隐私的同时,有效提高了推荐的精确度。(2)为更好地解决上述基于差分隐私的协同过滤推荐算法中的稀疏矩阵问题,将基于项目的协同过滤算法与基于用户的协同过滤算法结合,给出一种基于差分隐私的混合协同过滤推荐算法。该算法首先考虑项目的标签属性等信息,并将其作为项目相似度的重要因素;利用差分隐私技术将拉普拉斯噪声添加到项目平均得分和原始评分矩阵中保护用户隐私,并采用加权平均值法计算和填充评分矩阵中的缺失值,解决稀疏性问题;最后基于用户的协同过滤算法选择用户邻居并进行个性化推荐。实验结果表明,该方法能有效保护隐私数据,并具有较好的推荐精度。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设港湾 ,原文地址:https://m.bishedaima.com/lunwen/56097.html

相关推荐

发表回复

登录后才能评论