推荐6篇关于双聚类的计算机专业论文

今天分享的是关于双聚类的6篇计算机毕业论文范文, 如果你的论文涉及到双聚类等主题,本文能够帮助到你 基于Hadoop技术的运营商平台推荐系统研究 这是一篇关于推荐系统

今天分享的是关于双聚类的6篇计算机毕业论文范文, 如果你的论文涉及到双聚类等主题,本文能够帮助到你

基于Hadoop技术的运营商平台推荐系统研究

这是一篇关于推荐系统,精确度,双聚类,Hadoop架构,流处理的论文, 主要内容为推荐系统是运营商平台通过智能化和个性化的方式提升用户体验的重要工具,其主要目的是建立个性化推荐模型,制定合理高效的推荐策略。如何在海量的运营商平台中找到满足用户需求的商品并推荐给用户,满足用户的个性化需求,从而提高用户体验度,提高平台的粘度,成为运营商在“提速降费”背景下亟待解决的问题。目前,各大运营商均通过自有的电子渠道(如:网上营业厅)推出“手机绑定套餐”的营销模式,目的在于尝试寻求新的业务增长点。而实际上,通过网上营业厅访问或购买手机的用户占运营商存量用户中的比例依然较低,导致后台的用户-商品评分矩阵较为稀疏,而传统推荐算法在处理数据稀疏的用户隐式反馈信息时推荐效果差,且无法满足运营商平台推荐系统实时性问题。因此,本文主要在提高推荐效率和推荐系统实时性方面开展研究,并设计符合运营商特点的网上营业厅手机销售推荐系统。相关的主要工作和成果如下:1.针对传统推荐模型在运营商平台推荐物品资源时正确性较低问题,本文在原有计算用户或物品相似度基础上,添加了较为可以挖掘局部信息关系的双聚类技术用于构建推荐算法模型。通过Matlab仿真实验可知,双聚类技术与其它传统算法相比,其精确度和召回率分别有了大约22.6%和29.1%的提升,可以确保用户及时高效地获得正确的推荐结果;2.针对传统推荐只能离线处理问题,本文设计了基于Hadoop和流处理技术的实时推荐系统架构,将推荐结果存储于分布式缓存中。同时,引入Storm架构,根据用户当前行为的反馈及请求,进行实时推荐,避免单一Hadoop架构导致推荐流程停留在上一个阶段的情况发生,使生成的推荐列表更合理的契合用户的需求。冷启动问题仍是运营商平台在推荐系统中面临的难题,同时用户的兴趣可能会随着时间、环境的变化而改变。如何发掘用户更多兴趣也成为难点和重点问题,将在后续工作中使用趋势推荐,并结合评分时间特性,对该问题做进一步研究和探讨。

基于Hadoop技术的运营商平台推荐系统研究

这是一篇关于推荐系统,精确度,双聚类,Hadoop架构,流处理的论文, 主要内容为推荐系统是运营商平台通过智能化和个性化的方式提升用户体验的重要工具,其主要目的是建立个性化推荐模型,制定合理高效的推荐策略。如何在海量的运营商平台中找到满足用户需求的商品并推荐给用户,满足用户的个性化需求,从而提高用户体验度,提高平台的粘度,成为运营商在“提速降费”背景下亟待解决的问题。目前,各大运营商均通过自有的电子渠道(如:网上营业厅)推出“手机绑定套餐”的营销模式,目的在于尝试寻求新的业务增长点。而实际上,通过网上营业厅访问或购买手机的用户占运营商存量用户中的比例依然较低,导致后台的用户-商品评分矩阵较为稀疏,而传统推荐算法在处理数据稀疏的用户隐式反馈信息时推荐效果差,且无法满足运营商平台推荐系统实时性问题。因此,本文主要在提高推荐效率和推荐系统实时性方面开展研究,并设计符合运营商特点的网上营业厅手机销售推荐系统。相关的主要工作和成果如下:1.针对传统推荐模型在运营商平台推荐物品资源时正确性较低问题,本文在原有计算用户或物品相似度基础上,添加了较为可以挖掘局部信息关系的双聚类技术用于构建推荐算法模型。通过Matlab仿真实验可知,双聚类技术与其它传统算法相比,其精确度和召回率分别有了大约22.6%和29.1%的提升,可以确保用户及时高效地获得正确的推荐结果;2.针对传统推荐只能离线处理问题,本文设计了基于Hadoop和流处理技术的实时推荐系统架构,将推荐结果存储于分布式缓存中。同时,引入Storm架构,根据用户当前行为的反馈及请求,进行实时推荐,避免单一Hadoop架构导致推荐流程停留在上一个阶段的情况发生,使生成的推荐列表更合理的契合用户的需求。冷启动问题仍是运营商平台在推荐系统中面临的难题,同时用户的兴趣可能会随着时间、环境的变化而改变。如何发掘用户更多兴趣也成为难点和重点问题,将在后续工作中使用趋势推荐,并结合评分时间特性,对该问题做进一步研究和探讨。

基于稀疏保序子矩阵的分布式约束双聚类算法研究

这是一篇关于双聚类,模式挖掘,分布式计算,推荐系统的论文, 主要内容为双聚类技术作为一种局部关联分析方法,被提出用于从数据矩阵中挖掘符合子矩阵模型条件的子矩阵模式,进而发现数据中有趣的局部相关性。然而,在双聚类技术研究过程中,如果只关注于保证每个被挖掘的子矩阵模式的质量,即保证每个子矩阵模式都完全符合期望的条件,那么在一定程度上很难控制所有子矩阵模式之于完整数据矩阵的覆盖程度和子矩阵模式之间的重叠程度。反之,如果想要实现被挖掘的子矩阵模式集合完全覆盖完整数据矩阵且子矩阵模式之间互不相交,即想要发现尽可能多的不同的局部相关性,那么势必很难保证每个子矩阵模式都符合期望的条件。值得注意的是,理论上符合期望条件的子矩阵模式所揭示的局部相关性的准确度更高。因此,这存在一个子矩阵模式质量与其在完整数据矩阵上的位置分布之间的权衡问题。此外,由于较高的计算复杂性,现有的双聚类技术的研究主要集中在规模有限的密集数据集上,这显然在例如推荐系统、文本挖掘或生物信息学等现实且具有大规模稀疏数据集的应用中并不适用。因此,这存在一个大规模稀疏数据集的处理问题。针对上述问题,本文首先定义了一种新的约束双聚类问题。为了保证每个被挖掘的子矩阵模式的质量,提高其揭示的局部相关性的准确度,约束双聚类问题的目标是挖掘满足预定义的子矩阵模型条件的子矩阵模式;此外,还附加了覆盖率约束和重叠度约束这两个约束条件来控制被挖掘的子矩阵模式集合在完整数据矩阵上的位置分布,从而减少挖掘的冗余相关性信息,进而提高算法的计算效率。接着,为了将约束双聚类应用于推荐系统预测评分问题,本文提出并实现了一种有效的基于稀疏保序子矩阵模型的约束双聚类算法。该算法通过线性地扫描完整数据矩阵来挖掘符合条件的子矩阵模式,并对子矩阵模式中的缺失值预测评分。实验结果表明,本文提出的约束双聚类算法在推荐系统预测评分准确度方面,与两个推荐系统领域传统的User-based和Item-based协同过滤算法,及两个同样基于双聚类技术的推荐系统算法相比,具有较高的准确度。最后,为了提高算法的计算效率,本文设计了一种基于上述约束双聚类算法的分布式计算框架,并称其为分布式约束双聚类算法,用于处理大规模的稀疏数据集。实验结果表明,本文提出的分布式约束双聚类算法不仅提高了预测评分的准确度,而且具有较高的稳定性和扩展性。

基于并行图自编码器的miRNA-靶基因数据的新型双聚类分析方法研究

这是一篇关于双聚类,图自编码器,miRNA-靶基因,二进制数据的论文, 主要内容为传统的单聚类方法是依据样本的相似度,将具有相似属性或特征的样本归为一类。然而,随着样本数和特征数的大量增加,单聚类方法的时间成本变得难以想象。另一方面,大型数据集内部数据成分复杂且往往呈现稀疏性,单聚类方法不能很好地处理大型数据集的噪声干扰。基于低维数据全局搜索的单聚类方法不能很好地适应于高维数据和大型数据的聚类问题。为克服单聚类方法存在的缺陷,双聚类方法应运而生。不同于传统单聚类方法,双聚类方法是基于样本(行)和特征(列)间的局部关系,同时从样本和特征两个维度上进行聚类。近年来,双聚类方法发展迅速,在基因分析、文本聚类、推荐系统等领域得到广泛应用。双聚类方法常用于生物信息学中的基因表达数据的分析,相比于基因表达数据这类的表达量数据,生物大数据中存在的更多的是关系型数据,譬如mi RNA-靶基因数据。目前绝大部分的双聚类算法都是针对表达量数据而设计,面向二进制关系型数据的双聚类算法却鲜有探讨,因为表达量数据中存在非常丰富的数学信息而关系型数据仅仅包含0/1关系信息。为了挖掘关系型数据中的双聚类模块,本文基于大豆的mi RNA-靶基因数据(包括mi RNA-靶基因关系矩阵与靶基因图数据)提出了一种基于图自编码器的双聚类算法GAEBic,创新性地构建了并行图自编码器模型PGAE来捕获mi RNA-靶基因数据中靶基因间的联系,并提出了一种全新的非规则聚类策略Bi GAE以发现更加符合生物学意义的双聚类模块。PGAE模型的输入为靶基因图数据和靶基因属性数据,它的结构主要包括编码器和解码器。本文基于靶基因图数据比较了PGAE与Deep Walk、LINE、Node2Vec在靶基因连接预测任务上的性能,结果显示PGAE模型的性能明显优于Deep Walk、LINE、Node2Vec,具备可靠的图嵌入学习的能力。Bi GAE算法的输入为mi RNA-靶基因的二进制关系矩阵和靶基因的嵌入矩阵,其中靶基因嵌入矩阵用于衡量靶基因间的相似度。Bi GAE将靶基因嵌入矩阵作为度量矩阵,同时引入了非零覆盖率作为另一指标以确保发现双聚类模块是非规则的、更符合生物学意义的。本文基于大豆的mi RNA-靶基因关系数据比较了GAEBic与Spectral Biclustering、Bibit、Bimax算法的性能,在对四种双聚类算法的双聚类结果进行GO富集分析后发现GAEBic的双聚类结果的GO富集率明显高于其余三种双聚类算法,并且在富集的双聚类中,GAEBic的双聚类结果表现也优于其余三者。GAEBic算法探讨了双聚类分析在二进制数据领域的应用,为后来的研究者在双聚类分析上提供了一种可行的研究思路。

双聚类算法研究及其在基因表达数据中的应用

这是一篇关于基因表达数据,双聚类,SVD预处理,肺癌数据集的论文, 主要内容为随着基因采样技术的发展,人们已可以低成本地获取大量不同生物的基因信息,这些数据称为基因表达数据。通常情况下,这些基因信息以矩阵形式储存,即基因表达矩阵,它具有数据维度超高而样本稀疏的特点。传统的聚类算法处理这类数据时表现不佳。双聚类算法是在此背景下出现的一类高效分析基因表达矩阵的新方法。通过同时考虑矩阵的行列关系,可以获得矩阵内部更为复杂的信息。此前学者根据对基因表达矩阵内部隐含结构的不同假设,提出了不同的双聚类算法。然而,目前主流的双聚类算法普遍存在三个方面的问题:1:较高的计算复杂度;2:对噪声敏感。3:无法在迭代过程中显式利用上一轮迭代的计算结果;本文主要围绕这三方面问题开展研究。针对问题1和2,本文提出了一种基于奇异值分解(SVD)的预处理方法。该方法利用了 SVD对矩阵行列聚类信息的分离能力和对噪声的抑制特性,一方面通过矩阵的行列信息分离,将双聚类问题降级为普通的一维聚类问题,避免迭代计算,从而降低计算复杂度;另一方面通过基于SVD的低秩重建来降低矩阵内部噪声,从而提升聚类性能。实验结果表明,该预处理具有极好的算法兼容性,可以稳定提升各种双聚类算法在不同噪声条件下的聚类精确度。针对问题3,本文提出了多采样聚类,并在多采样聚类的基础上建立了一种新的双聚类算法。该算法可以显式利用上一轮迭代的聚类信息从而提升聚类精度。此外,因为多采样数据结构在现实生活中广泛存在,除了辅助建立谱双聚类算法,多采样聚类算法本身也可以应用在推荐系统、生产管理、服务器集群构建、天气预报等领域。最后,本文在人工数据集和肺癌基因数据集上对所提方法进行了实验,实验结果表明,相比于此前主流的双聚类算法,本文算法可以在降低计算复杂度的同时显著提升聚类精度。这为未来人们更加高效精确地识别基因表达矩阵中的信息做出了贡献。

基于并行图自编码器的miRNA-靶基因数据的新型双聚类分析方法研究

这是一篇关于双聚类,图自编码器,miRNA-靶基因,二进制数据的论文, 主要内容为传统的单聚类方法是依据样本的相似度,将具有相似属性或特征的样本归为一类。然而,随着样本数和特征数的大量增加,单聚类方法的时间成本变得难以想象。另一方面,大型数据集内部数据成分复杂且往往呈现稀疏性,单聚类方法不能很好地处理大型数据集的噪声干扰。基于低维数据全局搜索的单聚类方法不能很好地适应于高维数据和大型数据的聚类问题。为克服单聚类方法存在的缺陷,双聚类方法应运而生。不同于传统单聚类方法,双聚类方法是基于样本(行)和特征(列)间的局部关系,同时从样本和特征两个维度上进行聚类。近年来,双聚类方法发展迅速,在基因分析、文本聚类、推荐系统等领域得到广泛应用。双聚类方法常用于生物信息学中的基因表达数据的分析,相比于基因表达数据这类的表达量数据,生物大数据中存在的更多的是关系型数据,譬如mi RNA-靶基因数据。目前绝大部分的双聚类算法都是针对表达量数据而设计,面向二进制关系型数据的双聚类算法却鲜有探讨,因为表达量数据中存在非常丰富的数学信息而关系型数据仅仅包含0/1关系信息。为了挖掘关系型数据中的双聚类模块,本文基于大豆的mi RNA-靶基因数据(包括mi RNA-靶基因关系矩阵与靶基因图数据)提出了一种基于图自编码器的双聚类算法GAEBic,创新性地构建了并行图自编码器模型PGAE来捕获mi RNA-靶基因数据中靶基因间的联系,并提出了一种全新的非规则聚类策略Bi GAE以发现更加符合生物学意义的双聚类模块。PGAE模型的输入为靶基因图数据和靶基因属性数据,它的结构主要包括编码器和解码器。本文基于靶基因图数据比较了PGAE与Deep Walk、LINE、Node2Vec在靶基因连接预测任务上的性能,结果显示PGAE模型的性能明显优于Deep Walk、LINE、Node2Vec,具备可靠的图嵌入学习的能力。Bi GAE算法的输入为mi RNA-靶基因的二进制关系矩阵和靶基因的嵌入矩阵,其中靶基因嵌入矩阵用于衡量靶基因间的相似度。Bi GAE将靶基因嵌入矩阵作为度量矩阵,同时引入了非零覆盖率作为另一指标以确保发现双聚类模块是非规则的、更符合生物学意义的。本文基于大豆的mi RNA-靶基因关系数据比较了GAEBic与Spectral Biclustering、Bibit、Bimax算法的性能,在对四种双聚类算法的双聚类结果进行GO富集分析后发现GAEBic的双聚类结果的GO富集率明显高于其余三种双聚类算法,并且在富集的双聚类中,GAEBic的双聚类结果表现也优于其余三者。GAEBic算法探讨了双聚类分析在二进制数据领域的应用,为后来的研究者在双聚类分析上提供了一种可行的研究思路。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码导航 ,原文地址:https://m.bishedaima.com/lunwen/55574.html

相关推荐

发表回复

登录后才能评论