面向点击率预测模型的自动化机器学习管道的设计与实现
这是一篇关于自动化机器学习,点击率预测模型,超参数优化,数据预处理的论文, 主要内容为随着互联网上的信息量越来越大,如何在海量信息中找到最适合的信息成为了互联网用户的迫切需求,而推荐系统则是能够通过预测用户对信息的点击率进而为用户推荐特定的内容,从而提高用户体验。深度学习技术的发展能够大幅度提升推荐系统算法中点击率预测模型的表现。然而,构建基于深度学习的点击率预测模型仍然面临着很大的问题:(1)构建深度学习模型是一个需要大量重复的工作且十分耗时的过程;(2)推荐系统的工业实践中往往伴随着不断变化的新数据或者新任务,从而需要重新去调整相应的深度学习模型结构以及超参数。针对这样的问题,本课题提出了一个结合了自动化机器学习(Auto ML)和深度点击率预测模型构建(Deepctr)的管道,命名为:Auto-Deepctr。本文实现的Auto-Deepctr管道实现了全流程的深度点击率预测模型的自动化构建。Auto-Deepctr使用机器学习的方法对数据集中的数据特征类型进行预测,然后针对不同的特征类型进行相应的数据预处理操作,实现对数据预处理阶段的自动化。而后本文实现了11个在工业界或者学术界上都具有一定知名度的深度点击率预测模型,这11个模型都是由一系列用于构建深度点击率预测模型的组件而构成。这些组件不仅构成了深度点击率预测模型的层次结构,还定义了各自的超参数搜索空间。最后本文通过实现三个超参数优化算法:随机优化、贝叶斯优化以及遗传算法优化,使用这些超参数优化算法可以实现对各个深度点击率预测模型的超参数自动寻优。本文通过一系列实验证明了Auto-Deepctr管道对于大部分推荐系统数据集的点击率预测任务,都能够做到从输入数据集开始到输出最佳模型的端到端全流程自动化。另外,工程师还能够使用Auto-Deepctr管道中的构成模型的组件来灵活搭建自己的点击率预测模型,然后使用Auto-Deepctr管道的各个超参数寻优算法对该用户构建的模型进行自动寻优。除此之外,本文将Auto-Deepctr管道部署到了一个基于B/S架构的Web应用中去,能够使得非计算机相关的从业人员也能够通过简单的图形化操作使用Auto-Deepctr管道构建深度点击率预测模型。
面向点击率预测模型的自动化机器学习管道的设计与实现
这是一篇关于自动化机器学习,点击率预测模型,超参数优化,数据预处理的论文, 主要内容为随着互联网上的信息量越来越大,如何在海量信息中找到最适合的信息成为了互联网用户的迫切需求,而推荐系统则是能够通过预测用户对信息的点击率进而为用户推荐特定的内容,从而提高用户体验。深度学习技术的发展能够大幅度提升推荐系统算法中点击率预测模型的表现。然而,构建基于深度学习的点击率预测模型仍然面临着很大的问题:(1)构建深度学习模型是一个需要大量重复的工作且十分耗时的过程;(2)推荐系统的工业实践中往往伴随着不断变化的新数据或者新任务,从而需要重新去调整相应的深度学习模型结构以及超参数。针对这样的问题,本课题提出了一个结合了自动化机器学习(Auto ML)和深度点击率预测模型构建(Deepctr)的管道,命名为:Auto-Deepctr。本文实现的Auto-Deepctr管道实现了全流程的深度点击率预测模型的自动化构建。Auto-Deepctr使用机器学习的方法对数据集中的数据特征类型进行预测,然后针对不同的特征类型进行相应的数据预处理操作,实现对数据预处理阶段的自动化。而后本文实现了11个在工业界或者学术界上都具有一定知名度的深度点击率预测模型,这11个模型都是由一系列用于构建深度点击率预测模型的组件而构成。这些组件不仅构成了深度点击率预测模型的层次结构,还定义了各自的超参数搜索空间。最后本文通过实现三个超参数优化算法:随机优化、贝叶斯优化以及遗传算法优化,使用这些超参数优化算法可以实现对各个深度点击率预测模型的超参数自动寻优。本文通过一系列实验证明了Auto-Deepctr管道对于大部分推荐系统数据集的点击率预测任务,都能够做到从输入数据集开始到输出最佳模型的端到端全流程自动化。另外,工程师还能够使用Auto-Deepctr管道中的构成模型的组件来灵活搭建自己的点击率预测模型,然后使用Auto-Deepctr管道的各个超参数寻优算法对该用户构建的模型进行自动寻优。除此之外,本文将Auto-Deepctr管道部署到了一个基于B/S架构的Web应用中去,能够使得非计算机相关的从业人员也能够通过简单的图形化操作使用Auto-Deepctr管道构建深度点击率预测模型。
面向点击率预测模型的自动化机器学习管道的设计与实现
这是一篇关于自动化机器学习,点击率预测模型,超参数优化,数据预处理的论文, 主要内容为随着互联网上的信息量越来越大,如何在海量信息中找到最适合的信息成为了互联网用户的迫切需求,而推荐系统则是能够通过预测用户对信息的点击率进而为用户推荐特定的内容,从而提高用户体验。深度学习技术的发展能够大幅度提升推荐系统算法中点击率预测模型的表现。然而,构建基于深度学习的点击率预测模型仍然面临着很大的问题:(1)构建深度学习模型是一个需要大量重复的工作且十分耗时的过程;(2)推荐系统的工业实践中往往伴随着不断变化的新数据或者新任务,从而需要重新去调整相应的深度学习模型结构以及超参数。针对这样的问题,本课题提出了一个结合了自动化机器学习(Auto ML)和深度点击率预测模型构建(Deepctr)的管道,命名为:Auto-Deepctr。本文实现的Auto-Deepctr管道实现了全流程的深度点击率预测模型的自动化构建。Auto-Deepctr使用机器学习的方法对数据集中的数据特征类型进行预测,然后针对不同的特征类型进行相应的数据预处理操作,实现对数据预处理阶段的自动化。而后本文实现了11个在工业界或者学术界上都具有一定知名度的深度点击率预测模型,这11个模型都是由一系列用于构建深度点击率预测模型的组件而构成。这些组件不仅构成了深度点击率预测模型的层次结构,还定义了各自的超参数搜索空间。最后本文通过实现三个超参数优化算法:随机优化、贝叶斯优化以及遗传算法优化,使用这些超参数优化算法可以实现对各个深度点击率预测模型的超参数自动寻优。本文通过一系列实验证明了Auto-Deepctr管道对于大部分推荐系统数据集的点击率预测任务,都能够做到从输入数据集开始到输出最佳模型的端到端全流程自动化。另外,工程师还能够使用Auto-Deepctr管道中的构成模型的组件来灵活搭建自己的点击率预测模型,然后使用Auto-Deepctr管道的各个超参数寻优算法对该用户构建的模型进行自动寻优。除此之外,本文将Auto-Deepctr管道部署到了一个基于B/S架构的Web应用中去,能够使得非计算机相关的从业人员也能够通过简单的图形化操作使用Auto-Deepctr管道构建深度点击率预测模型。
面向点击率预测模型的自动化机器学习管道的设计与实现
这是一篇关于自动化机器学习,点击率预测模型,超参数优化,数据预处理的论文, 主要内容为随着互联网上的信息量越来越大,如何在海量信息中找到最适合的信息成为了互联网用户的迫切需求,而推荐系统则是能够通过预测用户对信息的点击率进而为用户推荐特定的内容,从而提高用户体验。深度学习技术的发展能够大幅度提升推荐系统算法中点击率预测模型的表现。然而,构建基于深度学习的点击率预测模型仍然面临着很大的问题:(1)构建深度学习模型是一个需要大量重复的工作且十分耗时的过程;(2)推荐系统的工业实践中往往伴随着不断变化的新数据或者新任务,从而需要重新去调整相应的深度学习模型结构以及超参数。针对这样的问题,本课题提出了一个结合了自动化机器学习(Auto ML)和深度点击率预测模型构建(Deepctr)的管道,命名为:Auto-Deepctr。本文实现的Auto-Deepctr管道实现了全流程的深度点击率预测模型的自动化构建。Auto-Deepctr使用机器学习的方法对数据集中的数据特征类型进行预测,然后针对不同的特征类型进行相应的数据预处理操作,实现对数据预处理阶段的自动化。而后本文实现了11个在工业界或者学术界上都具有一定知名度的深度点击率预测模型,这11个模型都是由一系列用于构建深度点击率预测模型的组件而构成。这些组件不仅构成了深度点击率预测模型的层次结构,还定义了各自的超参数搜索空间。最后本文通过实现三个超参数优化算法:随机优化、贝叶斯优化以及遗传算法优化,使用这些超参数优化算法可以实现对各个深度点击率预测模型的超参数自动寻优。本文通过一系列实验证明了Auto-Deepctr管道对于大部分推荐系统数据集的点击率预测任务,都能够做到从输入数据集开始到输出最佳模型的端到端全流程自动化。另外,工程师还能够使用Auto-Deepctr管道中的构成模型的组件来灵活搭建自己的点击率预测模型,然后使用Auto-Deepctr管道的各个超参数寻优算法对该用户构建的模型进行自动寻优。除此之外,本文将Auto-Deepctr管道部署到了一个基于B/S架构的Web应用中去,能够使得非计算机相关的从业人员也能够通过简单的图形化操作使用Auto-Deepctr管道构建深度点击率预测模型。
基于知识表示学习的知识图谱补全算法研究
这是一篇关于表示学习,知识图谱补全,自动化机器学习的论文, 主要内容为知识图谱是一种图结构的数据库,以三元组的形式描述客观世界的事物概念及其之间的联系,已在推荐系统、问答系统、搜索等任务中有着广泛应用。然而现在的知识图谱存在大量的缺失,如Freebase数据库中的约300万人类实体,有71%的实体没有出生地,91%的实体没有受教育情况信息。这些缺失将严重影响知识图谱的应用以及下游任务的精度。因此知识图谱补全任务有着重要的研究意义。知识表示学习是将实体或关系映射为低维稠密向量,并保留原始的结构语义信息。其以计算高效和缓解数据稀疏的特性广泛用于知识图谱补全任务。本文主要研究基于知识表示学习的知识图谱补全算法,工作内容包含以下三个方面:(1)现有的融合路径信息的知识表示学习方法中缺少对路径进行筛选,并且在训练过程中各路径权重固定不变。针对该问题,提出基于路径选择与自适应权重的知识表示学习方法(Path-selection based adaptive Trans E,PSATrans E)。路径选择可去除冗余语义信息。自适应权重使模型在每一次迭代的过程中都能聚焦于欠拟合的路径部分。知识图谱补全实验表明,路径选择与自适应权重均发挥作用,有效提高了关系与实体向量表示的质量,提升补全准确率。(2)针对现有知识表示学习模型多为人工设计的现状,将自动化机器学习引入知识表示学习,提出基于自动化机器学习的知识表示学习方法(Complete Neural Architecture Search based Knowledge Graph Embedding,CNASE)。扩增不同粒度的算子后,搜索空间覆盖各个方法分支。可针对不同数据集的特点自动搜索不同的模型结构。知识图谱补全实验表明,其相比人工设计的模型可产生语义信息更丰富的向量表示,在多数情况下效果优于人工设计的模型。(3)通过对基于语义匹配的知识表示模型的归纳抽象,发现其均可概括为基于单层关系矩阵的表示学习方法。据此,提出了基于多层关系矩阵的表示学习方法(Multi-layer Relation Matrix based Knowledge Graph Embedding,MLRME)。该算法将关系矩阵从传统方法的单层空间中拓展到了多层空间中,理论分析证明了多层矩阵具有的对称性、非对称性、反对称性与反关系性,表明其具有优良的表达能力,并且在知识图谱补全任务中展现了优越性。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设项目助手 ,原文地址:https://m.bishedaima.com/lunwen/55532.html