基于神经网络的钻孔设计算法研究与应用
这是一篇关于栈式自编码,梯度提升树,经验模态分解,注意力机制,门控制循环单元的论文, 主要内容为近年来,随着互联网的快速发展和交叉学科的兴起,许多地质科学家都借助计算机来模拟地浸井场中钻孔的设计与建造过程。在地浸井场的建造中,地浸钻孔(以下简称:钻孔)是唯一能从岩层中提取到铀资源的一个通道,所以只有钻孔设计合理才能保证井场采铀的稳定运行。但是钻孔的实际开发中,钻孔的判断和钻孔过滤器的布置涉及的工序和因素有很多。为了解决这些问题,本文设计并开发了基于地浸井场的钻孔建造系统,用来解决钻孔合格性判断和过滤器布置等问题,从而提高地浸开采的效率。为了提高对钻孔判断的准确率,本文设计出一种基于栈式自编码器网络和梯度提升树组合的模型(GBDT-SAE)。该模型对地浸井场中的钻孔数据进行归一化处理,然后再通过多层栈式自编码器对钻孔数据进行编码,得到隐藏层的降维后钻孔数据,然后再将该数据进行梯度提升树模型的训练,从而得到钻孔判定分类的模型。并设计实验,并将结果与K-Means、Adaboost、GBDT、KMeans-SAE和Adaboost-SAE比较。实验结果表明GBDT-SAE在对钻孔合格性的判定中,算法迭代率和准确率都更加高,验证了GBDT-SAE算法在对钻孔合格性判定分类的可行性和正确性。为了提高对钻孔过滤器布置的准确率,本文提出了一种基于经验模态分解、注意力机制和门控制循环单元网络组合的模型(EMD-AMGRU)来实现对钻孔过滤器的布置。经验模态分解方法可以处理钻孔数据中的岩性、品位、地质岩层、渗透性、天顶角等许多非平稳性因素,将这些非平稳性序列将其自适应分解为平稳性序列。AMGRU在门控制循环单元网络中结合了注意力机制,目的是加强网络记忆力和对目标值的集中程度,从而提高模型的准确率。设计实验,结果表明与其他模型相比,EMD-AMGRU预测的误差最低,说明预测结果更加接近真实值,验证了EMD-AMGRU算法在对钻孔过滤器布置的可行性和正确性。最后本文对提出的算法在系统中进行了实证分析。将GBDT-SAE和EMDAMGRU模型分别应用于钻孔建造系统中的钻孔合格性判定和过滤器批量布置的功能模块上,其准确度和可行性得到了验证并达到预期效果,验证了该方法对钻孔数据的处理具有很强的适用性。目前,系统开发基本完成,正在对地浸井场的实际应用进行功能性的测试。
基于特征工程和高效梯度提升树算法的精准化混合推荐方法研究
这是一篇关于混合推荐方法,特征工程,梯度提升树,XGBoost,个性化推荐的论文, 主要内容为随着互联网和信息技术的迅猛发展,互联网的信息量以指数形式增长。为了解决信息过载的问题,满足拥有不同兴趣爱好、关注领域、行为习惯、消费水平和个人成长经历的用户的信息需求,协同过滤推荐系统应运而生。但是,在互联网数据量指数增长的背景下,协同过滤推荐系统存在的数据稀疏性问题越来越严重。在高维的项目空间中,用户能够访问和打分的项目极少,这也导致了评分矩阵极度稀疏的问题。为了解决评分矩阵稀疏性的问题,本文从特征工程和推荐方法的角度出发,提出了一种基于用户行为数据以及用户与物品属性数据的混合推荐方法,并以电信运营商向用户推荐套餐为应用场景作具体论述。首先,对不同来源的特征进行有规律的特征组合,构造成组合特征。并运用word2vec方法对用户行为数据当中的时间序列数据进行特征增强,构建拥有相同消费习惯的用户之间的联系。然后,基于高效梯度提升树算法对大规模用户数据集进行建模,将高效梯度提升树模型的特征重要度以及模型输出的用户选择套餐的概率分布对套餐进行过滤,以达到对用户进行个性化套餐推荐的目的。最后,基于联通运营商发布的用户多源数据,根据构造完成的混合推荐方法,对用户的兴趣套餐进行预测并完成个性化套餐推荐。实验结果表明,基于特征组合与特征增强后的数据集可以显著提升高效梯度提升树模型预测用户匹配套餐的精度。此外,基于特征工程与高效梯度提升树模型的混合推荐方法能有效地预测到大规模用户匹配套餐的类别,且预测的精度较高,验证了基于特征工程与高效梯度提升树模型的混合推荐方法的有效性和适应性。
基于云平台的发电集团火电智能分析系统的设计与开发
这是一篇关于发电集团,云平台,转子热应力,梯度提升树,Spark的论文, 主要内容为随着我国新能源产业的逐渐成熟,火电产业的发展正面临着巨大的压力。但是作为传统能源,火力发电仍占据重要地位,如何节能降耗,提高火电机组的运行效率是传统发电集团亟待解决的问题。如今火电厂内部已经建立起了自己的生产管控中心,然而集团总部对于旗下发电厂的管理,与智能化仍然存在差距,随着电厂规模的扩大,程序繁琐等问题日益凸显。此外,火电厂每天都会产生大量高维度、多种类的数据,如何挖掘其深层有效信息也是企业面临的一个关键问题。伴随着云平台技术的发展以及在互联网行业的快速应用,以分布式存储、云计算为基础的平台建设为本文提供了一种解决发电集团对于旗下电厂监管问题的新思路。本文针对某能源集团现有信息化平台的不足,以实际项目为依托,设计了一种基于Hadoop云平台的发电集团火电智能分析系统,能够实现集团旗下电厂各类数据的集中管理分析。本文具体研究内容如下:首先,论文针对集团及旗下某电厂现有生产信息系统进行调研分析,了解电厂内部信息系统体系架构。在此基础之上对发电集团火电智能分析系统做了详细的需求分析,并设计了智能分析系统总体建设方案,分别对系统建设目标、总体结构、云平台技术架构及服务器部署方案进行描述。其次,对比了常见实时数据库平台性能,综合实际项目需要,选用openPlant实时数据库软件作为火电厂的数据管理工具,详细说明了基于openPlant数据库的数据采集模块结构及数据库表结构。在实现数据采集、存储的基础之上,对本系统各主要模块功能进行了设计。再次,本文提出了一种基于分布式梯度提升树算法的汽轮机转子瞬态热应力软测量方法。首先通过平均影响值法对数据库原始数据进行特征提取处理,选择出与热应力值具有强相关性的变量。将提取后的数据上传至分布式文件系统,引入Spark框架下的分布式梯度提升树算法进行模型训练,实现了对瞬态热应力的软测量功能。通过对比分析可知模型具有较高的准确性,能够满足生产实际需要。最后,论文展示了系统主要用户功能界面及后台管理界面。选用发电机组历史数据,在平台上测试了软测量模型并行加速比,进一步验证了其优越性能。
基于机器学习的推荐算法研究及分布式实现
这是一篇关于推荐系统,协同过滤,梯度提升树,聚类,矩阵分解,神经网络,Spark的论文, 主要内容为在大数据时代,庞大的数据信息给社会带来了“数据爆炸”,给个人用户带来了“信息过载”问题。作为有效缓解“信息过载”问题的一种方法,推荐系统在社会生活中得到了广泛的应用。推荐系统作为一种信息过滤系统,从大量信息中挖掘出有用信息,为用户进行精准推荐,有效解决了个人用户的“信息过载”问题。同时,推荐系统在消费领域发挥着不可或缺的作用,推动了企业进行数据营销,给企业和社会带来了较高的经济效益。本文围绕基于机器学习的推荐算法,并进行了探索和研究,开展了以下几项研究工作:(1)提出了基于数据预填充和聚类的协同过滤推荐算法。该方法首先针对用户物品评分矩阵稀疏性问题,基于数据挖掘的思想对稀疏矩阵进行填充处理,并将评分填充问题建模为分类问题,使用了梯度提升树GBDT+LR算法实现了对稀疏矩阵进行部分评分数据的预填充处理,并通过选取合适的分类概率阈值,增加额外的有效信息的同时,避免了带来的噪声干扰。其次,使用了流形降维t-SNE算法和均值漂移聚类Meanshift算法,对预填充后的评分矩阵进行了降维和聚类,生成用户聚类中心,进一步改善了评分矩阵稀疏性问题。最后根据生成的聚类中心,计算目标用户和最近邻聚类中心的相似度,从而进行显式评分预测,对目标用户生成推荐列表。实验结果表明,该算法通过利用数据预填充、降维、聚类等算法,有效增加了额外信息,改善了数据稀疏性问题,提升了推荐准确率,具有良好的推荐效果。(2)提出了基于神经网络的交叉协同过滤算法。该方法针对传统推荐算法矩阵分解模型的泛化能力不足、信息损失等问题,将深度神经网络与矩阵分解相融合,并在网络结构中加入Cross显式特征交叉算子,挖掘用户和物品的显式高阶特征信息表达,预测用户对物品的隐式评分。实验结果表明,该算法发挥了深度神经网络的作用,增加了模型的泛化能力,充分挖掘了用户和物品的特征信息表示,减少了信息损失,具有较好的推荐效果和可扩展性。(3)提出了基于数据预填充的ALS算法的分布式实现。该方法针对用户物品评分矩阵稀疏性问题及推荐实时性需求,将数据预填充算法和ALS(交替最小二乘法)算法相结合,并在分布式计算平台Spark上进行了并行化实现。首先分析了分布式计算平台的优势;其次将数据预填充和ALS算法相结合,在Spark上进行了并行化实现,并针对实验参数进行了对比实验;最后将算法运行所消耗的时间在Spark和单机上进行了对比。实验结果表明,数据预填充能够为原始数据集带来额外的有效信息,减少误差损失;同时,Spark对大规模数据集计算有着显著的优势,能够缩短计算时间,具有良好的实时性和计算资源可扩展性。
基于云平台的发电集团火电智能分析系统的设计与开发
这是一篇关于发电集团,云平台,转子热应力,梯度提升树,Spark的论文, 主要内容为随着我国新能源产业的逐渐成熟,火电产业的发展正面临着巨大的压力。但是作为传统能源,火力发电仍占据重要地位,如何节能降耗,提高火电机组的运行效率是传统发电集团亟待解决的问题。如今火电厂内部已经建立起了自己的生产管控中心,然而集团总部对于旗下发电厂的管理,与智能化仍然存在差距,随着电厂规模的扩大,程序繁琐等问题日益凸显。此外,火电厂每天都会产生大量高维度、多种类的数据,如何挖掘其深层有效信息也是企业面临的一个关键问题。伴随着云平台技术的发展以及在互联网行业的快速应用,以分布式存储、云计算为基础的平台建设为本文提供了一种解决发电集团对于旗下电厂监管问题的新思路。本文针对某能源集团现有信息化平台的不足,以实际项目为依托,设计了一种基于Hadoop云平台的发电集团火电智能分析系统,能够实现集团旗下电厂各类数据的集中管理分析。本文具体研究内容如下:首先,论文针对集团及旗下某电厂现有生产信息系统进行调研分析,了解电厂内部信息系统体系架构。在此基础之上对发电集团火电智能分析系统做了详细的需求分析,并设计了智能分析系统总体建设方案,分别对系统建设目标、总体结构、云平台技术架构及服务器部署方案进行描述。其次,对比了常见实时数据库平台性能,综合实际项目需要,选用openPlant实时数据库软件作为火电厂的数据管理工具,详细说明了基于openPlant数据库的数据采集模块结构及数据库表结构。在实现数据采集、存储的基础之上,对本系统各主要模块功能进行了设计。再次,本文提出了一种基于分布式梯度提升树算法的汽轮机转子瞬态热应力软测量方法。首先通过平均影响值法对数据库原始数据进行特征提取处理,选择出与热应力值具有强相关性的变量。将提取后的数据上传至分布式文件系统,引入Spark框架下的分布式梯度提升树算法进行模型训练,实现了对瞬态热应力的软测量功能。通过对比分析可知模型具有较高的准确性,能够满足生产实际需要。最后,论文展示了系统主要用户功能界面及后台管理界面。选用发电机组历史数据,在平台上测试了软测量模型并行加速比,进一步验证了其优越性能。
电商平台的用户消费行为分析预测模型
这是一篇关于数据挖掘,主成分分析,朴素贝叶斯,决策树,梯度提升树的论文, 主要内容为信息技术的飞速发展,我们已经进入了网络大数据时代,年轻人的网购已经成为了一种时尚,电子商务平台已聚集了大量消费者的购买数据。很多的电子商务平台利用Hadoop及Spark等大数据和云计算技术[1],从高维海量的数据中提取有用的信息,对在线用户消费行为进行分析建模,预测消费者的需求。其主要用途在于三个方面。一方面用于商品的展现、个性化推荐和精准地投放广告;另一方面用于通过商品价格、销售量、商品评价等影响用户购买决策;最后用于支持国家、地区和企业基于数据的决策,根据购买数据的分析结果了解消费者的消费行为,及时调整产业结构,使得经济协调、稳定、持续的发展,造福于社会[2]。本文针对当前电商平台面临的用户消费行为预测准确率问题,将数据挖掘技术引用到用户消费行为分析预测中,对现有的数据挖掘算法进行筛选和组合,构建一种适合于利用网络数据对用户消费行为进行分析与预测的算法。为确保论文具有实际应用价值,本文的数据来源于淘宝网的消费数据。但由于从网上获取的数据常常存在缺失值、异常数据和量纲不一致等特点,所以本文首先对原始数据进行预处理。为避免数据维度过高,本文采取主成分分析方法选取相互独立的因子,从而达到降低数据维度的效果。本文将处理后的数据分为测试数据集和训练数据集,运用朴素贝叶斯模型、决策树(CART树和条件推断树)模型和梯度提升树模型对测试集数据进行拟合,再将拟合好的模型用于训练集数据的预测,最后利用混淆矩阵(Confusion Matrix)比较不同模型的训练数据集的预测结果和真实结果的准确率,为电子商务平台或企业决策提供科学的依据,孵化基于大数据分析的新兴产业,解决用户的重大需求问题,成为推动社会进步的新引擎。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码导航 ,原文地址:https://m.bishedaima.com/lunwen/55509.html