基于足底压力图像的足型识别方法研究与实现
这是一篇关于足底压力图像,足型识别,卷积神经网络,集成学习,GBDT的论文, 主要内容为由于人体足部的先天形状或不正确的行走姿势会导致病态足型的发生,病态足型不仅对足部健康构成威胁,还会导致行走时的疲劳和疼痛,甚至引起运动障碍和下肢其他疾病。因此需要对病态足型进行准确的识别,以便做出相应的预防、护理矫正措施。目前利用三维足部图像或X射线图像进行足型研究的较多,然而,三维足部图像需要测量员具有一定的技术与熟练度,且会存在不可避免的人工误差;X射线片需要人体照射X光,且需要专门的仪器以及专业医生的诊断。而以二维足底图像对足型进行研究更为便捷且对人体无害,因此,本文以足底压力图像为研究对象,结合深度学习和传统机器学习技术对足型识别算法进行研究,具体工作如下:(1)构建不同足型的足底压力图像数据集。首先按照采集数据的相关规范与流程进行数据采集,被采集对象为医院康复科诊疗室就诊的受试者,共收集了两个时间段的数据。从2019年9月到2019年12月为第一个采集时间段,共采集45人;2020年9月到2020年12月为第二个采集时间段,加上第一批45人的数据共75人,包含高弓、扁平以及正常三种足型。然后为了获得高质量的数据集,对采集到的图像数据进行伪彩色、剪切、去噪、规整、中心化等的预处理,最后针对两批数据建立了75人不同足型的数据集,共6616幅足底压力图像。(2)提出了一种基于卷积神经网络的集成学习足型识别算法。由于足底压力图像具有大量的感知信息,从图像的位置、大小、压力值等特征不能直观的判断出足型,而卷积神经网络的卷积层能自动提取图像数据的学习特征,并且不同网络提取特征的特点不同,因此,集成多个网络,通过训练多个模型,并将预测结果融合到一起一定程度上能够提升识别的准确率。该算法采用两个基础学习器构成集成学习的加权投票机制,第一个基学习器采用Google Net网络训练并输出识别结果;第二个基学习器采用Alex Net网络与SVM分类器相结合,Alex Net网络用来提取卷积特征,将特征向量和标签输入SVM分类器进行分类,并输出结果。最终准确率达到了85.78%,表明该算法在本文构建的数据集上对足型识别具有一定的效果。(3)提出了一种基于足弓特征的足型识别算法。基于深度卷积神经网络的方法对于足型识别取得了一定的效果,但由于不同人的足底压力图像个体差异性较大,这使得网络所提取的全局特征在一定程度上更加关注这种个体差异特征,而忽略了不同足型的自身独特的足弓特征。因此,本文从病态足型在足底压力图像上所表现的形状、面积等局部特点出发,设计一种具有针对性的算法提取足弓特有的特征。该算法首先对预处理后的足底压力图像计算脚掌面积和定位脚掌的关键点,从而得到AI(Arch Index,足弓指数)、FI(Footprint Index,脚印系数)、AW(Arch Width,足弓宽度)、RI(Ratio Index,比值系数)、ITF(Interrupt The Foot,足弓中断)等足型特征。最后采用GBDT(Gradient Boosting Decision Tree,梯度提升决策树)分类器对提取的足型特征和标签进行训练并识别。该算法对于本文数据集中的不同足型均能获得很好的效果,最终的识别准确率达到了94.67%,证明该算法可以有效的判断本文足底压力图像的足型。(4)利用本文研究的足型识别算法,实现了一款基于足底压力图像的足型分析系统。该系统包含了足型简介、足型特征分析、足型识别以及修改登录密码等功能,实现对单幅足底压力图像足型的判断与分析,以及实现用算法模型对输入的不同足底压力图像的足型进行识别。成功落地后可以服务于广大群众和医院康复科,以帮助人们实现足型的判断与识别,尽早采取治疗康复措施。
基于足底压力图像的足型识别方法研究与实现
这是一篇关于足底压力图像,足型识别,卷积神经网络,集成学习,GBDT的论文, 主要内容为由于人体足部的先天形状或不正确的行走姿势会导致病态足型的发生,病态足型不仅对足部健康构成威胁,还会导致行走时的疲劳和疼痛,甚至引起运动障碍和下肢其他疾病。因此需要对病态足型进行准确的识别,以便做出相应的预防、护理矫正措施。目前利用三维足部图像或X射线图像进行足型研究的较多,然而,三维足部图像需要测量员具有一定的技术与熟练度,且会存在不可避免的人工误差;X射线片需要人体照射X光,且需要专门的仪器以及专业医生的诊断。而以二维足底图像对足型进行研究更为便捷且对人体无害,因此,本文以足底压力图像为研究对象,结合深度学习和传统机器学习技术对足型识别算法进行研究,具体工作如下:(1)构建不同足型的足底压力图像数据集。首先按照采集数据的相关规范与流程进行数据采集,被采集对象为医院康复科诊疗室就诊的受试者,共收集了两个时间段的数据。从2019年9月到2019年12月为第一个采集时间段,共采集45人;2020年9月到2020年12月为第二个采集时间段,加上第一批45人的数据共75人,包含高弓、扁平以及正常三种足型。然后为了获得高质量的数据集,对采集到的图像数据进行伪彩色、剪切、去噪、规整、中心化等的预处理,最后针对两批数据建立了75人不同足型的数据集,共6616幅足底压力图像。(2)提出了一种基于卷积神经网络的集成学习足型识别算法。由于足底压力图像具有大量的感知信息,从图像的位置、大小、压力值等特征不能直观的判断出足型,而卷积神经网络的卷积层能自动提取图像数据的学习特征,并且不同网络提取特征的特点不同,因此,集成多个网络,通过训练多个模型,并将预测结果融合到一起一定程度上能够提升识别的准确率。该算法采用两个基础学习器构成集成学习的加权投票机制,第一个基学习器采用Google Net网络训练并输出识别结果;第二个基学习器采用Alex Net网络与SVM分类器相结合,Alex Net网络用来提取卷积特征,将特征向量和标签输入SVM分类器进行分类,并输出结果。最终准确率达到了85.78%,表明该算法在本文构建的数据集上对足型识别具有一定的效果。(3)提出了一种基于足弓特征的足型识别算法。基于深度卷积神经网络的方法对于足型识别取得了一定的效果,但由于不同人的足底压力图像个体差异性较大,这使得网络所提取的全局特征在一定程度上更加关注这种个体差异特征,而忽略了不同足型的自身独特的足弓特征。因此,本文从病态足型在足底压力图像上所表现的形状、面积等局部特点出发,设计一种具有针对性的算法提取足弓特有的特征。该算法首先对预处理后的足底压力图像计算脚掌面积和定位脚掌的关键点,从而得到AI(Arch Index,足弓指数)、FI(Footprint Index,脚印系数)、AW(Arch Width,足弓宽度)、RI(Ratio Index,比值系数)、ITF(Interrupt The Foot,足弓中断)等足型特征。最后采用GBDT(Gradient Boosting Decision Tree,梯度提升决策树)分类器对提取的足型特征和标签进行训练并识别。该算法对于本文数据集中的不同足型均能获得很好的效果,最终的识别准确率达到了94.67%,证明该算法可以有效的判断本文足底压力图像的足型。(4)利用本文研究的足型识别算法,实现了一款基于足底压力图像的足型分析系统。该系统包含了足型简介、足型特征分析、足型识别以及修改登录密码等功能,实现对单幅足底压力图像足型的判断与分析,以及实现用算法模型对输入的不同足底压力图像的足型进行识别。成功落地后可以服务于广大群众和医院康复科,以帮助人们实现足型的判断与识别,尽早采取治疗康复措施。
基于机器学习的O2O优惠券转化率研究
这是一篇关于O2O优惠券,随机森林,GBDT,XGBoost,LightGBM,Stacking融合模型,K均值聚类的论文, 主要内容为随着通信技术迅猛发展,移动网络和宽带网络快速普及到每家每户,这极大地促使电子商务的发展。目前,基于大数据、云计算的新的电子商务应运而生,线上渠道和线下渠道有机结合的商务模式O2O(Online To Offline)发展迅猛,随之而来的各种营销手段层出不穷,譬如,优惠券。分析O2O优惠券转化客流情况,实现快速精准预测用户是否在规定时间使用领取的优惠券,不仅能够赋予商家更强的销售能力,帮助商家有效投放优惠券,也可以让具有一定偏好的消费者得到真正的实惠。本文基于O2O优惠券转化情况的研究主要包括以下三个方面:(1)基于天池公开数据集,分析了某电商平台2016年1月1日到2016年6月30日的用户历史数据,包含领券时间、券面优惠情况、用户距离线下商家最近的距离和用户在某商家消费的时间,通过对这些维度的数据可视化分析,挖掘数据蕴含的潜在规律,构建了58个特征,包含用户、商家、优惠券、用户-商家、用户-优惠券和其他因素六个维度。(2)基于构建的特征集,利用随机森林、梯度提升树、XGBoost和LightGBM四个单模型和Stacking融合模型对O2O优惠券转化率进行预测,通过实验验证了特征选取的有效性和所用算法的合理性。(3)考虑到用户具有相似性的消费心理、商家具有相似的营销策略,本文进一步对用户和商家进行K均值聚类,将用户分为三类,商家归为四类,再进行Stacking融合模型预测。实验证明,基于聚类的融合模型预测准确性得到了较大的提升。
基于改进协同过滤与GBDT混合推荐算法的研究
这是一篇关于决策树,随机森林,协同过滤,GBDT,推荐算法的论文, 主要内容为随着互联网的快速发展和普及,越来越多的人会通过互联网来获取有价值的信息,比如网上购物,用户可以通过电商平台的数据,搜索并获取到心仪的商品。但随着电商的发展以及用户的增加,产生的海量信息会造成信息过载的问题,会对用户的选择造成严重的干扰。商品推荐算法能够帮助用户快速获取有价值的信息,使信息过载问题得到有效的解决,是当前的热门研究方向。推荐算法不仅可以在海量数据中进行筛选,主动推荐感兴趣的信息,还可以针对用户进行个性化推荐,简化用户对目标商品的获取过程,节省时间的花费。为提高推荐系统的准确性和高效性,本文设计了一种基于改进协同过滤与GBDT混合推荐算法,该算法主要思想为基于用户行为数据预测用户购买行为,设计了一种新的预测用户购买行为的算法模型。研究内容包括:1)数据预处理,以此来提高原始数据的质量,并通过样本的选取来避免正负样本相差过大的问题。2)特征工程,主要从特征提取、特征选择、构建特征体系三个方面进行分析。3)推荐算法的模型设计,本文将选取协同过滤和决策树混合算法来做推荐模型。针对与用户有交互品牌数据,采取决策树的衍生算法随机森林来进行处理,以避免决策树的过拟合问题。针对与用户无交互品牌的数据,采用改进的协同过滤算法进行处理,在计算过程中为用户的行为给予层次分析的权重,以改善协同过滤算法的合理性。然后通过混合算法的结合方式将随机森林和协同过滤的推荐结果混合,并将混合的推荐结果输入GBDT模型中进行进一步的优化,使本文设计的推荐算法模型更加完善。为了验证混合推荐算法的有效性与优越性,本文采用了当前主流的大规模数据处理计算引擎Spark开发环境进行实现与分组验证。文中详细的介绍了Spark推荐系统的设计与实现架构,其包含监控模块、数据存储模块、离线计算模块、推荐引擎模块等内容。同时给出了系统实现的数据库设计与特征体系的构建流程,最后重点论述了进行混合推荐算法与传统单一推荐算法对比实验以及基于不同的平台环境下进行混合推荐算法运行响应对比实验。实验结果数据表明,在Spark环境下设计并实现的混合推荐算法在召回率、准确率、响应性等具有较好的有效性与优越性,改善了用户的购物体验,同时该混合算法为其他同类推荐算法的设计与实现提供了较好的参考模型。
基于上下文信息的移动兴趣点推荐系统的研究与实现
这是一篇关于兴趣点,推荐系统,上下文,GBDT的论文, 主要内容为随着互联网产业的发展,互联网上的数据量变得越来越庞大,用户想要从大量的数据中获取所需信息反而变得越发困难。而对于商家来讲,迅速、高效地使自己的产品信息出现在目标用户面前,是实现产品销售的关键。为此,论文研究并实现了基于上下文信息的移动兴趣点推荐系统及相关算法。论文提出一种融入地理上下文信息的协同过滤兴趣点推荐算法,算法采用基于用户的协同过滤的方法,针对传统协同过滤寻找相似用户过程进行了改进。算法基于word2vec网络实现兴趣点及用户的Embedding向量化,通过计算向量相似度获取用户签到记录相似度;算法还提出一种应用历史签到位置矩阵,计算用户间签到地理相似度的计算方法;算法将以上签到记录相似度和签到地理相似度进行融合,来寻找相似用户群组并进行相关推荐。与传统协同过滤算法进行对比实验,本算法表现较好。论文实现了基于上下文信息与GBDT的兴趣点推荐算法,该算法采用 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)与K-means结合的聚类方法,处理地理上下文信息;采用从多种时间维度进行统计分析的方法,处理时间上下文信息;采用对兴趣点进行分类,计算用户历史访问次数等方法,处理历史行为上下文信息;最后,基于以上上下文信息,采用GBDT(Gradient Boosting Decision Tree,梯度提升决策树)算法对兴趣点签到记录进行评分排序,生成兴趣点推荐结果。论文对以上算法进行了大量实验工作,并基于开源数据集与其他算法进行了实验对比,实验结果表明,本文实现的算法有更好的推荐效果。基于以上两种兴趣点推荐算法,论文设计实现了基于上下文信息的移动兴趣点推荐系统。该系统包含移动客户端与服务器端,论文对移动客户端、服务器端分别进行了需求分析、总体设计,对系统的浏览地图模块、搜索兴趣点模块、查看兴趣点模块、推荐算法模块、存储用户历史点击记录模块、登录注册模块进行了详细设计与实现,并对开发完成后的系统进行了测试。
基于改进协同过滤与GBDT混合推荐算法的研究
这是一篇关于决策树,随机森林,协同过滤,GBDT,推荐算法的论文, 主要内容为随着互联网的快速发展和普及,越来越多的人会通过互联网来获取有价值的信息,比如网上购物,用户可以通过电商平台的数据,搜索并获取到心仪的商品。但随着电商的发展以及用户的增加,产生的海量信息会造成信息过载的问题,会对用户的选择造成严重的干扰。商品推荐算法能够帮助用户快速获取有价值的信息,使信息过载问题得到有效的解决,是当前的热门研究方向。推荐算法不仅可以在海量数据中进行筛选,主动推荐感兴趣的信息,还可以针对用户进行个性化推荐,简化用户对目标商品的获取过程,节省时间的花费。为提高推荐系统的准确性和高效性,本文设计了一种基于改进协同过滤与GBDT混合推荐算法,该算法主要思想为基于用户行为数据预测用户购买行为,设计了一种新的预测用户购买行为的算法模型。研究内容包括:1)数据预处理,以此来提高原始数据的质量,并通过样本的选取来避免正负样本相差过大的问题。2)特征工程,主要从特征提取、特征选择、构建特征体系三个方面进行分析。3)推荐算法的模型设计,本文将选取协同过滤和决策树混合算法来做推荐模型。针对与用户有交互品牌数据,采取决策树的衍生算法随机森林来进行处理,以避免决策树的过拟合问题。针对与用户无交互品牌的数据,采用改进的协同过滤算法进行处理,在计算过程中为用户的行为给予层次分析的权重,以改善协同过滤算法的合理性。然后通过混合算法的结合方式将随机森林和协同过滤的推荐结果混合,并将混合的推荐结果输入GBDT模型中进行进一步的优化,使本文设计的推荐算法模型更加完善。为了验证混合推荐算法的有效性与优越性,本文采用了当前主流的大规模数据处理计算引擎Spark开发环境进行实现与分组验证。文中详细的介绍了Spark推荐系统的设计与实现架构,其包含监控模块、数据存储模块、离线计算模块、推荐引擎模块等内容。同时给出了系统实现的数据库设计与特征体系的构建流程,最后重点论述了进行混合推荐算法与传统单一推荐算法对比实验以及基于不同的平台环境下进行混合推荐算法运行响应对比实验。实验结果数据表明,在Spark环境下设计并实现的混合推荐算法在召回率、准确率、响应性等具有较好的有效性与优越性,改善了用户的购物体验,同时该混合算法为其他同类推荐算法的设计与实现提供了较好的参考模型。
城市生活垃圾焚烧过程模型操作软件研发
这是一篇关于城市生活垃圾,焚烧过程,GBDT,模型操作软件,C#的论文, 主要内容为随着我国社会的快速发展,城市化进程日益加快,生活垃圾的总量不断攀升,垃圾焚烧发电法得到了越来越广泛的应用。由于该过程具有干扰频繁、强耦合、非线性等复杂特性,不利于控制系统的设计与实现,可能会引起一系列环境污染问题,因而有关该过程的稳定控制、运行优化和参数软测量研究受到了广泛关注。为了使现场调试的成本和风险降到最低,在实际工业现场实施运行优化、稳定控制等方法前,需在实验室进行仿真实验以确定方法的安全有效性。因此,对生产过程的仿真建模与实验平台的开发显得尤为重要。为了给城市生活垃圾焚烧过程参数控制与优化方法的研究提供便捷的操作环境,本文建立了垃圾焚烧过程炉膛温度模型,开发了一套针对垃圾焚烧过程控制的模型操作软件,并设计了一系列实验对炉温模型和软件系统进行了测试与分析。主要工作如下:(1)建立了垃圾焚烧炉的炉膛温度模型。在分析垃圾焚烧工艺过程和机理建模难点的基础上,采用基于数据驱动的方法建立了垃圾焚烧炉炉膛温度模型。由于炉膛温度是垃圾焚烧过程中最重要的控制变量,其模型的准确性对焚烧过程的控制起着至关重要的作用。在分析传统梯度提升回归树(GBDT)建模方法的利弊基础上,本文提出一种改进的梯度提升回归树建模算法,将Bagging方法、随机子空间法的思想与GBDT进行融合,构建了BR-GBDT算法,实现了多个GBDT的并行集成,有利于提高模型的泛化能力。并在UCI数据集上将其与其他经典算法进行对比,结果表明BR-GBDT算法具有更小的误差,能够更精准地实现预测功能;(2)设计和开发了垃圾焚烧过程模型操作软件。在分析实验功能和数据需求的基础上,结合垃圾焚烧过程模型众多和控制任务复杂的特点,基于该过程动态模型,研发了一套垃圾焚烧过程动态模型操作软件。首先对模型软件进行了结构和功能的设计,结构组成包括后台模型层、模块通讯层和人机界面层三层架构。主要功能包括焚烧过程动态模拟、模型计算、数据管理、实时通讯、实时趋势图显示和用户管理等;然后根据模块化的编程思想,采用C#高级语言开发了用户登录管理模块、Unity3D仿真模块、参数设置模块、趋势图模块、数据查询模块和OPC通讯模块等;最后采用MATLAB开发出后台模型,并运用.NET与MATLAB混合编程技术为软件提供后台算法支持;(3)实验研究。采用北京市朝阳区高安屯垃圾焚烧发电厂提供的历史数据对BR-GBDT炉膛温度模型进行了对比实验测试,实验表明其效果优于一些经典方法,证明了模型的有效性。另外,设计了一系列用于测试模型操作软件功能的实验,结果表明该模型软件能够正常运行,能够对垃圾焚烧这一工业过程进行3D仿真和数据操作,可与其他硬件设备实时通讯,进而为半实物仿真平台提供了虚拟的研究对象,也为垃圾焚烧过程控制、优化方法的后续研究打下了基础。
基于改进协同过滤与GBDT混合推荐算法的研究
这是一篇关于决策树,随机森林,协同过滤,GBDT,推荐算法的论文, 主要内容为随着互联网的快速发展和普及,越来越多的人会通过互联网来获取有价值的信息,比如网上购物,用户可以通过电商平台的数据,搜索并获取到心仪的商品。但随着电商的发展以及用户的增加,产生的海量信息会造成信息过载的问题,会对用户的选择造成严重的干扰。商品推荐算法能够帮助用户快速获取有价值的信息,使信息过载问题得到有效的解决,是当前的热门研究方向。推荐算法不仅可以在海量数据中进行筛选,主动推荐感兴趣的信息,还可以针对用户进行个性化推荐,简化用户对目标商品的获取过程,节省时间的花费。为提高推荐系统的准确性和高效性,本文设计了一种基于改进协同过滤与GBDT混合推荐算法,该算法主要思想为基于用户行为数据预测用户购买行为,设计了一种新的预测用户购买行为的算法模型。研究内容包括:1)数据预处理,以此来提高原始数据的质量,并通过样本的选取来避免正负样本相差过大的问题。2)特征工程,主要从特征提取、特征选择、构建特征体系三个方面进行分析。3)推荐算法的模型设计,本文将选取协同过滤和决策树混合算法来做推荐模型。针对与用户有交互品牌数据,采取决策树的衍生算法随机森林来进行处理,以避免决策树的过拟合问题。针对与用户无交互品牌的数据,采用改进的协同过滤算法进行处理,在计算过程中为用户的行为给予层次分析的权重,以改善协同过滤算法的合理性。然后通过混合算法的结合方式将随机森林和协同过滤的推荐结果混合,并将混合的推荐结果输入GBDT模型中进行进一步的优化,使本文设计的推荐算法模型更加完善。为了验证混合推荐算法的有效性与优越性,本文采用了当前主流的大规模数据处理计算引擎Spark开发环境进行实现与分组验证。文中详细的介绍了Spark推荐系统的设计与实现架构,其包含监控模块、数据存储模块、离线计算模块、推荐引擎模块等内容。同时给出了系统实现的数据库设计与特征体系的构建流程,最后重点论述了进行混合推荐算法与传统单一推荐算法对比实验以及基于不同的平台环境下进行混合推荐算法运行响应对比实验。实验结果数据表明,在Spark环境下设计并实现的混合推荐算法在召回率、准确率、响应性等具有较好的有效性与优越性,改善了用户的购物体验,同时该混合算法为其他同类推荐算法的设计与实现提供了较好的参考模型。
城市生活垃圾焚烧过程模型操作软件研发
这是一篇关于城市生活垃圾,焚烧过程,GBDT,模型操作软件,C#的论文, 主要内容为随着我国社会的快速发展,城市化进程日益加快,生活垃圾的总量不断攀升,垃圾焚烧发电法得到了越来越广泛的应用。由于该过程具有干扰频繁、强耦合、非线性等复杂特性,不利于控制系统的设计与实现,可能会引起一系列环境污染问题,因而有关该过程的稳定控制、运行优化和参数软测量研究受到了广泛关注。为了使现场调试的成本和风险降到最低,在实际工业现场实施运行优化、稳定控制等方法前,需在实验室进行仿真实验以确定方法的安全有效性。因此,对生产过程的仿真建模与实验平台的开发显得尤为重要。为了给城市生活垃圾焚烧过程参数控制与优化方法的研究提供便捷的操作环境,本文建立了垃圾焚烧过程炉膛温度模型,开发了一套针对垃圾焚烧过程控制的模型操作软件,并设计了一系列实验对炉温模型和软件系统进行了测试与分析。主要工作如下:(1)建立了垃圾焚烧炉的炉膛温度模型。在分析垃圾焚烧工艺过程和机理建模难点的基础上,采用基于数据驱动的方法建立了垃圾焚烧炉炉膛温度模型。由于炉膛温度是垃圾焚烧过程中最重要的控制变量,其模型的准确性对焚烧过程的控制起着至关重要的作用。在分析传统梯度提升回归树(GBDT)建模方法的利弊基础上,本文提出一种改进的梯度提升回归树建模算法,将Bagging方法、随机子空间法的思想与GBDT进行融合,构建了BR-GBDT算法,实现了多个GBDT的并行集成,有利于提高模型的泛化能力。并在UCI数据集上将其与其他经典算法进行对比,结果表明BR-GBDT算法具有更小的误差,能够更精准地实现预测功能;(2)设计和开发了垃圾焚烧过程模型操作软件。在分析实验功能和数据需求的基础上,结合垃圾焚烧过程模型众多和控制任务复杂的特点,基于该过程动态模型,研发了一套垃圾焚烧过程动态模型操作软件。首先对模型软件进行了结构和功能的设计,结构组成包括后台模型层、模块通讯层和人机界面层三层架构。主要功能包括焚烧过程动态模拟、模型计算、数据管理、实时通讯、实时趋势图显示和用户管理等;然后根据模块化的编程思想,采用C#高级语言开发了用户登录管理模块、Unity3D仿真模块、参数设置模块、趋势图模块、数据查询模块和OPC通讯模块等;最后采用MATLAB开发出后台模型,并运用.NET与MATLAB混合编程技术为软件提供后台算法支持;(3)实验研究。采用北京市朝阳区高安屯垃圾焚烧发电厂提供的历史数据对BR-GBDT炉膛温度模型进行了对比实验测试,实验表明其效果优于一些经典方法,证明了模型的有效性。另外,设计了一系列用于测试模型操作软件功能的实验,结果表明该模型软件能够正常运行,能够对垃圾焚烧这一工业过程进行3D仿真和数据操作,可与其他硬件设备实时通讯,进而为半实物仿真平台提供了虚拟的研究对象,也为垃圾焚烧过程控制、优化方法的后续研究打下了基础。
基于上下文信息的移动兴趣点推荐系统的研究与实现
这是一篇关于兴趣点,推荐系统,上下文,GBDT的论文, 主要内容为随着互联网产业的发展,互联网上的数据量变得越来越庞大,用户想要从大量的数据中获取所需信息反而变得越发困难。而对于商家来讲,迅速、高效地使自己的产品信息出现在目标用户面前,是实现产品销售的关键。为此,论文研究并实现了基于上下文信息的移动兴趣点推荐系统及相关算法。论文提出一种融入地理上下文信息的协同过滤兴趣点推荐算法,算法采用基于用户的协同过滤的方法,针对传统协同过滤寻找相似用户过程进行了改进。算法基于word2vec网络实现兴趣点及用户的Embedding向量化,通过计算向量相似度获取用户签到记录相似度;算法还提出一种应用历史签到位置矩阵,计算用户间签到地理相似度的计算方法;算法将以上签到记录相似度和签到地理相似度进行融合,来寻找相似用户群组并进行相关推荐。与传统协同过滤算法进行对比实验,本算法表现较好。论文实现了基于上下文信息与GBDT的兴趣点推荐算法,该算法采用 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)与K-means结合的聚类方法,处理地理上下文信息;采用从多种时间维度进行统计分析的方法,处理时间上下文信息;采用对兴趣点进行分类,计算用户历史访问次数等方法,处理历史行为上下文信息;最后,基于以上上下文信息,采用GBDT(Gradient Boosting Decision Tree,梯度提升决策树)算法对兴趣点签到记录进行评分排序,生成兴趣点推荐结果。论文对以上算法进行了大量实验工作,并基于开源数据集与其他算法进行了实验对比,实验结果表明,本文实现的算法有更好的推荐效果。基于以上两种兴趣点推荐算法,论文设计实现了基于上下文信息的移动兴趣点推荐系统。该系统包含移动客户端与服务器端,论文对移动客户端、服务器端分别进行了需求分析、总体设计,对系统的浏览地图模块、搜索兴趣点模块、查看兴趣点模块、推荐算法模块、存储用户历史点击记录模块、登录注册模块进行了详细设计与实现,并对开发完成后的系统进行了测试。
基于客户旅程分析的淘宝用户购买行为预测研究
这是一篇关于客户旅程分析,购买预测,GBDT,逻辑回归,模型融合的论文, 主要内容为随着互联网和数字技术的快速发展,用户正在尝试前所未有的自由来定义他们的购物旅程,并发现比以往任何时候都更容易在不同的购物阶段切换和整合实体和数字渠道,从搜索到购买,直到购买后阶段。越来越多的消费者成为多渠道购物者,因为他们同时搜索信息,并通过在特定时刻最优化其购物需求的多种渠道做出购买决定。反过来,这些客户需要零售商采取新的和具体的方法,旨在将公司的触角伸向尽可能多的渠道,从而最大限度地增加与客户完成交易的机会。在零售商提供无缝渠道体验的日益努力推动下,我们会通过不同的渠道和设备跟企业产生互动,如网页、手机软件、实时聊天和社交媒体等,由此带来的消费者行为不确定性也与日俱增。正因如此,客户旅程变得无比的复杂与多变。客户旅程是指消费者的购买行为过程。通常来说,用户都会经历从认知到兴趣,再转化为购买乃至忠诚的购买过程。本文将日益复杂的客户旅程进行量化,对贯穿全触点、全周期的客户行为和动机进行分析,并对客户的未来行为进行预测,为实现顾客价值提供了支撑和帮助。首先,本文以淘宝用户2017年11月27日至12月3日的行为数据为研究基础,将客户旅程概念化为用户的一系列行为过程,即点击浏览、加入购物车、收藏以及购买决定。然后基于AIPL消费者旅程模型,探索用户每段旅程的行为规律和偏好特征信息,为预测用户购买决策提供了特征准备。同时,借助“消费者时刻”这一概念,提炼出客户旅程每个步骤中涉及的关键营销指标,紧扣这些指标来分析用户的行为特征。最后,基于RFM模型对客户进行分类,根据用户的购买时间间隔和购买频次将用户分成发展用户、价值用户、保持用户和挽留用户,由此可以按照用户标签进行个性化营销。其次,我们整合每个用户的购买旅程行为信息,从中提取潜在的行为特征信息,对用户的购买行为进行预测。本文将用户的购买预测问题转化为机器学习中的二分类问题,基于客户旅程分析构建模型特征指标。由于样本数据不均衡,我们使用对负样本分别进行k-means聚类和下采样,在不影响特征充分性的基础上解决了样本失衡问题。在模型预测方面,本文将预测用户购买问题分解为两个子问题,即哪些用户会购买以及这些用户最可能购买哪些商品。然后采用模型融合的方法,将GBDT模型作为第一层,逻辑回归模型作为第二层,再将两种模型进行融合预测,对融合后的概率进行排序输出,即为最终的预测结果。由此可以解决用户变量过拟合问题,并且修正了 GBDT预测的效果。本文以电商用户的行为数据为研究基础,将客户旅程分析和营销指标结合,挖掘用户的行为特征,然后使用机器学习分类算法实现了对用户购买行为的预测,为电商平台向用户推荐其需要的商品提供了一定的参考价值。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码货栈 ,原文地址:https://m.bishedaima.com/lunwen/54528.html