给大家推荐8篇关于特征构建的计算机专业论文

今天分享的是关于特征构建的8篇计算机毕业论文范文, 如果你的论文涉及到特征构建等主题,本文能够帮助到你

基于混合推荐的在线选房系统的设计与实现

这是一篇关于混合推荐,特征构建,Wide&Deep DeepFM,推荐系统的论文, 主要内容为近年来,随着互联网技术与数字信息化转型的不断推进,房产行业作为国民经济支柱产业之一也在逐步从上游开发商向中游服务平台演进,尤其是在新冠疫情的冲击下,致使产业链从“线下服务经济”加速升级为“线上体验经济”。与此同时,随着国民经济的持续发展,城市化进程逐年加快,房屋的需求量也在稳定增加,所以,结合互联网技术打造高水准的购房服务体验成为业内趋势,也是必经之路。但鉴于房源特征信息复杂,传统的推荐模型无论是在数据集的处理上还是多重特征的交叉匹配上,其能力都显得尤为不足。为解决上述问题并提高用户在线选房体验,本文结合传统推荐算法与深度学习模型,设计并实现了基于混合推荐的在线选房系统。具体地,本文在系统首页设计了基于Wide&Deep算法的房源推荐列表模型;同时为了提高房源曝光率与用户点击率,在详情页设计了基于内容&Embedding的相似列表推荐模型,还设计了基于Deep FM算法的猜你喜欢推荐模型。在基于Tensor Flow框架的离线模型训练实验中,基于Wide&Deep的推荐模型的精确率达到79%、AUC达到78%,基于Deep FM的猜你喜欢推荐模型的精确率达到82%、AUC达到85%,表明本文设计的推荐模型具有良好的分类能力,可以为用户进行房源列表推荐。此外,为了高效地实现本文设计的混合推荐模型,结合房源、用户元信息对模型的“血液”特征工程进行了详细的设计并基于Spark计算引擎有效地完成了特征的构建,然后基于Tensor Flow Serving完成并部署了模型的线上服务。同时,为了提升用户的整体体验以及系统的完整性,本系统使用主流框架Spring Boot搭建后台服务、Vue框架搭建前端服务,并基于Redis存储线上特征以提高系统的存取效率;加入个人中心模块以及房源信息管理模块以完善系统的整体功能,保证系统的易用性以及可维护性。本课题以本人实习期间项目为背景,在导师的帮助下现已完成了各个模块的功能开发与测试,且运行正常,达到系统预期目标与效果。

基于智能计算的无人机遥感图像分类

这是一篇关于特征选择,特征构建,高维数据,松枯死木早期侵染检测的论文, 主要内容为随着高维数据处理需求越来越多,大量冗余不相关特征会严重影响分类性能,迫切需要高效的特征选择和构建方法过滤不相关特征并构建新特征。智能算法中,人工蜂群算法已被证明是有效的特征选择方法,遗传规划算法则是有效的特征构建方法。利用无人机拍摄的高光谱松树林分遥感影像是检测松材线虫病早期侵染松树的有效方法。但这种影像数据属于高维数据,如何对其进行有效的特征选择和构建提高检测的准确性,对松材线虫病防治至关重要。本研究对人工蜂群算法进行了改进,并将改进的算法应用在由无人机获取的松枯死木林分高光谱遥感影像数据上进行特征选择。同时,考虑到人工设计植被指数难度大,利用遗传规划算法自动设计植被指数用于松枯死木早期侵染检测。本文主要的研究内容及创新点如下:(1)针对人工蜂群算法的探索能力强,收敛速度慢,开发能力弱的特点,本文提出了一个使探索开发能力趋于平衡的人工蜂群框架。首先,各解由雇佣蜂进行更新,保留原始人工蜂群算法的部分探索能力以广泛探寻搜索空间。然后,在观察蜂阶段引入具有强开发能力的算子,以增强算法的开发能力使算法开发探索能力达到平衡。最后,由于侦查蜂会影响算法寻优效率且消耗计算资源,因此被移除。在此框架的基础上,本文进一步提出了BABCGWO和BABCWOA两个算法,与CSO、VSCCPSO、ALO＿GWO和ACABC 4个优秀的特征选择算法在12个广泛使用的数据集上进行比较。实验结果表明,本文提出的框架成功平衡了探索和开发能力,改进的两个算法在分类精度、特征子集大小和运行速度方面均表现出显著的优越性。(2)针对高光谱图像数据中冗余信息量大的问题,本文将改进的算法用于马尾松高光谱遥感图像数据的特征选择。实验结果显示,BABCGWO与BABCWOA两个算法分别从176个特征中仅提取23与29个有效特征,而分类错误率降到了8.3%与9.2%。与CSO、VSCCPSO、ALO＿GWO和ACABC算法相比,本文算法也以较少的特征数取得了较低的错误率。可以看出,本文提出算法能够精准找出有效表征早期侵染马尾松重要图像波段,提高分类识别性能。(3)针对以往研究植被指数进行目标特征表征需人工设计,难度大,且需要丰富专业知识的问题,本文将一种基于改进的遗传规划算法植被指数自动构建方法用于马尾松高光谱遥感图像分析。该算法在原有遗传规划算法的基础上,增加了剪枝操作并改进了变异的方式。实验结果表明,利用构建的新指数能够获得更高的早期侵染的松枯死木分类精度,在马氏距离分类器与决策树分类器上识别精度分别达到了87.58%与87.47%。

基于Voting策略的在线商品购买预测模型

这是一篇关于网络购买行为,召回,特征构建,数据挖掘,机器学习算法的论文, 主要内容为随着线上经济的日新月异,整个购物时代已经过渡到线上购物时代。在线下的购物中,消费者和商家都是面对面进行交易,商家可以直观看到消费者的购物需求和购物行为。而在线上的购物行为,电商平台只能利用强大的服务器来进行记录和管理,然后从这些海量的用户行为数据中挖掘出相关信息来了解线上消费者的购物倾向,从而预测用户未来的购买行为。所以,如何利用数据挖掘算法和机器学习算法从海量的用户购物行为数据中,挖掘出线上用户的购物倾向,成为当今研究热点。首先,本论文对用户购买行为预测的研究背景、意义和国内外研究现状进行介绍,并且给出了本论文的创新点和整体研究结构框架。其次,介绍了召回阶段的数据挖掘算法的基本理论,并对召回的用户-商品列表进行部分展示。再次,本文选取了阿里云比赛中提供的真实用户购物行为数据(用户信息数据、商品信息数据和用户行为信息数据),根据对其数据的探索性分析和实际的业务背景,以召回的用户-商品列表为提取特征的基础,构造了89个数据特征,接着基于SVM-RFE特征选择算法选择了排名前30的数据特征。在以上分析后,本文选取逻辑回归模型和随机森林算法模型构造用户购买预测模型,并利用Soft Voting算法融合策略对以上两个最优模型进行算法融合,构建成混合模型,进行实证研究。这一过程中,主要的实证研究有:其一,对用户历史购物行为数据进行探索性分析,例如:分析哪种购物行为最能影响未来的用户购买行为、分析购物行为发生的时间是否影响未来的购物行为等,并对原始三个数据进行对应关联。其二,在数据探索分析中发现,用户在过去购物行为所发生的时间对未来的用户购买行为有着显著的影响,所以构造了用户u对商品i在考虑时间因子后的兴趣影响度Ru,i,并添加到数据中。其三,将F1值作为用户购买预测模型的评价指标,并对预测模型超参数进行调优,进行5折交叉验证选择出最优的用户购买预测模型。实证结果显示:基于Soft Voting算法融合策略构造的混合模型在训练集和测试集中的F1值都要高于调优后的单一机器学习算法模型,为最优用户购买预测模型。最后,对本论文的研究过程进行总结,并且对以后的工作进行展望。

基于混合推荐的在线选房系统的设计与实现

基于集成学习的径流研究以及应用

这是一篇关于径流预测,特征构建,集成学习,堆叠法,预报平台的论文, 主要内容为我国西部地区拥有丰富的水资源、有大量的水利水电工程建设,大部分区域都以农林、畜牧业为主要经济产业,径流预测对该区域经济发展规划非常重要。传统径流预测多是基于成熟的水文循环模型,但是径流值的影响因素非常多,各因素之间存在复杂的关系,其预测准确率高度依赖其他因素。而近年来较为热门的机器学习模型又很少结合气象因素等特征,只基于径流值本身的数据规律来进行预测,所以预测效果还有提升的空间。基于以上的问题,本文主要完成了两个部分的工作,一是提出了新的径流预测算法,二是基于径流预测算法搭建了径流预报平台。算法部分,本文通过各渠道获取径流值的影响因素数据,提出通过PCA与Prophet模型预测的方法进行特征构建得到有效特征序列,解决了特征繁杂且高共线性关系造成的模型过拟合问题。同时提出了一种基于Stacking思路,以LSTM、Prophet、岭回归模型为基类学习器,再以岭回归模型为二层学习器的集成学习方法。解决了传统机器学习模型在丰水期径流值变化较大时拟合效果不好的问题。本文对西部某流域中人口较为密集、农业较为发达的站点A与站点B进行径流预测,使用R2与准确率作为评估指标。从评估指标的结果看来,集成学习方法在两个站点上预测表现不错。对比当前在时序数据上广泛应用的LSTM模型,集成学习模型对站点A的预测结果中,在R2基本持平的情况下准确率提高了3%,对站点B的预测结果中,在准确率持平的情况下,R2提高了2%。平台部分,本文基于集成学习的径流预测算法以及其实验中涉及的相关对比算法搭建径流预报平台。根据平台功能结构将平台划分为用户服务、算法服务、基础功能服务等三个服务。用户服务负责不同权限用户的信息管理,权限校验,算法服务负责完成各算法实现,基础功能服务则负责算法相关数据的管理。再根据技术架构将平台分为数据层、算法层、应用层三层,数据层使用Mysql存储关系型数据,使用Redis存储缓存数据。算法层使用Flask框架封装各算法并通过Http完成通信。应用层基于Vue框架完成前端工作开发,基于Spring Boot框架完成后端开发。本平台以径流值预报为核心工作,向流域站点附近农林、畜牧业从业人员提供径流预测值查询服务。同时将本文所涉及到的算法相关数据也集成到平台中,提供算法数据查询功能,可供有需求的研究人员获取。