基于数据挖掘的某公司绩效管理系统研究
这是一篇关于管理信息系统,数据挖掘,关联分析的论文, 主要内容为随着市场经济的不断完善与发展,企业之间的竞争压力日趋增大,同时,信息技术的发展,使得人力资源管理信息化的进程不断被加快。正确的配置和使用人力资源管理系统,逐渐成为提升企业的竞争力的重要手段。本文以A公司为研究对象,以信息技术和数据挖掘技术为工具,针对A公司的人力资源信息化现状进行了调研与分析,结合了相关理论与方法,提出了基于数据挖掘的绩效管理系统。首先,针对绩效管理业务中数据统计和分析工作量大的问题,对其业务流程及现状进行分析,设计了信息化业务流程,实现了系统的绩效管理功能,从而解决业务工作量大的问题;其次,针对人力资源数据利用程度较低的现状,利用Apriori算法和皮尔逊相关系数,分别构建并设计了数据挖掘的模型,对其进行数据验证,并将其融合到人力资源管理系统,用于提升A公司的数据利用能力;再次,针对A公司人力资源分析欠缺,围绕着人力资源分析的核心工作,如,组织结构、工龄结构等,设计并实现了对组织结构、年龄结构和学历结构等人力资源数据进行统计的功能,为A公司的人力资源分析提供支持;最后,利用原型法对系统展开自上而下的分析与设计,采用BS架构,使用SSM框架、web开发技术和数据库等,并基于MVC的设计思想,对管理信息系统进行了开发与实现。本文所设计与实现的绩效管理系统原型,实现了分散数据的集中管理,有利于绩效管理;并且在对人力资源数据的挖掘具有一定的可行性,也能够为人力资源分析提供可视化的数据支持。
基于多维数据挖掘方法的发动机振动评级的应用研究
这是一篇关于发动机振动故障,预测,振动分析系统,关联分析,聚类的论文, 主要内容为航空发动机振动故障是航空发动机中故障的主要问题。然而,由于发动机本身结构复杂,发动机振动时会出现多种故障现象,如:不平衡、碰磨、不对中、跳动等。这为发动机故障预测和诊断带来了巨大挑战。目前,在航空发动机领域中,一般通过现有的故障经验采取建立故障模型的方法来预测和诊断振动故障,但往往由于故障特征维数较多,不能全面有效地排查出具体细节原因。大数据和数据挖掘技术近年来作为解决工业制造领域问题的新途径,己经在不少公司和企业中的试验中取得良好效果。航空发动机作为工业制造领域中的“皇冠",以其复杂的结构和近乎极致的精准度闻名。那么,如何采用大数据和数据挖掘的方法对复杂而精确的发动机结构梳理分析,如何使用现有的振动故障数据对发动机的故障进行预测和诊断,是目前急需解决的问题。针对以上问题,本文的主要研究工作如下:(1)设计并实现航空发动机振动分析系统。本文从系统的需求分析入手,详细的阐述了航空发动机的结构本体、故障本体、装配基准、装配分解、试车参数和振动分析六大模块的功能需求及性能、安全性、扩展性等非功能需求。研究并完成了系统的构架设计、详细设计与实现。整个系统基于J2EE构架体系,采用B/S架构模式,系统开发中使用EXTJS前端框架技术、SpringMVC框架和基于非结构化的MongoDB数据库,建立了一套以发动机故障数据为基础的数据管理及分析系统,提高了企业信息化水平并为航空发动机故障预测和诊断提供了辅助手段。(2)提出了一种基于关联分析和聚类的振动故障分析方法。对不平衡故障数据做离散化处理,使用MAFIA算法挖掘数据中的频繁项集,初步确定振动故障特征集。在此基础上进行双层聚类。采用基于密度的DBSCAN算法来排除发动机中的离群对象和发现不规则簇,再采用Kmeans方法对第一层的聚类结果进行聚类,通过聚类效果比较确定与发动机振动相关的振动特征。最后与标准数据进行比较,划定振动数据范围,确定发动机振动等级。
基于多模型的移动电子商务推荐系统设计与实现
这是一篇关于数据挖掘,电子商务,推荐系统,关联分析,交叉销售的论文, 主要内容为随着Internet的普及和应用,电子商务因为其成本低廉、便捷、快速、不受时间和空间的限制等优点已在全球流行。电子商务在为用户提供更多选择的同时,其结构也日益更加复杂。一方面,用户面对大量的商品信息,很难快速找到自己真正需要的商品;另一方面,商家也无法与消费者面对面的交流。个性化的电子商务推荐系统能根据用户行为特征为用户提供一对一的服务,快速帮助用户找到所需的商品,从而顺利完成购物过程。商家通过推荐系统能提高电子商务系统销售能力,保持与客户的联系,提高用户忠诚度和满意度。 本文通过对当前B2C网站的电子商务个性化推荐系统分析,提出一种B2C模式下的多模型推荐系统(MMRS)的设计及实现,该系统通过对用户购物历史记录、Wap元数据以及用户注册信息处理,运用关联、聚类的方法,最后给出商品的推荐结果。这种对不同用户的多模型的推荐方案,即使新老用户由于信息的不同,都能够产生有效的推荐,并能够对新产品产生推荐。文中在推荐算法上做了一定改良,最后利用同组同学的Wap电子商务网站测试数据,对MMRS系统进行验证,发现改良后的算法能收到比较好的效果。
楚香黑猪黑色素瘤的致病基因鉴定及淘汰选育
这是一篇关于楚香黑猪,黑色素瘤,关联分析,液态芯片测序,转录组,通路分析的论文, 主要内容为随着市场经济欣欣向荣的发展,人民生活水平逐年提高,肉类市场特别是猪肉对于品质的要求也越来越高,各大养猪企业纷纷开始肉质性状育种以及利用地方猪种进行新品种培育。楚香黑猪作为华中农业大学与湖北金旭农业发展股份有限公司基于地方猪和瘦肉猪两类资源培育的黑猪新品种,有着高瘦肉率与肉质优良的特点。但毛色纯化过程中出现的黑色素瘤对楚香黑猪整体的外观一致性和市场口碑造成了影响,并给公司带来经济损失。黑色素瘤作为人类皮肤高发恶性肿瘤,缺乏特效治疗手段以及极差的预后,已逐渐成为人类发病率增长最快的肿瘤之一。因此,为了通过育种手段将黑色素瘤易感基因从楚香黑猪群体中淘汰,并将楚香黑猪作为研究黑色素瘤的模式动物,本研究对比了楚香黑猪黑色素瘤家系中141个样本,包括26个病例和115个对照,利用SNP芯片数据和多种测序数据,结合全基因组关联分析和选择信号,在多条染色体上鉴定到楚香黑猪中可能与黑色素瘤直接相关的易感基因,如 KCNMA1、NTRK2、GRHL3、RUNX3、PDE1C、TNC 和 NFKB1。转录组学分析得到了与黑色素瘤进展相关的调控基因CDH13、IVL和P4HA3,及主要与黑色素瘤相关的表达上调通路:MAPK、Wnt、RAS、IL-17、TNF、VEGF、P13K-Akt以及NF-KappaB通路。本研究的主要结果如下:(1)表型数据的卡方假设检验表明楚香黑猪群体的黑色素瘤性状可能是由2~3个基因控制的隐性遗传性状,并在楚香黑猪中表现为结节黑色素瘤(NM)和扩散黑色素瘤(SSM)。(2)收集141头黑色素瘤家系样品,通过液态芯片测序共得到743,601个全基因组分布SNP。芯片数据的GWAS分析中,通过FarmCPU模型关联到14号染色体KCNMA1第一内含子c.541-46827C>T与黑色素瘤性状显著相关,-log10p值为4.76E-33。(3)利用PCA的分群结果,通过群体分群间的选择信号分析与GWAS分析共同鉴定到KCNMA1,FST值为0.15,XP-EHH值为-2.27,10号染色体上NTRK2和18号染色体上PDE1C在黑色素瘤与正常群体中存在明显分化,FST值为0.18和0.20。选择信号与转录组差异表达分析共鉴定到GRHL3、RUNX3、PDE1C,全部为上调DEGs,并在基因内变异位点呈很强的连锁不平衡,R2为0.85~1.0。(4)基于正常皮肤与皮肤黑色素瘤的转录组分析得出的显著差异表达基因中,通路富集结果显示上调的基因显著富集在MAPK/ERK(LogP=-4.33)、WNT/β-catenin/MITF(LogP=-3.53)以及 Ras(LogP=-6.14)等相关调节通路,NTRK2富集到MAPK、Ras、P13K-Akt通路并显著下调表达(log2FC=-1.65),GRHL3在Wnt通路中富集并显著上调表达(log2FC=1.82)TNC在PI3K-Akt通路中显著富集并著上调表达(log2FC=1.83),CDH13、IVL分别富集在与细胞粘附、角质化进程相关通路(CDH13/log2FC=0.84,IVL/log2FC=2.57)。(5)基于3头黑色素瘤与3头正常小猪的全基因组重测序数据的变异注释,在常染色体共12,777,586个变异位点中共发现123,476个位点在3头黑色素瘤个体中出现隐性突变纯合,存在于2634个基因的编码区中,包括NTRK2和转录组中显著表达上调的IVL(log2FC=2.57)和P4HA3(log2FC=2.82)。
基于多维数据挖掘方法的发动机振动评级的应用研究
这是一篇关于发动机振动故障,预测,振动分析系统,关联分析,聚类的论文, 主要内容为航空发动机振动故障是航空发动机中故障的主要问题。然而,由于发动机本身结构复杂,发动机振动时会出现多种故障现象,如:不平衡、碰磨、不对中、跳动等。这为发动机故障预测和诊断带来了巨大挑战。目前,在航空发动机领域中,一般通过现有的故障经验采取建立故障模型的方法来预测和诊断振动故障,但往往由于故障特征维数较多,不能全面有效地排查出具体细节原因。大数据和数据挖掘技术近年来作为解决工业制造领域问题的新途径,己经在不少公司和企业中的试验中取得良好效果。航空发动机作为工业制造领域中的“皇冠",以其复杂的结构和近乎极致的精准度闻名。那么,如何采用大数据和数据挖掘的方法对复杂而精确的发动机结构梳理分析,如何使用现有的振动故障数据对发动机的故障进行预测和诊断,是目前急需解决的问题。针对以上问题,本文的主要研究工作如下:(1)设计并实现航空发动机振动分析系统。本文从系统的需求分析入手,详细的阐述了航空发动机的结构本体、故障本体、装配基准、装配分解、试车参数和振动分析六大模块的功能需求及性能、安全性、扩展性等非功能需求。研究并完成了系统的构架设计、详细设计与实现。整个系统基于J2EE构架体系,采用B/S架构模式,系统开发中使用EXTJS前端框架技术、SpringMVC框架和基于非结构化的MongoDB数据库,建立了一套以发动机故障数据为基础的数据管理及分析系统,提高了企业信息化水平并为航空发动机故障预测和诊断提供了辅助手段。(2)提出了一种基于关联分析和聚类的振动故障分析方法。对不平衡故障数据做离散化处理,使用MAFIA算法挖掘数据中的频繁项集,初步确定振动故障特征集。在此基础上进行双层聚类。采用基于密度的DBSCAN算法来排除发动机中的离群对象和发现不规则簇,再采用Kmeans方法对第一层的聚类结果进行聚类,通过聚类效果比较确定与发动机振动相关的振动特征。最后与标准数据进行比较,划定振动数据范围,确定发动机振动等级。
基于深度学习的炼化装置报警数据关联分析与预测研究
这是一篇关于报警管理系统,关联分析,词嵌入,深度学习,异常工况预警的论文, 主要内容为随着国内炼化企业生产装置和设备的复杂化和智能化,企业对于生产安全和生产效益的重视不断提高,在工业流程中设置的报警点越来越多,产生了大量的报警信息。其中有些报警属于无效报警,有些报警是报警系统设计的不合理、报警位点的缺陷导致的,这类报警进一步造成了报警数量的急剧增加。对报警管理来说,短时间内大量报警信息的涌入,会干扰操作员的判断,导致重要报警不能得到及时处理,容易造成事故。因此,有必要对报警信息开展关联分析,优化报警系统,同时充分利用报警日志进行报警预测以减少事故的发生。本论文主要开展了以下研究:(1)针对报警日志数据量大、属性多,人工分析报警关联性的方法耗时费力,且报警信息难以使用二值序列进行表征的问题,本文提出了一种基于词嵌入的炼化装置报警数据关联分析方法,加入负采样优化方法。将报警日志中的报警变量映射为向量,向量降维后用于聚类分析。在案例分析中,根据聚类分析进行报警关联分析,聚类结果与报警实际相关性基本一致。通过与其他方法对比,这种通过词嵌入获得的报警向量在词类比任务的准确率和相似度分别为83.33%、98.82%,相比于其他向量表征方法分别提高了5.55%和7.57%,这表明通过本文方法获得的报警向量的质量较好,可以最大程度保留报警间的语义和时间联系,聚类分析结果可靠,利用报警之间的关联性可以为报警管理系统的优化提出合理建议。(2)针对报警日志无法直接输入预测预警模型中进行识别,异常工况预测建模过程中参数选取和模型优化两方面缺乏可参考标准的问题,本文通过优化的CBOW模型解决了报警日志信息读取问题,构建了双向LSTM模型用于报警预测。在案例分析中,根据不同条件下模型的预测表现选取参数,获得最优模型。在最优模型中分别输入3个测试日志,预测准确率为79.32%、72.03%和77.84%,预测正确的报警与实际情况相比的平均提前时间为364秒、279秒、355秒。在对比分析中,与全连接RNN和单向LSTM方法对比,应用本文所提方法的效果最好,预测准确率最高,提高了8.51%;预警平均提前时间最长,能够为操作员提供更充分的处理时间。(3)针对以上研究中进行报警关联性分析得出的报警优化策略,结合模型预测效果,本文通过Qtpy的图形设计工具进行界面设计,以Python编程语言为开发工具,利用数据库技术,研发了基于报警日志的炼化装置异常工况预警模块,主要实现报警监控、相关报警查询、异常工况预测三大功能。优化后的报警监控界面设置分区显示,可以更清晰地发现关键报警。在相关报警查询界面,通过石化企业报警管理平台连接企业报警管理系统,对报警日志初步处理后存储在数据库中,利用词嵌入模型对报警向量化处理和相似度计算,实现报警间关系的查询。在异常工况预测界面,利用双向LSTM模型预测报警,并输出报警对应的异常工况,操作员可以更快速地预知可能出现的异常情况,更及时地采取行动消除隐患。
基于文本变量的新闻点击预测分析
这是一篇关于推荐系统,文本变量,FM模型,关联分析,标准互信息的论文, 主要内容为互联网的发展伴随着信息超载问题。为解决信息超载问题,很多领域开始打造属于自己的个性化推荐系统,以方便用户高效获取信息,优化平台的用户体验。如新闻资讯平台,往往会基于包括用户历史行为在内的用户属性和新闻属性建立推荐系统:在用户阅读新闻资讯的过程中,为用户推荐用户真正感兴趣的阅读内容,大大减少用户浪费在翻阅新闻上的时间和精力,以高效便捷的新闻阅读体验为新闻资讯平台带来更多忠实的用户群体。对于推荐系统,推荐点击率是评价其优劣的一个重要指标。本文主要考虑基于文本变量的新闻点击预测问题。针对某新闻资讯类App,首先定义三个用户历史阅读新闻标签变量,通过对这三个变量的关联分析,得到数据中包含的用户感兴趣的新闻类型以及用户的新闻阅读行为习惯。接着通过标准互信息的方法研究曝光新闻是否被点击阅读的影响因素,并基于标准互信息分析结果和关联分析结果提出两种刻画用户历史行为与当前推荐之间关系的变量,包括由用户历史阅读新闻标签变量与曝光新闻标签变量生成的组合变量和由关联规则生成的交互效果变量。最后使用因子分解机(Factorization Machine,FM)模型建立不同变量组合的曝光新闻点击预测模型,选取三个模型评价指标:Accuracy、Precision和AUC对模型进行评价,并通过最终模型分析影响用户点击阅读曝光新闻的主要因素。本文研究发现:(1)用户感兴趣的新闻类型主要包括娱乐、社会、情感、军事、体育、搞笑、国际、历史、宠物等,其中娱乐新闻是最受欢迎的新闻类型。(2)用户倾向于阅读不同类型的新闻内容,仅单独阅读某一类新闻的用户占极少数。(3)在众多曝光新闻类型中,政策类新闻点击率较低;数码类新闻点击率较高。(4)在众多因素中,用户阅读历史和当前曝光新闻类型对预测用户是否点击阅读曝光新闻的贡献最大。(5)结合用户的阅读历史和当前曝光新闻属性,可以提高预测用户是否点击阅读曝光新闻的精度,如用户在过去是否阅读过当前推荐的新闻类型、根据用户最近一次阅读历史得到的其阅读当前曝光新闻类型的可能性大小等。
支持动态脑网络与认知量表特征关联分析的脑认知规律研究系统
这是一篇关于认知神经科学实验范式,动态脑网络,复杂网络分析,认知量表,关联分析,脑认知规律研究系统的论文, 主要内容为认知能力指外界信息经过各脑区之间的传递、加工与协同交互来实现各种认知过程。近年来,以图论和复杂网络为基础的脑网络被广泛应用在不同认知能力对应的脑区之间组织结构和连接模式的研究中,且目前一些权威的认知测评量表常被用于人们认知能力的评估。因此,将脑网络与认知量表的研究结果进行关联分析,是研究人脑在不同认知任务中脑认知规律的重要手段。本文对动态脑网络构建及复杂网络分析、脑网络关联分析指标计算及其与量表特征的关联分析问题进行了研究。首先,利用小波相干和加权相位滞后指数分析方法计算并提取脑电信号的时频域相似性和相位同步性两个方面特征,并将其分别作为基于小波相干和加权相位滞后指数构建的脑网络的边的度量;之后基于复杂网络分析方法给出脑网络的全局效率、平均度、聚类系数、平均局部效率以及特征路径长度五个拓扑属性的计算方法。其次,基于脑网络的不同拓扑属性,计算各属性在一定合适阈值范围内的AUC值以得到各属性在阈值范围内的整体特性。最后,以脑网络各拓扑属性的AUC指标值与认知量表特征作为自变量和因变量,构建回归分析模型,根据模型的各统计量来验证该分析指标评估相应认知能力的有效性。最后,基于上述研究工作,本文设计并实现支持动态脑网络与认知量表特征关联分析的脑认知规律研究系统,并应用在疲劳驾驶研究中。首先,基于所有研究工作的matlab算法接口、SpringBoot框架、thymeleaf模板、JPA数据库接口、IntelliJ IDEA开发工具、Tomcat以及MySql数据库,开发了一个基于java语言的web系统,包含基础数据管理、动态脑网络构建及分析、量表测评管理及关联分析四大模块。其次,本文设计了疲劳驾驶认知实验和与疲劳有关的注意力认知量表作为系统各功能的实用化数据,在系统中基于疲劳驾驶脑电数据构建并分析不同疲劳阶段脑网络的动态变化过程,并将其与对应阶段注意力量表特征值进行回归分析模型的构建及分析,从而总结人脑在疲劳驾驶过程中的认知规律,并根据关联分析结果给出疲劳评估指标。本文主要工作的贡献在于设计并实现了支持动态脑网络与认知量表特征关联分析的脑认知规律研究系统,可作为不同认知实验针对的不同认知能力的多功能研究平台。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设货栈 ,原文地址:https://m.bishedaima.com/lunwen/46380.html