基于机器学习和知识图谱的企业经营分析预测研究
这是一篇关于企业经营预测,ARIMA-LSTM,联邦学习,表示学习,行业匹配的论文, 主要内容为企业发展是社会经济发展的重要组成部分,政府每年要监控企业发展情况,适时调整培育企业名单,如何高效选择并发展龙头企业是一个艰巨的任务。统筹各类数据资源,建设企业经营分析预测系统,为地方政府提供企业发展相关的服务,不仅有利于优化配置服务资源,更加有利于加快工业化和信息化融合,发挥新兴企业的优势,对地区建设水平以及满足企业发展过程中对信息服务的多样化需求具有重要的意义。然而,目前对企业经营发展预测的研究主要集中在利用单一数据对企业发展进行预测,或者研究利用的因素是时间、天气等因素,没有考虑现实中的突发情况,只能预测规律条件下的企业发展情况,对于不规律因素造成的影响无法作出快速反应,影响预测的准确性。另外,考虑多种因素对企业经营情况造成的影响,会面临在数据收集时遇到的数据隐私问题,预测完成后如何运用到实际中,利用对多个企业的数据对行业发展进行更加有效的评估等问题,在实际对企业经营进行预测时仍面临许多挑战。针对上述问题,本文利用机器学习和知识图谱进行企业经营分析预测,能够在保证预测结果准确率的基础上解决数据隐私安全的问题,并且将企业按照行业分类进行比较,为决策提供更好的数据支持。本文所作出的主要工作如下:(1)准备企业经营分析预测所需的数据。按照系统需求分析了预测所需的数据特征维度,并依据数据特点提出了基于知识图谱的非量化数据知识表示方法,对所需数据进行了量化处理,完成了企业经营预测模型所需要的数据准备。(2)设计了基于机器学习和联邦学习的企业经营预测算法,在不汇总数据的前提下依照收集到的数据特点进行模型训练,既完成了较为准确的企业经营预测,又保护了数据隐私不受侵犯。(3)提出了基于行业约束的企业所属行业匹配方法,在不需要额外进行数据标注的情况下实现了企业与行业之间的准确的匹配,并有不低的精准度。使得企业间信息可以按照行业进行展示对比,解决了不同行业下企业无法比较的问题。(4)设计并实现了面向政府的企业经营分析预测系统。该系统包含了用户管理模块、数据管理模块、企业经营分析模块和企业经营预测模块四大模块,为政府人员了解企业发展提供了多维度的数据参考。
横向联邦学习中的安全聚合协议研究与应用
这是一篇关于联邦学习,安全聚合,推荐系统,安卓的论文, 主要内容为在数字经济时代,数据是至关重要的生产要素,通过跨地域和跨行业的数据流通融合释放价值。然而,各类隐私保护法规的提出使得这些数据大多以“数据孤岛”的形式存在于各企业和机构中,不再适用于传统的集中式数据存储和分析。为此,谷歌率先提出一种名为联邦学习的新方法,它适用于两个或两个以上数据方之间合作构建机器学习模型,将模型带到数据端,使得各方数据能在不离开本地的情况下完成模型的优化。尽管如此,联邦学习中也存在很多问题,例如在训练过程中,用户生成的梯度也可能被攻击者反推出部分个人隐私信息,带来隐私泄露的风险。针对这个问题,本文围绕横向联邦学习中的聚合协议,从三个方面展开工作:(1)在理论研究方面,提出一个多方参与的横向联邦学习安全聚合协议,实现数据安全聚合、离线检测和恢复、结果可验证和奖惩机制四个主要功能。基于此协议搭建横向联邦学习框架,并对其正确性和安全性进行了分析。(2)在场景应用方面,结合推荐系统中的矩阵分解算法和横向联邦学习框架,设计并实现了联邦推荐系统方案,然后通过模拟实验从不同角度评估了本方案的性能和可行性。(3)在工程落地方面,设计并实现了面向安卓端的横向联邦学习平台,将Tensor Flow.js移植到安卓平台实现机器学习模型的定义和训练,并通过安卓设备和服务器的交互实现整个横向联邦学习的训练流程,最后测试了本平台的各项功能,并对测试结果进行了详细的分析。
基于联邦个性化的联邦推荐系统
这是一篇关于推荐系统,联邦学习,个性化联邦学习,冷启动的论文, 主要内容为推荐系统的出现解决了在互联网时代,纷繁复杂的信息让用户越来越难以抉择的问题。然而在推荐系统的训练过程中,出现了一个新的矛盾:单个数据拥有方的数据量往往不足以支撑推荐系统模型的训练,多个数据拥有方又囿于用户隐私保护的限制,不能直接进行数据共享。联邦推荐系统的出现解决了这个问题,但是也产生了新的麻烦:1.当有新的参与方试图搭建推荐系统时,由于缺少历史数据的支撑,推荐系统的推荐效果不佳,即“冷启动”问题;2.参与联邦推荐系统训练的各方拥有的数据往往并不服从独立同分布,这会导致训练出来的推荐系统的推荐效果达不到预期。本文通过对以上问题出现的原因进行分析,设计了一种基于联邦个性化的联邦推荐系统。本文首先提出了一种防止灾难性遗忘的联邦个性化方法。方法中引入了终生学习中的可塑权重巩固方法,在联邦学习的客户端进行本地模型训练时,通过可塑权重巩固对模型参数进行正则化,同时采用滑动平均来平衡客户端模型从公共模型与客户端上一轮次所学习到的知识。同时在公共模型与客户端模型之间,以及上一轮次的客户端模型与当前轮次的客户端模型之间进行知识传递,防止了灾难性遗忘的发生,在保证了公共模型的预测准确率的同时提高客户端模型的预测准确率。实验表明,该方法在四个场景中将客户端模型的平均预测准确率分别提升了4.3%、22.2%、5.7%与25.8%。然后,基于这个联邦个性化方法,本文设计了一个基于个性化联邦学习的推荐系统。系统从下而上被分为数据层、特征层、联邦层与应用层,分别负责推荐系统的数据处理、特征融合、联邦学习组织与实际应用。最后,本文在上述推荐系统的基础上,提出了一种在训练过程中节约系统通信资源的改进方法。通过在不同推荐系统模型与数据集组成的场景上的对比实验说明:1.基于本文提出的个性化联邦学习方法所设计的推荐系统在推荐准确率上提高了4.2%;2.本文设计的推荐系统在一定程度上解决了新参与方的推荐系统“冷启动”问题;3.节约通信等资源的改进方法不仅节约了一定的系统通信资源,也在一定程度上提高了推荐系统公共模型的推荐准确率。
基于KubeEdge与PLCnext的工业流式数据采集与分析平台设计与实现
这是一篇关于数据采集,流式数据,云边端协同,边缘计算,联邦学习的论文, 主要内容为工业现场数据采集是工业控制与监控的核心,随着制造业企业迈向数字化智能化发展的新高度,工业互联网的应用催生了对于大数据分析的需求。传统的工业数据采集装置预装自己的独有硬件、软件,使用自定义网络通信协议,数据系统相对闭塞,且无法完成对海量数据高可靠的安全管理与存储处理。一个可以满足工业新业态的通用、易扩展的数据平台对于实现工业数字化改造具有重要意义。本文从制造业行业的实际背景出发,以解决数字化改进过程中面临的问题为目标,分析了当前工业领域在现场设备数据采集平台的建设需求,融合先进的IT技术设计了工业流式数据采集与分析平台。本文通过开发终端设备数据采集中间件与构建云边协同的数据平台,实现了工业现场设备数据从PLCnext设备端采集上传,在Kube Edge云边数据平台实现数据清洗、存储分析、模型训练与可视化展示等功能。主要取得如下成果:(1)开发数据采集中间件实现终端设备数据采集,主要包括设备注册模块、数据路由模块、消息发布模块三部分,实现对PLC管理设备的指定配置信息、数据值进行采集,并使用基于MQTT协议设计的消息发布模块将数据同步至云边平台。(2)基于边缘计算开源框架Kube Edge搭建云边协同的数据平台,实现对采集于设备端的海量流式数据进行规则引擎数据清洗、边缘时序数据库存储、算法训练部署与可视化监控展示等功能。(3)提出一种适用于工业云边框架数据平台的联邦学习算法应用模式,以减少边缘侧计算轮次,提高模型生成效率。最后,本文搭建了以云边协同的网络环境平台和模拟工业场景的直流伺服电机驱动测试平台两部分为主的实验环境,模拟了工业现场的数据采集场景,验证并测试了数据采集与分析平台的设计功能与使用性能。
基于参数量化的联邦学习模型共享方案研究
这是一篇关于联邦学习,通信效率,模型量化的论文, 主要内容为联邦学习中模型的共享方案研究是隐私保护的机器学习领域的重点研究内容,近年来随着社会对数据安全的重视和对隐私的保护意识的不断加强,联邦学习中对模型训练结果的共享方案的设计层出不穷,并应用在移动应用的个性化推荐系统、金融理财业务评估系统、医药关键信息互通和电子医疗信息分析等多领域。与传统的在数据中心或服务器进行的深度学习不同,联邦学习场景下的深度学习网络的主要运算设备是较大规模和物理范围内的移动设备群。面对通信时延、网络波动以及算力不均等诸多难点,对提高模型共享、聚合所需要的传输效率的研究具有较为实际的应用价值。本文论述了联邦学习场景下的深度学习技术的研究背景与意义,对此类深度学习技术的研究现状进行了描述和分析,重点对联邦学习中中心节点与边缘计算节点之间的模型共享和聚合方案进行研究,分别设计了基于分组周期更新的模型共享方案和基于模型量化的高效模型共享方案,并设计了优化模型共享方案的联邦学习仿真实现,对两种提高模型共享和传输效率的方法进行验证。本文主要做了以下工作:1.本文从模型训练的整体网络架构的角度出发,研究了已有的基于周期更新的模型共享方案,并对这种周期更新方案现有问题进行分析,改进了基于周期的本地轮转的模型更新方案,提高了全局模型在组间的收敛速度,在规定本地训练5轮和小组聚合2次的情况中将模型共享部分所需的通信回合数降至原有的10%。2.本文还从传输模型更新的数据形式的角度出发,研究了已有的基于参数量化的高效模型共享方案的原理,结合了现有的基于压缩量化和阈值量化的方法,设计了基于权重的稀疏化量化的模型共享方案,并在联邦学习场景中验证,改进的模型共享方法在对模型更新数据处理后,可以将通信成本降至原有的12%,在较大规模的联邦学习场景中,减轻节点间的通信成本和负担。3.本文结合联邦学习场景下的深度学习研究,设计了基于Py Torch平台的联邦学习平台,该平台支持联邦学习实践中所需的卷积网络训练模块、数据模拟模块、可选择共享方案的模型共享模块和模型验证模块。通过以上模块实现并验证了本文提出的模型共享方案在更新模型数据阶段的可行性和效率。通过实验,证明本文提出的联邦学习场景下高效的模型共享方案在模型更新阶段有较好的通信效率提升,能够提高模型的收敛速度,防止模型因隐私保护的本地训练而产生的过拟合情况,并保证模型在验证阶段的精度损失。本文提出的方案对联邦学习未来的落地应用有较强的研究意义和应用价值。
基于联邦学习的个体/群体风险评估模型构建及安全关键技术
这是一篇关于风险评估,联邦学习,图卷积神经网络,图聚类,迁移学习,知识蒸馏的论文, 主要内容为随着世界经济全球化以及互联网金融的快速发展,信用风险管理在确保金融机构的稳定运行中扮演着越来越重要的角色。金融业务规模和种类的不断发展,以及参与企业和用户数量的不断提高,导致风险管理在精度和可靠性方面的要求急剧增加。然而,与智能化风险评估需求形成鲜明对比的是,传统用户风险评估方法无法有效应对海量多源异构数据带来的复杂性,存在用户隐私保护机制不够健全,风险判别条件单一,数据流动受限,风险预判困难等诸多问题,开展基于机器学习和大数据的风险评估已经成为领域共识。联邦学习作为一种分布式联合训练架构,可在保护数据隐私的条件下进行多方联合数据分析,并建立性能强大的模型。传统联邦学习架构往往针对结构化数据,然而,各机构往往使用非结构化的知识图谱存储用户个体数据和用户/企业间的关联数据。此类数据结构无法在传统联邦架构中进行有效分析,因此,本文利用图卷积神经网络进行图谱数据深度挖掘,克服了传统联邦学习架构的局限性。本文基于联邦学习框架和图神经网络设计了一套用户风险评估系统,旨在满足用户隐私安全的条件下,实现多维度、高精度的用户风险评估方案。本方案首先利用图神经网络和决策树算法实现隐私保护的个体风险评估模型;其次,基于联邦学习框架和图聚类技术,利用空间、时间特征提取方法深度挖掘用户潜在关联关系,进而构建风险群体评估模型,提前发现潜在风险群体。最后,本文在公开数据集上应用隐私保护的联邦学习框架搭建了个体和群体风险评估模型,并验证了模型性能和计算开销等多个参数,综合验证了本方案的准确性和有效性。为进一步解决模型在实际部署过程中的数据和部署环境多样化问题,本文设计并实现了一套云环境下的模型迁移系统并进行了仿真实验验证,解决了部署地区数据及资源多样化造成的模型精度下降问题。
边缘计算环境下设备与设备间数据协同计算应用与研究
这是一篇关于推荐系统,联邦学习,强化学习,边缘计算的论文, 主要内容为随着边缘用户设备端智能化程度的增强,越来越多的时延敏感型服务向边缘端迁移,用户产生的数据在边缘端被处理能有效降低时延并增强数据安全性。大数据时代,隐私数据的法律保护方面日趋完善,在保护隐私数据的前提下有效挖掘数据价值并应用具有重要意义。本研究将联邦深度强化学习与推荐系统相结合,提出在用户设备端边缘计算环境中应用基于联邦深度强化学习的个性化推荐算法,算法能够在与用户的交互过程中不断改进其推荐智能体。本研究主要工作包括:1)研究当前信息流式推荐系统与用户之间的交互模式,对比强化学习中的智能体与环境之间交互模式,利用马尔科夫决策过程对推荐系统与用户之间交互过程进行建模,将交互式推荐系统环境与用户端边缘计算环境有机结合。2)根据边缘端推荐环境的特性与建立的马尔科夫模型,结合强化学习设计基于反馈的边缘端个性化推荐算法,强化学习智能体根据用户交互数据向用户推荐物品。3)引入联邦学习对强化学习模型进行训练加速与隐私保护,通过边缘缓存降低时延,通过具有模型聚合功能的边缘计算节点缓解云端聚合压力。实验结果表明边缘端联邦强化学习推荐算法的有效性,为后续研究提供了方向。图17幅,表6个,参考文献73篇。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设工坊 ,原文地址:https://m.bishedaima.com/lunwen/45974.html