5个研究背景和意义示例,教你写计算机异构计算论文

今天分享的是关于异构计算的5篇计算机毕业论文范文, 如果你的论文涉及到异构计算等主题,本文能够帮助到你 异构框架下的高性能金融计算算法及平台实现 这是一篇关于高性能金融计算

今天分享的是关于异构计算的5篇计算机毕业论文范文, 如果你的论文涉及到异构计算等主题,本文能够帮助到你

异构框架下的高性能金融计算算法及平台实现

这是一篇关于高性能金融计算,期权定价模型,BSDE,异构计算,GPU的论文, 主要内容为高性能计算集群的“基础设施”作为国家科学研究的保障已经上升为国家战略。高性能计算被广泛使用,特别是在金融工程领域,并且是不可或缺的工具。目前用于提供高质量图形,视觉和远程金融研究用户的高性能金融计算平台已成为高性能计算研究的突破口。在金融市场,尤其是金融交易中,信息的任何时间和延迟都可能带来巨大的经济损失。因此,期权定价问题需要算法的高实时性能。反向随机微分方程(BSDE)近年来在金融计算中得到了广泛的研究,并应用于期权定价算法的问题。与Black-Scholes公式相比,当概率模型不确定时,BSDE计算更准确。BSDE-Theta数值格式主要通过组合PDE高阶数字格式和BSDE后向随机微分方程自身特征得到。Theta格式离散BSDE用于时间范围,条件数值方差由MonteCarlo计算。插值计算方法用于获得操作中随机无网格点的值。通过这种求解方法,结果非常准确。为此,本文提出了一种基于金融市场期权定价的高性能计算平台系统。该系统基于Python语言开发,采用B/S架构为用户提供服务,实现了BSDE高精度数值计算方法和平台的集成。设计用户友好的用户界面,提供方便的访问方法,并结合CPU和GPU异构计算框架方法,为平台用户提供跨节点计算需求,确保选项定价应用程序中更准确,更高效的计算资源。

基于异构嵌入式计算的深度学习平台研究

这是一篇关于深度学习,嵌入式计算平台,异构计算,Flask框架的论文, 主要内容为当前深度学习已经广泛应用于军事和民用等诸多领域,产生了巨大的价值。但是当前深度学习系统开发存在数据、算法及模型资源分散、开发环节多、操作流程复杂、准入门槛高等问题,应用上一般采取服务器云计算训练平台模型训练,边缘计算平台部署的思路,这就出现了软件与硬件之间的鸿沟。随着边缘计算的不断的发展,面向计算资源受限的异构嵌入式平台的深度学习模型部署越发的重要起来。为加快深度学习的研究及开发过程,急需打通“云训练-边部署”的技术壁垒,搭建“数据-算法-训练-测试-部署”于一体的具有自主知识产权、国产化的深度学习软件平台。为此,本文旨在开发一套基于异构嵌入式计算的深度学习平台,在平台中集成异构嵌入式系统所需要的全套工具链,实现从深度学习模型的训练到嵌入式硬件系统部署应用的一体化设计。针对基于异构嵌入式计算的深度学习平台中软硬件结合的实际需要,对系统进行了整体架构设计。本系统分为服务器端的深度学习软件平台、与软件平台交互集成的异构嵌入式系统整套工具链以及用于深度学习模型部署和测试的异构嵌入式硬件板卡三部分。深度学习软件平台基于Flask框架进行开发,采用浏览器/服务器架构,设计了数据管理、算法管理、任务管理、模型管理、用户管理和设备管理六大功能模块。根据系统的数据类型,设计了数据表结构,并使用关系型数据管理系统My SQL管理数据。在此基础上,系统集成了Jetson NX、Hi3519A、GAP8和ZCU102四种异构嵌入式板卡的工具链和环境配置项,因为四种工具链的运行环境无法兼容,所以使用Docker容器保证了所有应用程序环境之间相互隔离,各个工具链的所有子进程均在容器内运行,通过端口映射的方式获取训练参数。通过集成新的容器,系统可以增加对新的嵌入式系统的支持。针对基于异构嵌入式计算的深度学习平台的功能指标要求和性能指标要求,完成了系统的搭建。对于基础功能层,使用数据库脚本文件按照数据库表的设计要求构建了系统的数据库,使用Flask-Babel扩展实现了系统的中英文支持。对于六大功能模块,系统后端使用Flask框架,前端使用Jinja2模板引擎对HTML页面进行渲染。对于训练任务中的实时监视功能,使用了j Query类库中的AJAX引擎实现了前端页面中的局部动态更新。为了确保系统中数据信息的安全,使用了FlaskBcrypt加密工具对数据库中的密码进行加密。系统测试任务和训练任务的底层实现使用了MMDection框架。对于硬件工具链部分,编写了Docker File,对NNIE、Vitis AI、GAP8 SDK、ONNX等工具链集成,并挂载到了软件平台上。硬件工具链接收软件平台端传递过来的训练参数,依次自动完成模型训练、模型量化和剪枝、模型格式转换等步骤。最后将得到的模型分别部署到四种异构嵌入式板卡上,运行目标检测程序,得到正确的目标识别结果并满足帧率和准确率的要求。针对基于异构嵌入式计算的深度学习平台各项测试用例的要求,对系统进行综合测试并对结果进行分析。测试前首先采用脚本一键化部署系统,部署脚本针对不同的软硬件环境特别是显卡版本做了适配,降低了用户的安装难度,提高了系统的适应性和稳定性。首先通过丰富的测试用例对系统的六大功能模块进行测试,测试结果表明系统实现了所有的功能性要求。接着对集成的四个异构嵌入式工具链进行测试,测试用例涵盖软件端和硬件端两部分,测试结果表明系统打通了软硬件链路,满足技术要求。使用Seige等测试工具对系统进行并发性测试和响应时间测试,测试结果表明系统功能指标和性能指标满足要求。

异构框架下的高性能金融计算算法及平台实现

这是一篇关于高性能金融计算,期权定价模型,BSDE,异构计算,GPU的论文, 主要内容为高性能计算集群的“基础设施”作为国家科学研究的保障已经上升为国家战略。高性能计算被广泛使用,特别是在金融工程领域,并且是不可或缺的工具。目前用于提供高质量图形,视觉和远程金融研究用户的高性能金融计算平台已成为高性能计算研究的突破口。在金融市场,尤其是金融交易中,信息的任何时间和延迟都可能带来巨大的经济损失。因此,期权定价问题需要算法的高实时性能。反向随机微分方程(BSDE)近年来在金融计算中得到了广泛的研究,并应用于期权定价算法的问题。与Black-Scholes公式相比,当概率模型不确定时,BSDE计算更准确。BSDE-Theta数值格式主要通过组合PDE高阶数字格式和BSDE后向随机微分方程自身特征得到。Theta格式离散BSDE用于时间范围,条件数值方差由MonteCarlo计算。插值计算方法用于获得操作中随机无网格点的值。通过这种求解方法,结果非常准确。为此,本文提出了一种基于金融市场期权定价的高性能计算平台系统。该系统基于Python语言开发,采用B/S架构为用户提供服务,实现了BSDE高精度数值计算方法和平台的集成。设计用户友好的用户界面,提供方便的访问方法,并结合CPU和GPU异构计算框架方法,为平台用户提供跨节点计算需求,确保选项定价应用程序中更准确,更高效的计算资源。

基于FPGA的神经网络异构加速方案设计

这是一篇关于卷积神经网络,FPGA,异构计算,通用加速器,VGG16,YOLOv3-tiny的论文, 主要内容为随着人工智能技术日益成熟,卷积神经网络(Convolutional Neural Network)作为最热门的机器学习算法之一,其应用范围逐步扩大,涉及生活中的方方面面,例如视频监控领域、无人驾驶和医疗器械等。在实际应用中,需要通过硬件平台加速神经网络的计算过程,建立高实时性、低功耗的可操作系统。现场可编程逻辑门阵列FPGA(Field Programmable Gate Array)作为一种包含丰富资源的可更新器件,具有低功耗、高性能特点,被广泛应用于加速卷积神经网络的硬件系统中。而采用ARM(Advanced RISC Machine)+FPGA的异构计算方式,不仅能够充分发挥FPGA并行计算的高性能和低功耗特性,还可以在较短的周期内完成硬件电路开发。由于目前FPGA异构计算方式大多应用于专用神经网络加速,关于通用神经网络的研究还比较匮乏。本文提出了一种采用ARM+FPGA异构的设计方法,通过PYNQ(Python Productivity for Zynq)平台设计出了一种能实现分类和目标检测任务的通用加速器。本文从通用加速器硬件电路设计的角度出发,着重分析了深层VGG16分类网络算法和YOLOv3-tiny目标检测网络算法的结构,剖析了卷积层、池化层和全连接层等通用性网络结构的计算过程,并深入研究了YOLO网络专用的路由(Route)层、上采样层和解码过程。最后实现了能完成分类和目标检测任务的通用神经网络加速器。本文的主要内容有:(1)分析了异构计算实现加速器的过程,采用了AXI(Advanced Extensible Interface)总线实现了PS(Process System)端和PL(Programmable Logic)端的数据搬运。并提出了一种通过硬件电路接口实现ARM与存储器交互的方法,使ARM端可以直接处理外部存储器中的数据,以提高硬件加速器的通用性。通过PYNQ平台,采用以太网通信的手段实现PC(Personal Computer)机与FPGA加速器的通信,完成整个通用卷积神经网络的加速应用系统的搭建。(2)对数据进行预处理以实现DSP(Digital Signal Process)单元的复用。通过数据排序以适应硬件FPGA乘加器的矩阵运算,进行BN融合以加速推理,并提出一种改进的对称量化方式将VGG16和YOLOv3-tiny的32位浮点型参数量化为16bit定点数,并在量化过程中针对YOLOv3-tiny的Route层采取校准方法,方便FPGA的部署。(3)采用一种引入校准坐标的方式实现卷积运算和池化运算的并行加速,完成通用的卷积模块和池化模块硬件电路搭建。采取宽维度和输出通道维度联合切片的方式,提高了FPGA片上缓存的利用率,减少了系统访存次数。基于维度变换的方式对并行矩阵运算进行改进,以适应切片方式并提高DSP复用的效率。针对VGG16网络和YOLOv3-tiny网络的差异,添加辅助运算完成上采样层和Route层的设计,完成能部署实现不同任务的通用卷积神经网络加速系统。基于ZCU-102平台进过测试,在频率150MHz的情况下,VGG16网络的加速性能为180.40GOPS,YOLOv3-tiny的加速性能为119.10GOPS,卷积层的加速性能峰值高达305.5GOPS,整个FPGA加速器的功耗为5.845w。与国内外相关领域加速器进行比较后,该设计性能优异。与CPU相比对神经网络的推理过程加速显著,与GPU相比能耗较低。结果表明本设计通过异构计算方法,在保证计算性能和低功耗的情况下,能够有效地实现分类和目标检测任务,突出了本设计的优越性。

基于异构嵌入式计算的深度学习平台研究

这是一篇关于深度学习,嵌入式计算平台,异构计算,Flask框架的论文, 主要内容为当前深度学习已经广泛应用于军事和民用等诸多领域,产生了巨大的价值。但是当前深度学习系统开发存在数据、算法及模型资源分散、开发环节多、操作流程复杂、准入门槛高等问题,应用上一般采取服务器云计算训练平台模型训练,边缘计算平台部署的思路,这就出现了软件与硬件之间的鸿沟。随着边缘计算的不断的发展,面向计算资源受限的异构嵌入式平台的深度学习模型部署越发的重要起来。为加快深度学习的研究及开发过程,急需打通“云训练-边部署”的技术壁垒,搭建“数据-算法-训练-测试-部署”于一体的具有自主知识产权、国产化的深度学习软件平台。为此,本文旨在开发一套基于异构嵌入式计算的深度学习平台,在平台中集成异构嵌入式系统所需要的全套工具链,实现从深度学习模型的训练到嵌入式硬件系统部署应用的一体化设计。针对基于异构嵌入式计算的深度学习平台中软硬件结合的实际需要,对系统进行了整体架构设计。本系统分为服务器端的深度学习软件平台、与软件平台交互集成的异构嵌入式系统整套工具链以及用于深度学习模型部署和测试的异构嵌入式硬件板卡三部分。深度学习软件平台基于Flask框架进行开发,采用浏览器/服务器架构,设计了数据管理、算法管理、任务管理、模型管理、用户管理和设备管理六大功能模块。根据系统的数据类型,设计了数据表结构,并使用关系型数据管理系统My SQL管理数据。在此基础上,系统集成了Jetson NX、Hi3519A、GAP8和ZCU102四种异构嵌入式板卡的工具链和环境配置项,因为四种工具链的运行环境无法兼容,所以使用Docker容器保证了所有应用程序环境之间相互隔离,各个工具链的所有子进程均在容器内运行,通过端口映射的方式获取训练参数。通过集成新的容器,系统可以增加对新的嵌入式系统的支持。针对基于异构嵌入式计算的深度学习平台的功能指标要求和性能指标要求,完成了系统的搭建。对于基础功能层,使用数据库脚本文件按照数据库表的设计要求构建了系统的数据库,使用Flask-Babel扩展实现了系统的中英文支持。对于六大功能模块,系统后端使用Flask框架,前端使用Jinja2模板引擎对HTML页面进行渲染。对于训练任务中的实时监视功能,使用了j Query类库中的AJAX引擎实现了前端页面中的局部动态更新。为了确保系统中数据信息的安全,使用了FlaskBcrypt加密工具对数据库中的密码进行加密。系统测试任务和训练任务的底层实现使用了MMDection框架。对于硬件工具链部分,编写了Docker File,对NNIE、Vitis AI、GAP8 SDK、ONNX等工具链集成,并挂载到了软件平台上。硬件工具链接收软件平台端传递过来的训练参数,依次自动完成模型训练、模型量化和剪枝、模型格式转换等步骤。最后将得到的模型分别部署到四种异构嵌入式板卡上,运行目标检测程序,得到正确的目标识别结果并满足帧率和准确率的要求。针对基于异构嵌入式计算的深度学习平台各项测试用例的要求,对系统进行综合测试并对结果进行分析。测试前首先采用脚本一键化部署系统,部署脚本针对不同的软硬件环境特别是显卡版本做了适配,降低了用户的安装难度,提高了系统的适应性和稳定性。首先通过丰富的测试用例对系统的六大功能模块进行测试,测试结果表明系统实现了所有的功能性要求。接着对集成的四个异构嵌入式工具链进行测试,测试用例涵盖软件端和硬件端两部分,测试结果表明系统打通了软硬件链路,满足技术要求。使用Seige等测试工具对系统进行并发性测试和响应时间测试,测试结果表明系统功能指标和性能指标满足要求。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码项目助手 ,原文地址:https://m.bishedaima.com/lunwen/55269.html

相关推荐

发表回复

登录后才能评论