法院电子档案集中扫描系统的设计与实现
这是一篇关于电子档案,档案扫描,HttpClient,混合架构,FastDFS的论文, 主要内容为随着法院信息化建设的战略升级,法院业务的各类数据数字化、相关业务处理自动化及智能化将作为智慧法院建设的基本技术路线。法院在办案过程中会产生很多纸质文档,这些文档在案件审结归档时被称为档案,将与案件相关的档案扫描成为数字化的电子档案,该过程称为法院电子档案集中扫描业务。本文致力加快档案数字化建设,建立法院电子档案集中扫描系统,旨在统一档案扫描业务流程和推动档案扫描工作信息化管理。本文阐述了人民法院电子档案集中扫描业务的实际需求分析、用例分析以及具体的业务流程分析,设计和实现了结合C/S与B/S混合架构的法院电子档案集中扫描系统。本系统从设计上划分为档案影像采集子系统和档案扫描工作管理子系统:(1)档案影像采集子系统以C/S架构设计:客户端结合高拍仪来实现纸质档案的扫描保存,服务端通过Spring Boot构建对数据库的访问以及客户端查询接口的支持,使用Http Client实现客户端与服务端之间的数据交互。(2)档案扫描工作管理子系统以B/S架构设计:开发Java Web程序来支持档案扫描工作管理以及系统功能支持的业务,前端使用Thymeleaf和Bootstrap完成交互性的页面设计,搭建Fast DFS文件系统,对扫描上传的档案文件进行数据备份。本文详细阐述了实现细节,系统从功能模块上划分为案件信息检索、档案目录构建、影像采集处理、系统管理、监控预警和档案存储六个模块。案件信息检索、档案目录构建、影像采集处理三个模块实现了从检索定位案件到扫描档案目录的构建以及到数字化档案的采集保存的流程化操作;系统管理、监控预警和档案存储三个模块实现了档案扫描工作的业务管理和系统功能支持。该软件系统已经部署在天津市高级人民法院使用,运行情况良好。
自动驾驶场景库数据系统的设计与实现
这是一篇关于场景库,Spark,FastDFS,ElasticSearch,HBase,数据标注的论文, 主要内容为近年来,自动驾驶技术飞速发展,但自动驾驶系统目前仍存在较大不稳定性,需要通过海量的驾驶场景库数据来构建虚拟场景,以进行全面严格的测试评价。业内各公司机构受限于数据采集、维护成本较高,缺乏一个提供统一标准数据的自动驾驶数据平台。国汽智能网联汽车研究院为此牵头业内多家公司,设计并实现了自动驾驶场景库数据系统。该系统集成了对采集数据的预处理、存储、标注和统计分析等功能,为相关算法提供训练、测试数据集,为虚拟仿真环境提供测试用例数据。本文主要分析了自动驾驶场景库数据系统的业务需求,阐述了系统数据校验提交、数据标注和数据统计分析三个功能模块的设计和实现。系统基于B/S结构模式,采用前后端分离的开发方式,分层次设计实现。数据校验提交模块负责校验采集数据的格式,对校验通过并提交的采集数据进行预处理,清洗异常值和缺失值,最后将处理后的数据整合存储。该模块基于Spark计算平台执行数据预处理和整合的计算任务,针对不同数据的特性整合FastDFS、ElasticSearch和HBase组件实现数据分布式存储。数据标注模块负责对图像、点云等数据执行目标检测、语义分割等多种标注任务,执行过程采用先算法预标注,再人工修正的方式,以减少标注人力成本。该模块使用TensorFlow Java API读取训练的pb模型,采用策略模式实现为不同算法标注任务提供对应算法预标注的服务。数据统计分析模块负责数据图表分析和语句查询功能。图表分析功能实现时,实时数据部分通过ELK架构收集日志数据处理并展示,非实时数据部分采用HBase存储、ElasticSearch索引和Vue.js框架开发交互界面的方案。语句统计功能基于Spark SQL组件读取Hive中同步的HBase数据来实现。目前,本系统三个模块基本功能均已实现,提供了对自动驾驶数据的清洗、标注、分布式存储和统计分析功能,解决了海量自动驾驶数据处理和维护方面的难题,能够输出规范标准的数据以构建虚拟仿真用例。
基于分布式存储的云网盘系统的设计与实现
这是一篇关于云计算,分布式存储,FastDFS,区块链,收敛加密的论文, 主要内容为云存储使用户无需关心本地存储设备的容量,可以帮助用户随时随地访问自己的数据。传统的云存储系统都是以明文的形式存储文件,面临着数据安全的挑战,如数据泄露、数据篡改、数据丢失等问题,并且传统审计技术无法保证溯源数据可信度导致云存储平台难以追踪用户的非法行为。除了数据安全性外,云存储还需要考虑数据的可用性。云存储是中心化存储,存在单点故障问题,需要采用如数据备份、冗余存储、负载均衡等技术保证数据的高可用性和高可靠性,本文针对传统云存储中存在的这些不足,提出了基于分布式存储的云网盘系统的设计与实现,该系统旨在对云存储的性能进行优化,同时解决数据安全方面的问题。在该系统中:针对数据的隐私安全问题,设计了具有针对性的文件加密机制,结合对称加密和非对称加密,将文件加密上传至云端存储,避免用户的隐私泄露。针对云端存储资源浪费问题,设计了基于收敛加密技术的数据去冗余方案。该方案使得相同文件在云端中只会存储一份,减少了存储资源的浪费,同时解决了数据加密和数据去冗余的冲突。针对文件读取性能问题,结合缓存技术加快文件的读取效率。同时对LRU淘汰算法进行改进,设计了冷热链数据淘汰算法,提高缓存区中文件的命中率,避免缓存污染等问题。针对文件元数据和溯源数据易被非法篡改等问题,结合区块链技术,采用链上链下协同存储,设计了基于区块链的数据溯源方案,有效的保证了数据的可靠存储,可信溯源。最后对云网盘系统的功能和性能两方面进行了实验测试,证明了云网盘系统可为用户提供完备和安全的文件存储,保障了用户隐私安全,能够提供有效可信的数据溯源。改进后的淘汰算法可以提供更高的缓存效果,区块链的加入提高了数据的保护强度且对系统的性能不会造成太大的影响。
贵州民族特色文化数字资源云存储管理系统的研究与实现
这是一篇关于云存储技术,FastDFS,贵州民族特色文化,MyCAT的论文, 主要内容为随着人类社会进入大数据时代,新的业务环境和场景亟须建立高性价比的海量数据存储系统。贵州省文化机构在构建贵州公共文化云平台的过程中,面临文化相关的应用系统比较分散,未形成统一的平台,传统数据库系统无法满足视频、音频、图片与文档等非结构化数据的存储要求,存储设备多而分散,无法满足存储资源共享等问题。为了支撑贵州公共文化云平台的建设并解决这些问题,需要构建贵州民族特色文化数字资源云存储管理系统。本课题通过对文化数字资源的特点分析,利用相关技术,实现贵州民族特色文化数字资源的存储和管理服务以及为云平台提供相关的应用数据接口服务。本文主要的工作成果如下所示:(1)提出了一套针对贵州民族特色文化数字资源的存储方案,用于存储文化数字资源的非结构化数据和结构化数据,为用户提供文化数字资源存储服务以及为相关的应用系统提供数据接口服务。对于文化数字资源的非结构化数据,本文重点研究了FastDFS总体的数据存储方案与FastDFS+Redis+Keepalived+LVS+Nginx的数据存储方案的设计。对于文化数字资源的结构化数据,根据贵州民族特色文化数字资源特点分析设计出文化数字资源云存储数据服务体系,同时利用MyCAT中间件与MySQL数据库搭建数据库集群。(2)构建了一个小型的贵州民族特色文化数字资源云存储管理系统。本系统采用B/S模式,结合Bootstrap开源框架设计了用户界面。同时对用户访问时的负载均衡以及高可用进行了研究与实现,并设计了REST API接口。实现需求分析中提出的关键功能需求。利用FastDFS,Redis,Nginx与Keepalived+LVS多组技术搭建了FastDFS集群的高可用分布式文件云存储,以及利用RPC SOA框架Dubbo,建立服务的消费者与生产者以及Zookeeper服务的注册中心,把系统的应用服务进行拆分,利用Apache Shiro安全框架以及MyCAT数据库中间件和SSM(Spring+SpringMVC+Maven)框架等开发与实现贵州民族特色文化数字资源云存储管理系统。(3)搭建测试环境对系统进行了测试验证。在Linux平台安装部署了FastDFS分布式文件系统、LVS负载均衡,Web服务器Apache以及数据库集群MySQL Cluster等。在此基础上对系统中几大关键功能模块进行测试,接着进行性能测试,包括可靠性测试和负载均衡测试,通过系统的测试与结果的分析,验证了系统设计的可行性。
分布式微信公众平台爬虫系统的研究与应用
这是一篇关于微信公众平台,分布式爬虫,Scrapy,FastDFS的论文, 主要内容为近几年来,移动互联网的飞速发展对人们的生活方式产生了极大的影响。微信作为一个新兴的移动社交平台,已累计有超过6亿的注册用户。而微信公众平台依托于微信的海量用户也迅速流行起来,目前已有注册公众号账号超过800万,累计发布了超过2亿篇文章,对微信公众平台所发布的海量信息资源进行深入研究具有重大意义。本文基于Scrapy框架设计并实现了针对微信公众平台的分布式爬虫系统,实现对微信公众平台上公众号信息和文章信息的爬取,将爬取到的数据存储至单机My SQL数据库和Fast DFS分布式文件系统中。此后,概要说明了基于爬取到数据的一种应用场景,可为公众号用户提供快速建站的数据服务。首先,对开源网络爬虫框架Scrapy的整体架构、各个组件模块和内部运行机制进行深入研究。针对它目前仅支持单机爬取的不足,对其进行扩展,基于Redis数据库的有序集合重新实现了调度器模块,使其可以支持多爬虫节点的主从式分布式爬取。其次,基于改进后的Scrapy框架,通过分析微信公众平台的网页组成结构及特性,确定了爬虫程序的爬取流程及策略,进而定制开发了系统的爬虫模块;确定将爬取到的体积较小的字符串数据存入My SQL数据库、将体积较大的文件数据存入Fast DFS分布式文件系统的存储原则,进而定制开发了系统的流水线模块;通过设计一个“公众号最近爬取时间记录队列”,实现对公众号的增量式爬取。再次,基于以上的设计,完成具体程序代码的编写及测试,对系统进行部署运行。运行结果表明,系统中多个爬虫节点能够协作完成爬取任务,且各节点间基本实现负载均衡,本系统基本达到了预期的设计目标。此后,概要地说明基于爬取到数据的一种应用场景。通过设计服务端,为公众号用户快速搭建公众号网站提供数据服务。最后,对目前已完成的工作进行了总结,介绍了该系统的尚可改进之处,可作为后续进一步深入研究的着入点。
贵州民族特色文化数字资源云存储管理系统的研究与实现
这是一篇关于云存储技术,FastDFS,贵州民族特色文化,MyCAT的论文, 主要内容为随着人类社会进入大数据时代,新的业务环境和场景亟须建立高性价比的海量数据存储系统。贵州省文化机构在构建贵州公共文化云平台的过程中,面临文化相关的应用系统比较分散,未形成统一的平台,传统数据库系统无法满足视频、音频、图片与文档等非结构化数据的存储要求,存储设备多而分散,无法满足存储资源共享等问题。为了支撑贵州公共文化云平台的建设并解决这些问题,需要构建贵州民族特色文化数字资源云存储管理系统。本课题通过对文化数字资源的特点分析,利用相关技术,实现贵州民族特色文化数字资源的存储和管理服务以及为云平台提供相关的应用数据接口服务。本文主要的工作成果如下所示:(1)提出了一套针对贵州民族特色文化数字资源的存储方案,用于存储文化数字资源的非结构化数据和结构化数据,为用户提供文化数字资源存储服务以及为相关的应用系统提供数据接口服务。对于文化数字资源的非结构化数据,本文重点研究了FastDFS总体的数据存储方案与FastDFS+Redis+Keepalived+LVS+Nginx的数据存储方案的设计。对于文化数字资源的结构化数据,根据贵州民族特色文化数字资源特点分析设计出文化数字资源云存储数据服务体系,同时利用MyCAT中间件与MySQL数据库搭建数据库集群。(2)构建了一个小型的贵州民族特色文化数字资源云存储管理系统。本系统采用B/S模式,结合Bootstrap开源框架设计了用户界面。同时对用户访问时的负载均衡以及高可用进行了研究与实现,并设计了REST API接口。实现需求分析中提出的关键功能需求。利用FastDFS,Redis,Nginx与Keepalived+LVS多组技术搭建了FastDFS集群的高可用分布式文件云存储,以及利用RPC SOA框架Dubbo,建立服务的消费者与生产者以及Zookeeper服务的注册中心,把系统的应用服务进行拆分,利用Apache Shiro安全框架以及MyCAT数据库中间件和SSM(Spring+SpringMVC+Maven)框架等开发与实现贵州民族特色文化数字资源云存储管理系统。(3)搭建测试环境对系统进行了测试验证。在Linux平台安装部署了FastDFS分布式文件系统、LVS负载均衡,Web服务器Apache以及数据库集群MySQL Cluster等。在此基础上对系统中几大关键功能模块进行测试,接着进行性能测试,包括可靠性测试和负载均衡测试,通过系统的测试与结果的分析,验证了系统设计的可行性。
自动驾驶场景库数据系统的设计与实现
这是一篇关于场景库,Spark,FastDFS,ElasticSearch,HBase,数据标注的论文, 主要内容为近年来,自动驾驶技术飞速发展,但自动驾驶系统目前仍存在较大不稳定性,需要通过海量的驾驶场景库数据来构建虚拟场景,以进行全面严格的测试评价。业内各公司机构受限于数据采集、维护成本较高,缺乏一个提供统一标准数据的自动驾驶数据平台。国汽智能网联汽车研究院为此牵头业内多家公司,设计并实现了自动驾驶场景库数据系统。该系统集成了对采集数据的预处理、存储、标注和统计分析等功能,为相关算法提供训练、测试数据集,为虚拟仿真环境提供测试用例数据。本文主要分析了自动驾驶场景库数据系统的业务需求,阐述了系统数据校验提交、数据标注和数据统计分析三个功能模块的设计和实现。系统基于B/S结构模式,采用前后端分离的开发方式,分层次设计实现。数据校验提交模块负责校验采集数据的格式,对校验通过并提交的采集数据进行预处理,清洗异常值和缺失值,最后将处理后的数据整合存储。该模块基于Spark计算平台执行数据预处理和整合的计算任务,针对不同数据的特性整合FastDFS、ElasticSearch和HBase组件实现数据分布式存储。数据标注模块负责对图像、点云等数据执行目标检测、语义分割等多种标注任务,执行过程采用先算法预标注,再人工修正的方式,以减少标注人力成本。该模块使用TensorFlow Java API读取训练的pb模型,采用策略模式实现为不同算法标注任务提供对应算法预标注的服务。数据统计分析模块负责数据图表分析和语句查询功能。图表分析功能实现时,实时数据部分通过ELK架构收集日志数据处理并展示,非实时数据部分采用HBase存储、ElasticSearch索引和Vue.js框架开发交互界面的方案。语句统计功能基于Spark SQL组件读取Hive中同步的HBase数据来实现。目前,本系统三个模块基本功能均已实现,提供了对自动驾驶数据的清洗、标注、分布式存储和统计分析功能,解决了海量自动驾驶数据处理和维护方面的难题,能够输出规范标准的数据以构建虚拟仿真用例。
自动驾驶场景库数据系统的设计与实现
这是一篇关于场景库,Spark,FastDFS,ElasticSearch,HBase,数据标注的论文, 主要内容为近年来,自动驾驶技术飞速发展,但自动驾驶系统目前仍存在较大不稳定性,需要通过海量的驾驶场景库数据来构建虚拟场景,以进行全面严格的测试评价。业内各公司机构受限于数据采集、维护成本较高,缺乏一个提供统一标准数据的自动驾驶数据平台。国汽智能网联汽车研究院为此牵头业内多家公司,设计并实现了自动驾驶场景库数据系统。该系统集成了对采集数据的预处理、存储、标注和统计分析等功能,为相关算法提供训练、测试数据集,为虚拟仿真环境提供测试用例数据。本文主要分析了自动驾驶场景库数据系统的业务需求,阐述了系统数据校验提交、数据标注和数据统计分析三个功能模块的设计和实现。系统基于B/S结构模式,采用前后端分离的开发方式,分层次设计实现。数据校验提交模块负责校验采集数据的格式,对校验通过并提交的采集数据进行预处理,清洗异常值和缺失值,最后将处理后的数据整合存储。该模块基于Spark计算平台执行数据预处理和整合的计算任务,针对不同数据的特性整合FastDFS、ElasticSearch和HBase组件实现数据分布式存储。数据标注模块负责对图像、点云等数据执行目标检测、语义分割等多种标注任务,执行过程采用先算法预标注,再人工修正的方式,以减少标注人力成本。该模块使用TensorFlow Java API读取训练的pb模型,采用策略模式实现为不同算法标注任务提供对应算法预标注的服务。数据统计分析模块负责数据图表分析和语句查询功能。图表分析功能实现时,实时数据部分通过ELK架构收集日志数据处理并展示,非实时数据部分采用HBase存储、ElasticSearch索引和Vue.js框架开发交互界面的方案。语句统计功能基于Spark SQL组件读取Hive中同步的HBase数据来实现。目前,本系统三个模块基本功能均已实现,提供了对自动驾驶数据的清洗、标注、分布式存储和统计分析功能,解决了海量自动驾驶数据处理和维护方面的难题,能够输出规范标准的数据以构建虚拟仿真用例。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码工厂 ,原文地址:https://m.bishedaima.com/lunwen/48096.html