分享6篇关于表格识别的计算机专业论文

今天分享的是关于表格识别的6篇计算机毕业论文范文, 如果你的论文涉及到表格识别等主题,本文能够帮助到你 基于深度学习的电商服装贴牌识别研究 这是一篇关于贴牌服装,目标检测

今天分享的是关于表格识别的6篇计算机毕业论文范文, 如果你的论文涉及到表格识别等主题,本文能够帮助到你

基于深度学习的电商服装贴牌识别研究

这是一篇关于贴牌服装,目标检测,表格识别,贴牌识别的论文, 主要内容为近年来,电子商务发展迅猛,已被视为经济高质量发展的重要影响因素。2021年,全国电子商务交易规模达到42万亿元,2013—2021年年均增长20.3%。而随着人们生活水平的不断提高,服装已呈现出快消品化,服装电子商务在电商之中占据重要地位。快速的产品更迭和大量相似服装的出现让消费者产生决策焦虑,而服装加工行业存在的贴牌、代加工等模式是产生大量相似服装的主要因素。因此,如何识别出贴牌服装是解决同款服装推荐的关键。本文通过深度学习技术,根据贴牌服装特性对其进行识别研究。本文所做工作如下:首先,本文通过对服装加工生产到上架销售这一流程进行调研,总结得出贴牌服装的特性,即其服装本体高度相似,服装面料成分高度相似以及服装尺码表高度相似这三大特征。基于此,在对京东、淘宝等大型电商平台的商品展示页面共性进行分析,并对其反爬措施进行处理,通过Selenium+Requsets框架编写爬虫程序,对服装商品信息进行采集,包括服装展示图片、服装相关属性信息以及服装详情页信息。接着,对爬取到的服装数据进行梳理,依据贴牌服装特性将服装贴牌识别模型分为三大块相似度计算。通过对服装商品主图的相似度来度量服装本体相似度,采用vgg16模型进行商品主图特征的提取,并使用余弦距离来度量图片特征向量的相似度。通过训练尺码表格的目标检测模型将尺码表格从商品详情页中截取出来,借助表格识别技术将尺码表格从图片形式转换为文本存储在Excel表格当中。然后通过归一化处理将尺码表格统一格式,使用尺码表格对应属性差值的求和平均来度量尺码表格的相似度。对于服装面料信息,通过规则匹配计算将面料一致的相似度赋值为0,反之赋值为1。结合三者相似度给出贴牌服装识别模型。最后,依托贴牌识别模型构建服装贴牌识别系统。该系统在保持传统电商平台的功能外,还具备贴牌服装的识别功能,提高了用户体验。

面向冶金设备运维履历的知识图谱构建与语义相似性度量研究

这是一篇关于运维履历文档,表格识别,知识图谱构建,联合抽取,图神经网络的论文, 主要内容为冶金设备长期处于高负荷状态,工况十分恶劣,极易造成设备故障。而设备故障多以故障调查单及运维履历文档的形式由工人记录,存在内容描述不规范、记录信息质量参差不齐、图片文档不可编辑等特征,缺乏有效挖掘设备故障运维信息的方法,进而难以重用运维履历知识。影响跨企业设备维修策略制定时对运维履历知识的参考,阻碍维修进程和效率。本文以某冶金企业的行车运维履历文档及故障调查单为研究对象,提出一种改进的Mask R-CNN的方法,同时结合Unet表格框线分割及OCR技术,用以结构化识别履历中表格文本、提出一种实体关系联合抽取方法构建运维知识图谱以及研究运维履历表格文档的语义相似性度量方法。研究工作如下:(1)针对冶金设备运维履历表格文档的图片格式导致表格文本字符不可编辑的问题,提出改进Mask R-CNN网络检测表格区域,结合Unet分割表格单元格,同时依据表格特点制定的组合规则及OCR技术结构化识别出表格文本,为后续的实体关系抽取奠定基础。(2)针对运维履历文本语义描述规范差、文本质量不一及冗余信息繁多等问题导致有效提取运维信息困难,提出一种基于序列标注的联合抽取网络。该网络由BERT、Bi LSTM、Attention、CRF模块组成,可直接获取三元组数据,构建运维知识图谱,实现运维知识结构化关联及语义网络可视化。(3)针对重用运维履历文档相似性精度低的问题,提出一种面向运维履历文档的语义相似性度量方法。基于企业已有的先验信息,构建设备树定位目标设备类或实例集合的知识图谱子图,并重构成图网络模型。基于Graph SAGE图神经网络聚合故障现象子图的节点信息,提取其语义特征向量,与故障调查单的语义特征向量进行余弦相似性度量,排序推送出最相似的履历实例,以可视化知识图谱形式呈现,辅助维修策略制定。案例验证以某炼钢企业积累的大量行车运维履历文档与故障调查单为数据源,对其进行了文档解析、知识抽取并构建了运维知识图谱及重建图网络模型,接着提取不同图网络的语义特征向量以度量相似性,推送出最相似性的履历文档用以知识重用。同时研发了一种履历文档的检索系统,以云存储的共享性为跨企业提供文档解析、知识抽取及相似性检索的应用,实现了流程化运维履历文档相似性检索及跨企业间运维知识共享,对提升冶金企业设备维修效率及降低运维成本具有一定实际应用价值。

救护队应急救援管理系统的后端设计与实现

这是一篇关于应急管理,救援队,管理系统,JFinal,表格识别的论文, 主要内容为近年来,我国矿山安全生产状况持续好转,但重特大事故仍有发生,安全形势依旧严峻。伴随2018年国家应急管理部的设立,我国的应急救援体系日益完善,矿山救护队作为其中的重要组成部分,在矿山事故应急救援中发挥着重要作用。为了进一步促进救护队的智能信息化建设,解决其因分散驻矿导致的日常监管困难,建成可以服务于各区域救护队伍的统一平台,实现远程监管、信息共享、统一指挥、协调应急,设计开发一种救护队应急救援管理系统,采用B/S架构,前后端分离开发。本文结合微服务架构技术、互联网云技术、后端框架技术等,设计和实现了系统的后端,完成了数据库建设和业务逻辑实现。救护队应急救援管理系统后端部署于云服务器,采用JFinal框架,结合封装的EhCache缓存提升系统性能,整合Swagger实现RESTful接口文档的在线生成和可视化,规范前后端之间的数据交互格式,使用MySQL进行数据的存储与管理,通过MySQLProxySQL中间件实现数据库集群以提高性能。系统后端结合微服务思想,设计实现个人模块、基础配置模块、系统管理模块、救援队伍模块、装备物资模块、培训训练管理模块、应急值班管理模块、救援方案模块、计划管理模块、资料管理模块和办公自动化模块,采用扩展的RBAC权限管理模型进行权限配置,针对训练管理子模块大量表格形式的纸质记录管理需要,采用OpenCV图像处理结合表格识别OCR,实现了训练记录表格的自动识别,此外,重点实现的功能点还包含基于语义相似度的事故救援方案自动生成、装备物资管理及出入库、公文与水印管理等。对于开发完成的系统后端,通过Swagger和JMeter进行接口功能与性能测试。测试结果表明,系统业务逻辑实现正常,根据神南救护队人员规模,并发量为300时系统平均响应时间在100毫秒左右,1秒启动循环200、500次等测试条件下请求失败率为0。系统综合实现矿山救护队在事故发生前的训练和监管、事故发生时的接警和处置方案、事故发生后的总结和分析,达到设计和使用要求,已在神南救护队投入应用。

救护队应急救援管理系统的后端设计与实现

这是一篇关于应急管理,救援队,管理系统,JFinal,表格识别的论文, 主要内容为近年来,我国矿山安全生产状况持续好转,但重特大事故仍有发生,安全形势依旧严峻。伴随2018年国家应急管理部的设立,我国的应急救援体系日益完善,矿山救护队作为其中的重要组成部分,在矿山事故应急救援中发挥着重要作用。为了进一步促进救护队的智能信息化建设,解决其因分散驻矿导致的日常监管困难,建成可以服务于各区域救护队伍的统一平台,实现远程监管、信息共享、统一指挥、协调应急,设计开发一种救护队应急救援管理系统,采用B/S架构,前后端分离开发。本文结合微服务架构技术、互联网云技术、后端框架技术等,设计和实现了系统的后端,完成了数据库建设和业务逻辑实现。救护队应急救援管理系统后端部署于云服务器,采用JFinal框架,结合封装的EhCache缓存提升系统性能,整合Swagger实现RESTful接口文档的在线生成和可视化,规范前后端之间的数据交互格式,使用MySQL进行数据的存储与管理,通过MySQLProxySQL中间件实现数据库集群以提高性能。系统后端结合微服务思想,设计实现个人模块、基础配置模块、系统管理模块、救援队伍模块、装备物资模块、培训训练管理模块、应急值班管理模块、救援方案模块、计划管理模块、资料管理模块和办公自动化模块,采用扩展的RBAC权限管理模型进行权限配置,针对训练管理子模块大量表格形式的纸质记录管理需要,采用OpenCV图像处理结合表格识别OCR,实现了训练记录表格的自动识别,此外,重点实现的功能点还包含基于语义相似度的事故救援方案自动生成、装备物资管理及出入库、公文与水印管理等。对于开发完成的系统后端,通过Swagger和JMeter进行接口功能与性能测试。测试结果表明,系统业务逻辑实现正常,根据神南救护队人员规模,并发量为300时系统平均响应时间在100毫秒左右,1秒启动循环200、500次等测试条件下请求失败率为0。系统综合实现矿山救护队在事故发生前的训练和监管、事故发生时的接警和处置方案、事故发生后的总结和分析,达到设计和使用要求,已在神南救护队投入应用。

面向冶金设备运维履历的知识图谱构建与语义相似性度量研究

这是一篇关于运维履历文档,表格识别,知识图谱构建,联合抽取,图神经网络的论文, 主要内容为冶金设备长期处于高负荷状态,工况十分恶劣,极易造成设备故障。而设备故障多以故障调查单及运维履历文档的形式由工人记录,存在内容描述不规范、记录信息质量参差不齐、图片文档不可编辑等特征,缺乏有效挖掘设备故障运维信息的方法,进而难以重用运维履历知识。影响跨企业设备维修策略制定时对运维履历知识的参考,阻碍维修进程和效率。本文以某冶金企业的行车运维履历文档及故障调查单为研究对象,提出一种改进的Mask R-CNN的方法,同时结合Unet表格框线分割及OCR技术,用以结构化识别履历中表格文本、提出一种实体关系联合抽取方法构建运维知识图谱以及研究运维履历表格文档的语义相似性度量方法。研究工作如下:(1)针对冶金设备运维履历表格文档的图片格式导致表格文本字符不可编辑的问题,提出改进Mask R-CNN网络检测表格区域,结合Unet分割表格单元格,同时依据表格特点制定的组合规则及OCR技术结构化识别出表格文本,为后续的实体关系抽取奠定基础。(2)针对运维履历文本语义描述规范差、文本质量不一及冗余信息繁多等问题导致有效提取运维信息困难,提出一种基于序列标注的联合抽取网络。该网络由BERT、Bi LSTM、Attention、CRF模块组成,可直接获取三元组数据,构建运维知识图谱,实现运维知识结构化关联及语义网络可视化。(3)针对重用运维履历文档相似性精度低的问题,提出一种面向运维履历文档的语义相似性度量方法。基于企业已有的先验信息,构建设备树定位目标设备类或实例集合的知识图谱子图,并重构成图网络模型。基于Graph SAGE图神经网络聚合故障现象子图的节点信息,提取其语义特征向量,与故障调查单的语义特征向量进行余弦相似性度量,排序推送出最相似的履历实例,以可视化知识图谱形式呈现,辅助维修策略制定。案例验证以某炼钢企业积累的大量行车运维履历文档与故障调查单为数据源,对其进行了文档解析、知识抽取并构建了运维知识图谱及重建图网络模型,接着提取不同图网络的语义特征向量以度量相似性,推送出最相似性的履历文档用以知识重用。同时研发了一种履历文档的检索系统,以云存储的共享性为跨企业提供文档解析、知识抽取及相似性检索的应用,实现了流程化运维履历文档相似性检索及跨企业间运维知识共享,对提升冶金企业设备维修效率及降低运维成本具有一定实际应用价值。

面向轴承工厂的自动化检测检验系统开发与应用

这是一篇关于检测检验系统,表格识别,数据自动化采集,统计过程控制的论文, 主要内容为本文检测系统实施对象是一家生产超小孔径系列微型深沟球轴承的工厂,产品主要用于无人机、激光投影仪、监控云台等。其配套产品的工作条件较一般民用更为苛刻(工作温度范围相对较大、连续工作时间长、可靠性要求高)。该企业从原料接收、生产过程、工艺参数都有较为严格的管控及要求,但在具体生产组织中,质量单据还是手工和电子表格记录、且无统一管理,遇到客诉时,对具体批次的过程质量数据追溯并调取所需时间以周衡量。从生产质量控制角度出发,有必要对原检测检验方式及手段实施符合当前实际需求的自动化及智能化升级。基于目标实施企业的生产现状及信息化程度,分三部分提出检测检验系统自动化实施方案:(1)原料检验单据数字化工作,兼容原工作方式,增加检验单据数字识别及格式化存储,方便原料批号追溯。开发了移动端APP将原料检测单据图片上传至上位机识别分析:对表格图像实施预处理操作提高识别准确率;采用形态学及Harris角点检测方法提取表格框架,设计动态掩膜方法识别感兴趣区域;利用j Tess Box Editor工具训练特定字库对单元格内字符识别并填充至专用数字表格中。(2)生产质量数据自动化采集,从产线中具备总线接口的数控单元直接上传实时检测数据实现过程质量数据的自动化读取及存储。机器联网基于自有通讯模块、采集模块实现工控系统与以太网系统的物理隔离,模块与工控系统间的通讯基于具体PLC型号采用Fins协议。开发了基于Python的数据接收上传微服务,结合MQTT消息发布/订阅模式将质量数据推送至服务器端存储便于实施统计过程控制。(3)统计过程控制,将过程质量数据分析并在大屏展示,对生产线形成实时反馈。结合企业之前部署的MES系统基础数据和产线质量数据,设计数据映射方法对大量数据类型匹配相应的SPC计算过程,绘制X-R控制图对产品质量进行稳定性分析,绘制帕累托图分析产品不合格原因,进而提高产品质量管控能力。开发了电视App实现关联数据可视化,实时展示生产过程质量信息。本研究项目已在目标企业正式部署应用,原料单据识别综合准确率达到96%,数控设备联网实时上传检测数据,分析结果在专用客户端和电视App以控制图等形式可视化展示。实现了质量数据联网及数字化,解决了质量体系中的追溯问题,并基于数据可视化实现了对现场质量管理的实时反馈。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码助手 ,原文地址:https://m.bishedaima.com/lunwen/54832.html

相关推荐

发表回复

登录后才能评论