基于机器视觉的工业字符识别方法研究
这是一篇关于OCR,工业字符识别,图像处理,机器视觉,CNN,Dropout的论文, 主要内容为随着信息技术的发展,产品的溯源得到人们的广泛关注。在制造业,生产加工的每一步都会产生相应的信息数据,将这些数据记录在工件上表达其相关生产信息。因此,零件不同,其字符串编码不同,通过采集其字符串编码即可获得工件的加工工序等信息达到对其的全生命周期跟踪与溯源。工件生产的条件和作用条件的复杂性,采用人工方式录入相关信息,成本高、效率低,准确率也难以保证。现代科技的高速发展,工业智能化程度越来越高,利用机器视觉识别工件表面的字符串编码可解放劳动力,提升生产效率,有利于工业智能化及转型升级。光学字符识别(Optical Character Recognition,OCR)系统在物流、办公、金融等领域应用较为广泛,但工业化应用尚不充分。本文利用OCR技术,实现对工件表面字符串编码的识别。本文主要研究内容如下:(1)图像采集系统设计方法。基于论文的研究内容,介绍了图像采集系统的设计方法。通过分析相机参数对成像系统的影响,给出了相机参数的选择原则,同时,对照明系统的设计原则和方法做了介绍。(2)工业字符图像预处理方法研究。为从工业字符图像中获得工件字符串编码信息,需要对其进行预处理。论文对比分析了实现图像增强、图像滤波、字符校正等操作的现有方法,针对工件字符串编码与其背景间色差小、对比度小这一特点,选择Retinex算法完成了对图像的增强;针对字符图像存在大量噪点及工件表面存在划痕、锈斑等缺陷,选用双边滤波算法实现了对图像的滤波;利用MSER算法实现了对字符区域的定位,并用椭圆拟合方法实现对单个字符的包络,最终实现了对字符区域的最小包络和裁剪。(3)基于高斯加权的改进Wellner算法的设计。在分析了传统二值化算法的特点后,结合二维Wellner自适应阈值算法和Niblack算法的优点,基于高斯函数的特点,论文设计了一种既考虑像素点间的欧氏距离又考虑像素点间灰度变化的新型图像二值化算法——基于高斯加权的改进二维Wellner算法。实验研究结果表明,所设计的基于高斯加权的改进Wellner算法能有效去除背景中的噪点,更好地区分目标与背景,具有很好的适应能力和泛化能力。(4)基于Dropout的CNN结构优化。论文对比分析了采用模板匹配、BP神经网络和CNN模型实现字符识别所表现出的特点及识别的准确度。通过对倾斜字符和残缺字符的识别,CNN模型较模板匹配和BP神经网络有较高的准确率。论文以CNN的Le Net模型为基础,基于Dropout技术对神经网络的影响,将其应用于Le Net模型以通过对模型结构的优化提升其泛化能力。采用含残缺字符的样本集对基于Dropout技术的Le Net模型进行训练。实验结果表明,采用训练所得的网络对残缺变形字符样本识别的准确率从90%上升到94.44%。研究结果证明,论文所提出的基于Dropout的CNN结构优化方法是正确有效的,使其泛化能力得到提升。
法院电子卷宗标注系统的设计与实现
这是一篇关于电子卷宗,自动标注,SpringBoot,MyBatis,OCR的论文, 主要内容为近年来,随着人工智能和机器学习等相关技术的快速发展,法院办公系统正在向智能化的方向进行升级。为了顺应国家科学技术升级换代的趋势,天津市高级人民法院正在加大智能化系统的研发力度以提高工作效率。与此同时,电子卷宗管理越来越受重视,其智能编目系统的编目任务实现需要标注数据,但缺乏相应的数据集,需要构造系统进行标注。本文以此为背景,构建了一个在线电子卷宗标注系统,用于采集和管理标注数据。本文基于全文检索技术和图片内容识别技术,采取自动标注和人工标注相结合的方式建立标注数据集。通过OCR图像识别技术扫描电子卷宗图片获取图片内容,使用Elasticsearch搜索引擎匹配相关标签关键字完成自动标注。针对匹配失败的情况,通过人工标注进行补充标注,以保证图片标注的准确性。本文将电子卷宗标注系统分为七个功能模块,分别是卷宗文件获取、卷宗数据预处理、电子卷宗标注、电子卷宗任务管理、数据统计、系统管理、数据导出。系统采用Spring、Spring Boot作为系统的后端框架;使用My Batis做系统的数据持久层框架;电子卷宗数据采用FTP文件传输协议进行文件的传输;结合电子卷宗标注系统的需求分析和模块设计,依次对上述功能模块进行实现和测试。当前,电子卷宗标注系统已经在天津市高级人民法院投入使用,经工作人员使用后反馈系统运行流畅,操作简单方便。
共享图书平台系统的研究与实现
这是一篇关于共享图书,SSM,文本分类,OCR,爬虫的论文, 主要内容为随着供给侧改革和“互联网+”行动计划的推进,共享经济在我国迅速发展。目前,共享平台应用程序已涉及到人们生活中的各个方面。阅读是人们日常生活中不可缺少的活动之一,书籍作为阅读的媒介具有被共享的客观条件和主观需求。但市面上现有的共享图书平台无法同时满足用户对于数字化阅读和实体书阅读的需求。针对上述问题,本文研究并实现了一个共享图书平台系统,旨在为图书拥有者提供闲置书籍再利用渠道的同时,满足图书需求者对于纸质书籍和电子书籍的阅读需求。本文主要工作内容及创新点如下:第一,本文对市面上的共享图书平台系统进行了调研,在分析和总结其中不足的基础之上,结合目前我国国民阅读习惯对共享图书平台系统进行了需求分析与设计。第二,对共享图书平台系统中的关键技术进行研究。结合共享图书平台中电子书文本内容的特点,以朴素贝叶斯对数计数比为基础,提出并实现了一种适用于高维度、低密度文本的低质量文本检测模型。实验证明,该模型相比于传统基于TF-IDF进行特征加权的文本分类模型,在查准率、查全率和F1值上都具有优势,优化了共享图书平台的阅读环境。通过对图像处理技术的调研,基于Tesseract-OCR提出了一种通过图书扉页图片提取图书在版编目数据的方法。第三,通过实际调研总结现有共享图书平台中存在的问题和不足。基于Spring Boot和SSM(Spring+SpringMVC+MyBatis)框架搭建了共享图书平台移动共享端和后台管理端。基于Redis内存数据库从缓存角度进行了架构优化研究。基于Scrapy框架实现了书籍信息爬虫程序。通过对各大网站中反爬虫机制的调研,采取应对策略以提高爬虫程序的稳定性。
基于机器视觉的工业字符识别方法研究
这是一篇关于OCR,工业字符识别,图像处理,机器视觉,CNN,Dropout的论文, 主要内容为随着信息技术的发展,产品的溯源得到人们的广泛关注。在制造业,生产加工的每一步都会产生相应的信息数据,将这些数据记录在工件上表达其相关生产信息。因此,零件不同,其字符串编码不同,通过采集其字符串编码即可获得工件的加工工序等信息达到对其的全生命周期跟踪与溯源。工件生产的条件和作用条件的复杂性,采用人工方式录入相关信息,成本高、效率低,准确率也难以保证。现代科技的高速发展,工业智能化程度越来越高,利用机器视觉识别工件表面的字符串编码可解放劳动力,提升生产效率,有利于工业智能化及转型升级。光学字符识别(Optical Character Recognition,OCR)系统在物流、办公、金融等领域应用较为广泛,但工业化应用尚不充分。本文利用OCR技术,实现对工件表面字符串编码的识别。本文主要研究内容如下:(1)图像采集系统设计方法。基于论文的研究内容,介绍了图像采集系统的设计方法。通过分析相机参数对成像系统的影响,给出了相机参数的选择原则,同时,对照明系统的设计原则和方法做了介绍。(2)工业字符图像预处理方法研究。为从工业字符图像中获得工件字符串编码信息,需要对其进行预处理。论文对比分析了实现图像增强、图像滤波、字符校正等操作的现有方法,针对工件字符串编码与其背景间色差小、对比度小这一特点,选择Retinex算法完成了对图像的增强;针对字符图像存在大量噪点及工件表面存在划痕、锈斑等缺陷,选用双边滤波算法实现了对图像的滤波;利用MSER算法实现了对字符区域的定位,并用椭圆拟合方法实现对单个字符的包络,最终实现了对字符区域的最小包络和裁剪。(3)基于高斯加权的改进Wellner算法的设计。在分析了传统二值化算法的特点后,结合二维Wellner自适应阈值算法和Niblack算法的优点,基于高斯函数的特点,论文设计了一种既考虑像素点间的欧氏距离又考虑像素点间灰度变化的新型图像二值化算法——基于高斯加权的改进二维Wellner算法。实验研究结果表明,所设计的基于高斯加权的改进Wellner算法能有效去除背景中的噪点,更好地区分目标与背景,具有很好的适应能力和泛化能力。(4)基于Dropout的CNN结构优化。论文对比分析了采用模板匹配、BP神经网络和CNN模型实现字符识别所表现出的特点及识别的准确度。通过对倾斜字符和残缺字符的识别,CNN模型较模板匹配和BP神经网络有较高的准确率。论文以CNN的Le Net模型为基础,基于Dropout技术对神经网络的影响,将其应用于Le Net模型以通过对模型结构的优化提升其泛化能力。采用含残缺字符的样本集对基于Dropout技术的Le Net模型进行训练。实验结果表明,采用训练所得的网络对残缺变形字符样本识别的准确率从90%上升到94.44%。研究结果证明,论文所提出的基于Dropout的CNN结构优化方法是正确有效的,使其泛化能力得到提升。
共享图书平台系统的研究与实现
这是一篇关于共享图书,SSM,文本分类,OCR,爬虫的论文, 主要内容为随着供给侧改革和“互联网+”行动计划的推进,共享经济在我国迅速发展。目前,共享平台应用程序已涉及到人们生活中的各个方面。阅读是人们日常生活中不可缺少的活动之一,书籍作为阅读的媒介具有被共享的客观条件和主观需求。但市面上现有的共享图书平台无法同时满足用户对于数字化阅读和实体书阅读的需求。针对上述问题,本文研究并实现了一个共享图书平台系统,旨在为图书拥有者提供闲置书籍再利用渠道的同时,满足图书需求者对于纸质书籍和电子书籍的阅读需求。本文主要工作内容及创新点如下:第一,本文对市面上的共享图书平台系统进行了调研,在分析和总结其中不足的基础之上,结合目前我国国民阅读习惯对共享图书平台系统进行了需求分析与设计。第二,对共享图书平台系统中的关键技术进行研究。结合共享图书平台中电子书文本内容的特点,以朴素贝叶斯对数计数比为基础,提出并实现了一种适用于高维度、低密度文本的低质量文本检测模型。实验证明,该模型相比于传统基于TF-IDF进行特征加权的文本分类模型,在查准率、查全率和F1值上都具有优势,优化了共享图书平台的阅读环境。通过对图像处理技术的调研,基于Tesseract-OCR提出了一种通过图书扉页图片提取图书在版编目数据的方法。第三,通过实际调研总结现有共享图书平台中存在的问题和不足。基于Spring Boot和SSM(Spring+SpringMVC+MyBatis)框架搭建了共享图书平台移动共享端和后台管理端。基于Redis内存数据库从缓存角度进行了架构优化研究。基于Scrapy框架实现了书籍信息爬虫程序。通过对各大网站中反爬虫机制的调研,采取应对策略以提高爬虫程序的稳定性。
基于RPC的智能账套管理系统的设计与实现
这是一篇关于RPC,OCR,Spring Boot,Vue的论文, 主要内容为现如今各行各业都在向信息化、智能化靠拢,财务行业也不例外。由于中小型企业的不断增多,导致代理记账公司的业务量不断增大。一款有针对性的、智能化的账套管理系统应运而生。该账套管理系统以智能化为核心同时有着非常高的可靠性。系统摒弃了传统的一体化开发,使用微服务架构的设计思想,将系统业务按照功能拆分为细粒度的服务,所拆分的每一个服务都是一个独立的应用。财务记账软件根据功能拆分为账套管理服务,OCR发票识别服务和记账服务,每一个服务都是单独的应用。整个系统最终具有技术选型灵活、复杂度可控、易于容错、可独立部署等诸多优势。本文将以智能账套管理系统作为重点,从需求分析到系统实现,详细的阐述其实现过程。在实现技术上,该系统通过远程通信协议RPC技术实现跨系统间的相互通信,使得操作管理更加智能。员工在记账系统中做账生成的报表信息,通过RPC技术可直接在账套系统中查看;使用RPC技术查询结账时间来监督记账人员规定时间是否完成记账工作,如果没有完成,系统将自动给管理者发邮件通知,实现智能化的管理。此外,通过图像识别技术实现自动识别用户上传的发票图片并分类存储功能,解决了人工输入系统的繁琐和易出错问题。使用策略模式实现不同发票类型存储到不同数据库表业务,减少了if条件语句的使用,使得代码可扩展性更强。前台界面采用轻量级框架Vue,支持数据的双向绑定和虚拟DOM,大大加快了访问速度,提高了用户体验。后端采用当下流行的Spring Boot框架实现,简化了Spring应用的初始搭建过程和开发过程,极大的提高了开发和部署效率。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码向导 ,原文地址:https://m.bishedaima.com/lunwen/45382.html