基于深度神经网络的互感器铭牌文本检测和识别
这是一篇关于深度神经网络,文本检测,文本识别,FPGA硬件加速,上位机软件的论文, 主要内容为近年来,由于智能工业、物联网技术的快速发展,促进数字经济产业转型,强化计量能力建设,夯实高质量发展的计量基础十分关键。智能电力电子设备铭牌检测与识别体系是智能泛在物联计量体系的核心基石之一,本文针对常见的电力电子设备——互感器设备上的铭牌文本,展开基于深度神经网络的互感器铭牌文本检测和识别系统的研究。该系统能够主动检测互感器图片上的铭牌文本位置并识别文本,为设备数据库提供互感器的生产日期、生产地点、设备参数等重要信息。本文的主要工作内容和研究成果包括以下几点:针对互感器图像的文本检测与识别问题,提出了基于深度神经网络的互感器文本检测网络DBU和基于全连接特征编码的互感器文本识别网络mv3fcctc以完成本文的互感器文本检测与识别任务。DBU网络在文本检测公共数据集ic15上训练模型并测试,平均检测精度达到85%;mv3fcctc网络在文本识别公共数据集ic17wlt上训练模型并在自制互感器数据集上测试,平均识别精度达到75.54%。针对深度学习网络的硬件加速问题,通过Paddle平台构建互感器文本检测网络和文本识别网络以适配FPGA平台的模型部署,生成网络模型对应的FPGA配置文件,完成互感器文本检测和文本识别网络模型在FPGA平台上的加速。针对互感器信息管理问题,搭建互感器文本检测与识别上位机系统,结合图像采集、文本检测、文本识别、硬件加速等组件,以上位机软件的形式展示互感器文本检测与识别系统的可行性。通过以上内容,本文构建了基于深度神经网络的互感器文本检测与识别系统,提升了文本检测网络和文本识别网络在互感器铭牌文本上检测与识别的精度,部署网络模型至FPGA硬件加速平台,设计了与之对应的上位机软件。上述结果显示,本文所构建的互感器文本检测与识别系统能够在真实环境下检测并识别互感器铭牌文本,并且网络模型经过FPGA硬件加速后能将识别结果显示于上位机软件。
基于智能批阅的教学助手平台的设计与实现
这是一篇关于智能批阅,文本检测,文本识别,DBNet,CRNN的论文, 主要内容为在线作业批阅系统是为班级学生和任课教师提供服务的一种教学网络平台,任课教师利用此网络平台布置作业,系统将作业分发给指定班级或学生。教师可以获取作业的统计情况,选择已提交作业进行批阅,并反馈信息给学生。学生将账号与班级进行绑定,在线获取所有的课程作业,提交作业的同时由系统对作业状态进行更新,有效避免遗漏作业,实现作业的交互处理。本教学助手平台以Web端作为后台管理系统,采用微服务架构和Vue.js框架进行开发,管理教育局、学校、班级、师生及应用信息,并显性控制企业微信小程序和微信小程序的使用及停用;企业微信作为教师的工作平台,主要功能包括作业布置、作业详情、作业统计和作业批阅等;微信小程序作为家长及学生的学习平台,主要功能包括作业列表、作业完成和作业墙等;后端采用Spring Boot框架,数据库采用My SQL、Redis和Mongo DB以实现整个系统的大数据存储和实时云计算的需求,致力于为师生提供完善的在线作业全场景解决方案。本教学助手平台为教师提供数学速算智能批阅服务,该服务主要包含三个模块,分别是文本检测、文本识别和计算推演。该服务的文本检测模块采用基于分割算法的DBNet,在网络结构中加入CBAM注意力机制模块,提高各个特征在通道和空间上的联系,更有利于提取目标的有效特征;该服务的文本识别模块采用CRNN和CTC框架,针对小学作业扭曲字体的场景,在其中加入STN(空间转换网络)处理扭曲字符,并使用Bi LSTM和改进的En CTC模型,以提升网络的识别能力;该服务的计算推演模块设计并实现了一个自定义字符串计算器,对文本识别阶段识别的计算题文本进行计算,验证计算结果的正确性。该数学速算智能批阅服务可以对作业进行自动识别和判分,批改精准度达到98%。
基于多分类文本检测的医疗票据识别系统设计与实现
这是一篇关于光学字符识别,医疗票据识别,多分类文本检测,文本识别的论文, 主要内容为医疗票据识别依赖于光学字符识别技术,主要包含两个阶段:文本检测和文本识别。在文本检测阶段,由于医疗票据中印刷、机打文本相互覆盖,导致文本检测框中存在多种不同类型的文本。在文本识别阶段,基于CRNN(Convolutional Recurrent Neural Network)的文本识别方法对票据中干扰多、模糊的文本图像识别准确率不高。针对上述问题,基于DBNet算法提出了多分类文本检测改进,同时设计了对干扰多、模糊的图像进行文本识别的方法。首先在文本检测阶段,针对医疗票据中不同类型文本相互覆盖的问题,基于DBNet网络结构设计类别分支和分层机制,分类别检测医疗票据中的机打和印刷文本。由于多分类后模型参数量增多,使用轻量级网络Mobile Net V3进行优化,并通过基于通道的剪枝降低模型开销。其次在文本识别阶段,针对票据中线框干扰的问题,对部分人工合成的文本图像随机插入线框,此外,使用Res Net和Mobile Net V3增强CRNN特征提取网络。对于模糊的票据图像,在文本识别中引入了Transformer结构,将Transformer编码模块改为Res Net网络结构,解码模块结合多头注意力机制和全连接网络结构,进一步提高文本识别准确率。最后结合多分类文本检测方法和文本识别方法,实现了一个医疗票据识别系统,此外,对断裂的文本框进行文本框融合,对偏移打印的文本进行位置修正,进一步完善系统功能。多分类的文本检测能有效区分医疗票据中的机打、印刷文字,缓解了不同类型文字间相互覆盖的影响。使用轻量级网络优化后的多分类检测模型,相比于使用Res Net50特征提取网络,模型参数量减少为1/5。在有线框干扰和部分图像模糊的数据集中,基于Transformer的文本识别方法相比于使用Res Net的CRNN算法,文本识别准确率提高了7.5%。
票据识别场景下印章关键技术研究
这是一篇关于OCR,图像转换,文本检测,文本识别,印章,图像修复的论文, 主要内容为印章作为我国法律系统中一种具有法律效应的公民身份认证工具,在当今经济社会中发挥着重要作用,其广泛存在于票据、合同等纸质材料关键位置,以保证材料真实性。随着近些年OCR技术不断成熟,人们逐渐将纸质材料信息电子化的工作,从人工抄录改为深度学习文本检测识别模型自动化处理,极大节约了人力物力。但在印章加印的相关区域内,由于印章与背景文本相互干扰、相互影响,文本内容检测识别准确率大大折扣,严重干扰了纸质信息电子化过程。针对该问题,本文借鉴文本擦除研究领域和图像修复领域研究成果,研究印章无痕擦除方法:1)针对印章擦除研究数据匮乏的问题,研究并设计了多种真实数据与合成数据制作方法,满足研究需求;2)研究并设计了一种基于Erase Net场景文本擦除网络框架的印章擦除方法,实现了对印章擦除的端到端训练处理流程;3)研究并设计了一种基于门卷积的U型架构图像生成网络,并采用印章分割、印章擦除双阶段网络处理思路,实现了最终擦除效果的稳定、高效与精准,印章擦除处理前后对比,文本字符准确率提升了60%。在票据中,不但背景文本含有信息,印章代表着法人身份,本身也蕴含着执行人、签约双方等关键信息。完备的纸质材料电子化系统中往往将设法获取印章其中文本信息,以供材料文本信息二次验证,并保证材料合法性。针对印章文本信息提取问题,本文研究并设计了一种文本检测、文本识别两阶段的印章文本信息提取方案,具体为:1)考虑到印章样式多样复杂,文本排列方向随机等问题,研究并设计了一种基于图像金字塔的多尺度印章文本区域分割检测网络,解决了印章弧形文本检测难、文本区域形状不规则等问题,最终检测F1分数达到92.24%;2)针对印章文本检测后文本块角度、形状、文本排列方式均不固定的问题,研究并设计了一套基于图像分类和图像极坐标转换直角坐标的文本矫正方法,并优化了CRNN骨干网络、语义特征提取网络设计,实现了对印章文本信息的提取过程,最终文本识别准确率达到94.90%。
海报文字信息提取系统的设计与实现
这是一篇关于卷积神经网络,字符检测,文本识别的论文, 主要内容为随着信息技术和互联网的不断发展,网络电商逐渐兴起,但随之而来的就是急剧膨胀的海报广告。为了规范市场,监管部门对海报广告禁用词做出了规定。但这些禁用词涉及的行业和规模十分广泛,这为电商平台的审核带来了极大的压力。为了提升审核工作的效率,降低审核成本,本文研究并实现了一个海报广告禁用词检测识别的审核系统,实现自动检测识别输入图像中文字信息并判断文本内容信息是否存在禁用词。本系统主要包括字符检测、文字识别、文本关键词提取三个模块。字符检测模块将自动对输入图像进行处理,排除噪声干扰,准确找到图片中的字符的位置;文字识别模块将检测到的文字区域分割成不同大小的图像并且使用基于卷积网络的识别模型识别图像中的文字信息;文本关键词提取模块则利用识别模块的输出以及用户选择类别对输出的文本信息进行判断,最终给出可能存在的禁用词文字信息。文字检测模块主要是为了解决目前基于卷积的语义分割网络的检测的文字图像分割边缘不准确、网络感受野不足等问题。在该模块中改进了一种基于语义分割的检测模型,该网络利用反卷积以及上采样建立了一个语义分割通路,并通过多尺度的方法将不同层级的语义信息融合输出。本文以语义分割为基础优化了标签制作方法以及分割损失函数,最终得到了更加准确的文字分割图像。该模型在ICDAR2015和ICDAR2017上进行了训练和测试,在ICDAR2015数据集上F-1得分、召回率、查准率指标上分别达到81.8,81.4,85.9,优于当前多数文字检测模型。在识别部分,为了解决图像中过于丰富的颜色与干扰纹理背景,在该部分改进了一种基于序列编解码的算法模型,在该部分网络结合了图像的二维空间特性和文本的长序列特点训练了一个带有注意力的多方向序列编解码的文字识别算法。该模型在中英文文字混合的百度文字识别数据集上进行了测试,准确率接近86%,并且在弯曲文本的识别上也达到了较好的效果。在理论研究的基础上,根据现有需求设计并实现了文字检测、文字识别以及关键词提取模块。将各个模块整合到一起,实现自动的检测禁用词系统。系统整体采用客户端-服务器(C/S)架构,将文字检测、文字识别两个模块都部署在服务器端,利用服务器的CPU等设备加速模型的在线推理速度。最后还对整个系统与模块的性能进行了测试。
面向电商服务平台的图片敏感文本检测系统设计与实现
这是一篇关于电商服务平台,文本区域定位,特征融合,文本识别,敏感判别的论文, 主要内容为随着电商服务平台的广泛应用,线上购物逐渐成为人们消费的主流方式。由于平台中商品图片所包含的文本内容十分丰富,同时互联网高速地对信息进行传播也使得不良信息更加易于蔓延,因此,内容安全问题随之产生。现有关于敏感文本检测系统的研究较少,且多数文本检测系统仅针对规则分布的水平文本进行识别,无法应用在实际场景中。本文以深度学习技术为基础,从文本区域定位、敏感文本识别与判别这两个角度出发,展开了研究。首先,本文针对图片文本区域定位算法进行优化。以可微分二值化分割模型为依托,提出了深浅双层特征融合优化算法以及级联特征增强优化算法,使得融合后特征的语义表征能力与位置表征能力共同强化,提高了商品图片中针对密集、多尺度、不规则分布等文本区域的定位准确性。实验表明,优化算法在指定数据集中较原有模型在综合评价指标上提升了3.09%,且定位速度满足实时性要求。其次,本文针对敏感文本识别与判别方法展开深入研究。采用空间矫正优化网络架构以及基于路径筛选的连接时序分类优化算法提高文本识别准确率。并通过合成法构造数据集解决了数据少且多样性不足等问题。实验结果表明,优化算法在针对不定长中文文本识别问题中表现出良好的性能。同时,本文基于确定有穷自动机构建字典树实现了对识别出的文本进行敏感判别,对于敏感词库所包含的词汇,敏感判别方法可以达到完全准确。最后,从电商服务平台的应用角度出发,搭建了图片敏感文本检测系统。系统以图片文本区域定位算法、图片文本识别算法以及敏感判别方法为基础,设计并实现了敏感词库管理模块、文本定位与识别模块、敏感词提取模块、敏感检测与统计导出模块以及系统管理模块,并在此基础上针对系统功能模块的全部功能、系统检测精度以及运行时间等方面对系统进行测试。结果表明,本系统实现的各个功能模块均能正常完成应有功能,并且对于文本区域定位、文本识别以及敏感图片检测的性能均可达到实际应用要求,实现了自动审核电商图片文本的工作,提高了图片审核效率,进而维护了电商服务平台的内容安全。
面向电商服务平台的图片敏感文本检测系统设计与实现
这是一篇关于电商服务平台,文本区域定位,特征融合,文本识别,敏感判别的论文, 主要内容为随着电商服务平台的广泛应用,线上购物逐渐成为人们消费的主流方式。由于平台中商品图片所包含的文本内容十分丰富,同时互联网高速地对信息进行传播也使得不良信息更加易于蔓延,因此,内容安全问题随之产生。现有关于敏感文本检测系统的研究较少,且多数文本检测系统仅针对规则分布的水平文本进行识别,无法应用在实际场景中。本文以深度学习技术为基础,从文本区域定位、敏感文本识别与判别这两个角度出发,展开了研究。首先,本文针对图片文本区域定位算法进行优化。以可微分二值化分割模型为依托,提出了深浅双层特征融合优化算法以及级联特征增强优化算法,使得融合后特征的语义表征能力与位置表征能力共同强化,提高了商品图片中针对密集、多尺度、不规则分布等文本区域的定位准确性。实验表明,优化算法在指定数据集中较原有模型在综合评价指标上提升了3.09%,且定位速度满足实时性要求。其次,本文针对敏感文本识别与判别方法展开深入研究。采用空间矫正优化网络架构以及基于路径筛选的连接时序分类优化算法提高文本识别准确率。并通过合成法构造数据集解决了数据少且多样性不足等问题。实验结果表明,优化算法在针对不定长中文文本识别问题中表现出良好的性能。同时,本文基于确定有穷自动机构建字典树实现了对识别出的文本进行敏感判别,对于敏感词库所包含的词汇,敏感判别方法可以达到完全准确。最后,从电商服务平台的应用角度出发,搭建了图片敏感文本检测系统。系统以图片文本区域定位算法、图片文本识别算法以及敏感判别方法为基础,设计并实现了敏感词库管理模块、文本定位与识别模块、敏感词提取模块、敏感检测与统计导出模块以及系统管理模块,并在此基础上针对系统功能模块的全部功能、系统检测精度以及运行时间等方面对系统进行测试。结果表明,本系统实现的各个功能模块均能正常完成应有功能,并且对于文本区域定位、文本识别以及敏感图片检测的性能均可达到实际应用要求,实现了自动审核电商图片文本的工作,提高了图片审核效率,进而维护了电商服务平台的内容安全。
基于深度学习的货运信息智能管理系统设计与实现
这是一篇关于盲去模糊,文本识别,文本检测,深度学习的论文, 主要内容为随着经济贸易的腾飞,货运总量持续攀升,智能化货运平台成为重要的发展趋势。传统的过磅需要货运司机逐条输入磅单数据,审核人员逐条核对校验,流程繁琐、效率低下,无法满足高效、快捷的现代货运业需求。近年来,基于深度学习的光学文字识别(OCR)技术日趋成熟,在货运磅单信息的智能提取和处理中有广阔的应用前景。在实际的货运磅单场景中,经常存在磅单模糊、变形、有阴影等干扰因素,给OCR识别带来了不小的挑战。本文针对上述非理想条件下的磅单信息识别技术和系统应用展开研究,取得的主要成果和创新点如下:(1)提出了一种图像去模糊处理模型TextDeblurDAE,模型采用多尺度架构设计,并引入空间与通道注意力机制,以增强模糊图像文本特征、抑制其余无效特征;在第一级网络进行初步盲去模糊的基础上,级联第二级网络实现更细粒度的盲去模糊处理,峰值信噪比(PSNR)达到30.01 dB。将最大-最小滤波与OTSU算法结合,去除磅单上阴影的影响并增强文本。(2)在一阶段文本检测模型Textboxes++的基础上引入空洞卷积,采用轻型的骨干网络MobileNet-V3替换VGG-16,显著提高了模型的检测精度、召回率和推理速度,检测精度达96.81%;采用带有STN模块的CRNN网络作为文本识别器,提高透视畸变情况下的识别精度,识别率达94.81%。(3)开发出一套货运磅单信息智能管理系统,实现了磅单图像去模糊、去阴影、文本检测与识别和结构化处理,并提供异常数据报警、磅单数据持久化、特定数据查询等功能。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设工坊 ,原文地址:https://m.bishedaima.com/lunwen/47977.html