基于FPGA的嵌入式视频图像检测系统的设计与实现
这是一篇关于FPGA,图像处理,字符检测,视频采集显示,SOPC的论文, 主要内容为图像检测系统可以快速获取大量信息,易于自动处理,也易于与设计信息以及加工控制信息集成,因此,在现代自动化生产过程中,人们将图像检测系统广泛地用于工况监视、成品检验和质量控制等领域。在当今工业应用中,人们要求图像检测系统趋向于小型化(即嵌入式)的同时,对图像检测系统的实时性要求越来越高。近年来,随着大规模集成电路的发展,可编程逻辑FPGA所包含的逻辑单元,内部存储块等资源越来越丰富,功能也越来越强大,因此FPGA在当前的嵌入式实时系统中得到广泛应用,同时FPGA凭借其强大的并行处理数据的能力和设计的灵活性在图像处理领域有着很大的优势。鉴于此,本文设计并实现了一个基于FPGA的嵌入式视频图像检测系统。 基于FPGA设计的嵌入式视频图像检测系统主要包括三个部分,视频采集显示部分、图像预处理部分和图像检测部分。系统主要功能是用Verilog HDL设计硬件电路完成。本文通过设计帧缓存写控制器,将上一届两个师兄设计的视频采集模块和视频显示模块连接起来,并改进了他们的设计,构建了一个在显示动态视频图像的同时叠加显示人机交互界面的视频采集显示系统。针对FPGA适合大数据量规则运算和并行处理数据的特点,以字符图像检测为目标,设计了适合FPGA实现的图像处理算法硬件电路。在图像滤波阶段,设计了图像滤波的五级流水线结构,一次运算的时间即可完成中值滤波、膨胀、腐蚀滤波等五次运算,极大地提高了处理速度;在二值化阶段采用易于用硬件实现的直方图方法求取全局阈值,通过求取直方图的三个峰值来避免阈值误判,进而完成二值化;字符分割阶段应用投影法来分割字符,投影的本质就是统计像素点,硬件实现的速度快、资源占用少;特征提取阶段采用易于用硬件实现的具有统计性质的、根据局部特征的、适应性较好的13特征点提取方法来提取特征。在硬件设计完成后,用软件设计模板匹配,来完成字符检测,并把检测结果通过人机交互界面显示出来。 本文通过SOPC技术集成硬件和软件设计,充分发挥软硬件各自的特点,实现软硬件协同操作,提高系统性能;设计适合FPGA实现的算法,克服硬件不宜实现复杂算法的弱点;充分发挥FPGA并行处理数据强的特点,使整个视频图像检测系统有很强的实时性;充分发挥了FPGA设计灵活的特点,对于不同的检测要求只需改变参数就可以了。经过系统测试表明,视频采集显示系统能够稳定实时的运行,在此基础上实现的视频字符图像检测系统能够准确地检测出字符的正误,并且系统有很强的实时性,同时消耗的FPGA逻辑资源也不多。
海报文字信息提取系统的设计与实现
这是一篇关于卷积神经网络,字符检测,文本识别的论文, 主要内容为随着信息技术和互联网的不断发展,网络电商逐渐兴起,但随之而来的就是急剧膨胀的海报广告。为了规范市场,监管部门对海报广告禁用词做出了规定。但这些禁用词涉及的行业和规模十分广泛,这为电商平台的审核带来了极大的压力。为了提升审核工作的效率,降低审核成本,本文研究并实现了一个海报广告禁用词检测识别的审核系统,实现自动检测识别输入图像中文字信息并判断文本内容信息是否存在禁用词。本系统主要包括字符检测、文字识别、文本关键词提取三个模块。字符检测模块将自动对输入图像进行处理,排除噪声干扰,准确找到图片中的字符的位置;文字识别模块将检测到的文字区域分割成不同大小的图像并且使用基于卷积网络的识别模型识别图像中的文字信息;文本关键词提取模块则利用识别模块的输出以及用户选择类别对输出的文本信息进行判断,最终给出可能存在的禁用词文字信息。文字检测模块主要是为了解决目前基于卷积的语义分割网络的检测的文字图像分割边缘不准确、网络感受野不足等问题。在该模块中改进了一种基于语义分割的检测模型,该网络利用反卷积以及上采样建立了一个语义分割通路,并通过多尺度的方法将不同层级的语义信息融合输出。本文以语义分割为基础优化了标签制作方法以及分割损失函数,最终得到了更加准确的文字分割图像。该模型在ICDAR2015和ICDAR2017上进行了训练和测试,在ICDAR2015数据集上F-1得分、召回率、查准率指标上分别达到81.8,81.4,85.9,优于当前多数文字检测模型。在识别部分,为了解决图像中过于丰富的颜色与干扰纹理背景,在该部分改进了一种基于序列编解码的算法模型,在该部分网络结合了图像的二维空间特性和文本的长序列特点训练了一个带有注意力的多方向序列编解码的文字识别算法。该模型在中英文文字混合的百度文字识别数据集上进行了测试,准确率接近86%,并且在弯曲文本的识别上也达到了较好的效果。在理论研究的基础上,根据现有需求设计并实现了文字检测、文字识别以及关键词提取模块。将各个模块整合到一起,实现自动的检测禁用词系统。系统整体采用客户端-服务器(C/S)架构,将文字检测、文字识别两个模块都部署在服务器端,利用服务器的CPU等设备加速模型的在线推理速度。最后还对整个系统与模块的性能进行了测试。
海报文字信息提取系统的设计与实现
这是一篇关于卷积神经网络,字符检测,文本识别的论文, 主要内容为随着信息技术和互联网的不断发展,网络电商逐渐兴起,但随之而来的就是急剧膨胀的海报广告。为了规范市场,监管部门对海报广告禁用词做出了规定。但这些禁用词涉及的行业和规模十分广泛,这为电商平台的审核带来了极大的压力。为了提升审核工作的效率,降低审核成本,本文研究并实现了一个海报广告禁用词检测识别的审核系统,实现自动检测识别输入图像中文字信息并判断文本内容信息是否存在禁用词。本系统主要包括字符检测、文字识别、文本关键词提取三个模块。字符检测模块将自动对输入图像进行处理,排除噪声干扰,准确找到图片中的字符的位置;文字识别模块将检测到的文字区域分割成不同大小的图像并且使用基于卷积网络的识别模型识别图像中的文字信息;文本关键词提取模块则利用识别模块的输出以及用户选择类别对输出的文本信息进行判断,最终给出可能存在的禁用词文字信息。文字检测模块主要是为了解决目前基于卷积的语义分割网络的检测的文字图像分割边缘不准确、网络感受野不足等问题。在该模块中改进了一种基于语义分割的检测模型,该网络利用反卷积以及上采样建立了一个语义分割通路,并通过多尺度的方法将不同层级的语义信息融合输出。本文以语义分割为基础优化了标签制作方法以及分割损失函数,最终得到了更加准确的文字分割图像。该模型在ICDAR2015和ICDAR2017上进行了训练和测试,在ICDAR2015数据集上F-1得分、召回率、查准率指标上分别达到81.8,81.4,85.9,优于当前多数文字检测模型。在识别部分,为了解决图像中过于丰富的颜色与干扰纹理背景,在该部分改进了一种基于序列编解码的算法模型,在该部分网络结合了图像的二维空间特性和文本的长序列特点训练了一个带有注意力的多方向序列编解码的文字识别算法。该模型在中英文文字混合的百度文字识别数据集上进行了测试,准确率接近86%,并且在弯曲文本的识别上也达到了较好的效果。在理论研究的基础上,根据现有需求设计并实现了文字检测、文字识别以及关键词提取模块。将各个模块整合到一起,实现自动的检测禁用词系统。系统整体采用客户端-服务器(C/S)架构,将文字检测、文字识别两个模块都部署在服务器端,利用服务器的CPU等设备加速模型的在线推理速度。最后还对整个系统与模块的性能进行了测试。
海报文字信息提取系统的设计与实现
这是一篇关于卷积神经网络,字符检测,文本识别的论文, 主要内容为随着信息技术和互联网的不断发展,网络电商逐渐兴起,但随之而来的就是急剧膨胀的海报广告。为了规范市场,监管部门对海报广告禁用词做出了规定。但这些禁用词涉及的行业和规模十分广泛,这为电商平台的审核带来了极大的压力。为了提升审核工作的效率,降低审核成本,本文研究并实现了一个海报广告禁用词检测识别的审核系统,实现自动检测识别输入图像中文字信息并判断文本内容信息是否存在禁用词。本系统主要包括字符检测、文字识别、文本关键词提取三个模块。字符检测模块将自动对输入图像进行处理,排除噪声干扰,准确找到图片中的字符的位置;文字识别模块将检测到的文字区域分割成不同大小的图像并且使用基于卷积网络的识别模型识别图像中的文字信息;文本关键词提取模块则利用识别模块的输出以及用户选择类别对输出的文本信息进行判断,最终给出可能存在的禁用词文字信息。文字检测模块主要是为了解决目前基于卷积的语义分割网络的检测的文字图像分割边缘不准确、网络感受野不足等问题。在该模块中改进了一种基于语义分割的检测模型,该网络利用反卷积以及上采样建立了一个语义分割通路,并通过多尺度的方法将不同层级的语义信息融合输出。本文以语义分割为基础优化了标签制作方法以及分割损失函数,最终得到了更加准确的文字分割图像。该模型在ICDAR2015和ICDAR2017上进行了训练和测试,在ICDAR2015数据集上F-1得分、召回率、查准率指标上分别达到81.8,81.4,85.9,优于当前多数文字检测模型。在识别部分,为了解决图像中过于丰富的颜色与干扰纹理背景,在该部分改进了一种基于序列编解码的算法模型,在该部分网络结合了图像的二维空间特性和文本的长序列特点训练了一个带有注意力的多方向序列编解码的文字识别算法。该模型在中英文文字混合的百度文字识别数据集上进行了测试,准确率接近86%,并且在弯曲文本的识别上也达到了较好的效果。在理论研究的基础上,根据现有需求设计并实现了文字检测、文字识别以及关键词提取模块。将各个模块整合到一起,实现自动的检测禁用词系统。系统整体采用客户端-服务器(C/S)架构,将文字检测、文字识别两个模块都部署在服务器端,利用服务器的CPU等设备加速模型的在线推理速度。最后还对整个系统与模块的性能进行了测试。
基于机器视觉的饮料产品外观多缺陷联合检测技术研究
这是一篇关于机器视觉,图像处理,深度学习,标签检测,字符检测的论文, 主要内容为饮料出厂缺陷检测系统在整个饮料灌装自动化产线上扮演着重要的角色。饮料灌装产线的检测项目一般包括标签检测、喷码检测、液位面检测及高低盖检测四类,这些检测项目对出厂品控具有至关重要的作用。当前企业采用的检测方法,通常是在各工序后安装相应的单一缺陷检测设备,并根据检测结果完成缺陷品剔除[1]。这意味着在一条产线的不同位置要安装多套不同的独立检测系统,存在制造资源浪费、安装难度高等问题,并且这种方式不便与数据库实现数据互联,从而影响对产品质量的跟踪与管理。本文针对以上问题,结合机器视觉技术进行了如下研究:(1)针对当前饮料灌装产线出厂常规缺陷检测系统存在的问题,根据饮料灌装产线的生产要求,完成了多类缺陷联合检测系统的总体架构设计,具体包括检测、剔除、可视化交互等功能。(2)对采集到的图像和数据集进行了图像预处理及数据增强设计。针对采集到的标签图像和喷码图像存在虚化、模糊等现象,通过采用图像锐化增强等方法进行预处理。针对采集到的网络训练的数据集数量不足的情况,对复杂组合形状式标签通过缩放、平移、旋转、镜像、添加噪声、重新组合颜色通道等来实现数据增强,对激光雕刻式喷码提出了基于泊松融合的数据增强方法,有效地对数据集进行了扩充。(3)针对饮料灌装产线不同工序对应产生的多类缺陷进行特征分析设计了一个基于神经网络的可拓展式缺陷检测网络模型。模型可以实现对饮料喷码缺失、破损、错误缺陷以及标签缺失、倒贴缺陷的直接识别,并为后续标签破损检测提供特征基础。同时网络提供可拓展接口,可根据实际任务进行检测模块的增删。此外,为提升设计的网络检测速度,通过采用模型剪枝的方法对网络归一化层进行稀疏化剪枝,实现了速度和精度的均衡提升。(4)对多缺陷联合检测网络提取到的标签分割图像进行破损检测。本文设计了一种基于概率霍夫变换和凸包检测的完整标签区域提取算法以提取标签的完整区域。得到完整标签区域后,通过文中设计的基于颜色空间和欧式距离的标签破损检测算法,完成对标签的破损检测。(5)实验系统的搭建和算法功能测试。本文完成了实验系统重要硬件的选型工作,搭建了基础实验平台。实验平台包括光学图像采集模块、次品剔除模块和软件控制模块。之后,在实际平台上对所设计的检测系统进行了精度和速度的实验测试。实验表明,本文提出的多缺陷联合检测方法检测精度超过95%,速度达到18000瓶/h,能够很好地提升缺陷检测效率,减少资源浪费,并且联合数据库技术,可方便地实现产线故障联网管理,有助于实现饮料产线一体化检测与管理。
海报文字信息提取系统的设计与实现
这是一篇关于卷积神经网络,字符检测,文本识别的论文, 主要内容为随着信息技术和互联网的不断发展,网络电商逐渐兴起,但随之而来的就是急剧膨胀的海报广告。为了规范市场,监管部门对海报广告禁用词做出了规定。但这些禁用词涉及的行业和规模十分广泛,这为电商平台的审核带来了极大的压力。为了提升审核工作的效率,降低审核成本,本文研究并实现了一个海报广告禁用词检测识别的审核系统,实现自动检测识别输入图像中文字信息并判断文本内容信息是否存在禁用词。本系统主要包括字符检测、文字识别、文本关键词提取三个模块。字符检测模块将自动对输入图像进行处理,排除噪声干扰,准确找到图片中的字符的位置;文字识别模块将检测到的文字区域分割成不同大小的图像并且使用基于卷积网络的识别模型识别图像中的文字信息;文本关键词提取模块则利用识别模块的输出以及用户选择类别对输出的文本信息进行判断,最终给出可能存在的禁用词文字信息。文字检测模块主要是为了解决目前基于卷积的语义分割网络的检测的文字图像分割边缘不准确、网络感受野不足等问题。在该模块中改进了一种基于语义分割的检测模型,该网络利用反卷积以及上采样建立了一个语义分割通路,并通过多尺度的方法将不同层级的语义信息融合输出。本文以语义分割为基础优化了标签制作方法以及分割损失函数,最终得到了更加准确的文字分割图像。该模型在ICDAR2015和ICDAR2017上进行了训练和测试,在ICDAR2015数据集上F-1得分、召回率、查准率指标上分别达到81.8,81.4,85.9,优于当前多数文字检测模型。在识别部分,为了解决图像中过于丰富的颜色与干扰纹理背景,在该部分改进了一种基于序列编解码的算法模型,在该部分网络结合了图像的二维空间特性和文本的长序列特点训练了一个带有注意力的多方向序列编解码的文字识别算法。该模型在中英文文字混合的百度文字识别数据集上进行了测试,准确率接近86%,并且在弯曲文本的识别上也达到了较好的效果。在理论研究的基础上,根据现有需求设计并实现了文字检测、文字识别以及关键词提取模块。将各个模块整合到一起,实现自动的检测禁用词系统。系统整体采用客户端-服务器(C/S)架构,将文字检测、文字识别两个模块都部署在服务器端,利用服务器的CPU等设备加速模型的在线推理速度。最后还对整个系统与模块的性能进行了测试。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码驿站 ,原文地址:https://m.bishedaima.com/lunwen/54627.html