给大家推荐8篇关于正则表达式的计算机专业论文

今天分享的是关于正则表达式的8篇计算机毕业论文范文, 如果你的论文涉及到正则表达式等主题,本文能够帮助到你 基于优化NFA正则匹配的Web信息抽取技术及应用研究 这是一篇关于NFA

今天分享的是关于正则表达式的8篇计算机毕业论文范文, 如果你的论文涉及到正则表达式等主题,本文能够帮助到你

基于优化NFA正则匹配的Web信息抽取技术及应用研究

这是一篇关于NFA,网页去噪,正则表达式,抽取规则,Ext Js框架的论文, 主要内容为随着网络技术的快速发展,互联网已经成为我们日常生活中必不可少的一部分。如何从海量的、半结构化万维网(Web)信息中挖掘出人们所感兴趣的信息变得越来越重要。以往基于网页模板实现的Web信息抽取软件,绝大多数是利用传统的基于NFA的正则表达式匹配算法来提取网页内容。但这些软件存在着模板维护难、抽取效率低等问题,通常只能抽取一类网站的数据,使得它们在现实中很难被广泛应用。本文研究的重点是如何优化NFA,改进传统的构建NFA的算法。另外也系统分析了Web信息抽取技术中网页预处理和三层开发框架整合等问题,并最终实现Web房屋数据抽取系统,该系统主要是为一些房地产评税系统提供样本数据。本文的主要工作如下:1.针对NFA(非确定型有限状态自动机)的研究,提出了用扩展方式构建NFA的算法,并设计了减少构建NFA时间和节省存储空间的一些优化方法。2.在基于NFA的正则表达式引擎下,提出了构造较优化的正则表达式的方法,比较优化前后的网页内容抽取效率,为后续制定各类网站的抽取规则提供优化策略。3.对于网页预处理给出了自动识别网页编码的方法,提出了基于模板的网页去噪算法,该算法能去除网页的可见和不可见噪音。4.在Ext Js、Spring和Hibernate框架的基础上,提出结合MVC+DAO的开发模式,解决了以往Web信息抽取软件模板维护难的弊端。通过引入Io C技术和AOP思想,分离了业务逻辑代码和基础代码,并减少了代码的冗余。5.基于以上的方法,设计并实现了一个Web房屋数据抽取系统。本系统可以多任务定时地对各类房屋信息网站进行页面源码解析、去噪、去重,并利用抽取规则和改进的基于NFA的正则表达式匹配算法来通用地抓取全国范围内的房屋数据。

基于优化NFA正则匹配的Web信息抽取技术及应用研究

这是一篇关于NFA,网页去噪,正则表达式,抽取规则,Ext Js框架的论文, 主要内容为随着网络技术的快速发展,互联网已经成为我们日常生活中必不可少的一部分。如何从海量的、半结构化万维网(Web)信息中挖掘出人们所感兴趣的信息变得越来越重要。以往基于网页模板实现的Web信息抽取软件,绝大多数是利用传统的基于NFA的正则表达式匹配算法来提取网页内容。但这些软件存在着模板维护难、抽取效率低等问题,通常只能抽取一类网站的数据,使得它们在现实中很难被广泛应用。本文研究的重点是如何优化NFA,改进传统的构建NFA的算法。另外也系统分析了Web信息抽取技术中网页预处理和三层开发框架整合等问题,并最终实现Web房屋数据抽取系统,该系统主要是为一些房地产评税系统提供样本数据。本文的主要工作如下:1.针对NFA(非确定型有限状态自动机)的研究,提出了用扩展方式构建NFA的算法,并设计了减少构建NFA时间和节省存储空间的一些优化方法。2.在基于NFA的正则表达式引擎下,提出了构造较优化的正则表达式的方法,比较优化前后的网页内容抽取效率,为后续制定各类网站的抽取规则提供优化策略。3.对于网页预处理给出了自动识别网页编码的方法,提出了基于模板的网页去噪算法,该算法能去除网页的可见和不可见噪音。4.在Ext Js、Spring和Hibernate框架的基础上,提出结合MVC+DAO的开发模式,解决了以往Web信息抽取软件模板维护难的弊端。通过引入Io C技术和AOP思想,分离了业务逻辑代码和基础代码,并减少了代码的冗余。5.基于以上的方法,设计并实现了一个Web房屋数据抽取系统。本系统可以多任务定时地对各类房屋信息网站进行页面源码解析、去噪、去重,并利用抽取规则和改进的基于NFA的正则表达式匹配算法来通用地抓取全国范围内的房屋数据。

基于微服务的主数据贯标系统设计与实现

这是一篇关于主数据,数据贯标,数据质量,正则表达式,同义词挖掘的论文, 主要内容为主数据是指企业中最重要、最核心的数据,如客户、供应商、产品、资产等,它们涵盖了企业业务的核心流程。主数据的质量直接影响企业的业务流程、数据决策和业务成果,对企业的事务性数据有一定的支撑性作用。符合规范标准的主数据可以对企业带来巨大经济效益。近年来在企业各部分之间流通的主数据质量受到了极大的重视。各企业开始参照国家主数据规范标准定期展开主数据质量贯标工作,目前在航天领域普遍使用传统的人工数据质量校验工具进行主数据贯标工作,不仅效率低,而且会消耗巨大的人力和资源,这种方式已经无法满足企业主数据贯标工作的基本要求。本文根据传统主数据贯标工作流程,结合航天科工集团内部主数据质量情况,使用Spring Cloud微服务架构设计并实现了主数据贯标系统。系统主要包括项目空间模块、源数据管理模块、标准数据集管理模块、规则管理模块、系统管理模块。项目空间模块由质量项目、质量方案、质量任务、问题清单、质量报告、检查报告子模块共同完成主数据质量贯标检查工作;源数据管理模块对待检主数据进行配置;标准数据集模块对用于贯标参考的主数据进行管理;规则管理模块对企业内部专家定义的数据检验规则以及用于参照匹配的同义词进行管理;系统管理模块对系统用户和权限进行管理。为了简化在内部网络环境下人工录入规则的复杂性,本文针对文本数据格式使用了数据质量规则提取算法。该算法利用字典树对相似的标准主数据文本进行分析,能够自动并准确地抽取出描述标准主数据文本的正则表达式。抽取的正则表达式可以在主数据贯标过程中检验主数据文本的命名准确性。此外论文还针对同义词合并问题提出了基于神经网络的同义词挖掘模型、该模型对于每个实体查找一组或多个其出现的上下文。通过多个上下文之间的双向匹配来学习实体间的相似度,最后用于同义词实体的发现。经过测试表明该模型可以实现主数据同义词的识别。论文通过完整的功能性测试和非功能测试对主数据贯标系统进行测试,测试结果表明系统达到了预期要求,在实际的使用过程中可以满足企业的主数据贯标工作。对各企业主数据贯标工作提供了一定的参考和思路。

基于Thrift框架的网络设备审计系统的设计与实现

这是一篇关于B/S架构,远程过程调用,配置审计,正则表达式,策略脚本的论文, 主要内容为现代计算机及网络技术的飞速发展,一方面为人们的信息共享提供了便利,同时也带来了信息数据泄露、非授权访问数据等一系列网络信息安全问题,而防火墙和路由器等网络设备是保护网络系统安全最基本也是最主要的设备,面对日益增长的网络规模,如何高效的管理和维护这些网络设备便显得越发重要,本文就是在此前提下,对网络设备审计系统进行了相关研究与设计实现。本文一方面对B/S架构和C/S架构技术进行了研究,总结并对比了两者的优劣,对RPC通信技术也进行了相关研究,并深入学习研究了 Apache Thrift框架的应用技术;另一方面对网络设备配置审计算法进行了深入研究,并根据正则表达式的特性及网络设备安全配置规范,提出了一种基于正则表达式的配置安全审计算法。在此基础上设计并实现了一种基于Thrift框架的、基于正则表达式配置安全审计算法的网络设备审计系统。文章还对系统的各个功能和通信接口进行了充分测试,并给出了测试结果。本文所做的主要工作有以下几个方面:1.对网络设备配置安全审计算法进行了深入研究,分析并总结了正则表达式的特性,再结合网络设备安全配置规范,提出了一种基于正则表达式的配置安全审计算法。2.设计并实现了一种基于Thrift框架的网络设备审计系统。对系统的整体架构进行了设计,并对其中比较重要的节点及设备管理模块、策略管理模块、任务及报表管理模块、系统及日志管理模块、采集节点服务模块、审计策略服务模块以及数据库模块的功能进行了详细的阐述和设计,并进行了编码实现。3.搭建并部署了测试环境,对系统的各个功能以及通信接口进行了充分测试,同时还对系统的安全性进行了相关测试,测试结果表明系统达到了预期的效果。此外,本文所设计实现的网络设备审计系统,能够对审计结果给出完整的图形化的安全风险分析报表以及相应的解决方案,并且提供自动修复相对简单的配置问题的功能选项,具有较高的实用价值。本系统还能针对不同产商不同型号的网络设备建立相应的策略脚本库,具有较高的可扩展性和广泛的适用性。

基于优化NFA正则匹配的Web信息抽取技术及应用研究

这是一篇关于NFA,网页去噪,正则表达式,抽取规则,Ext Js框架的论文, 主要内容为随着网络技术的快速发展,互联网已经成为我们日常生活中必不可少的一部分。如何从海量的、半结构化万维网(Web)信息中挖掘出人们所感兴趣的信息变得越来越重要。以往基于网页模板实现的Web信息抽取软件,绝大多数是利用传统的基于NFA的正则表达式匹配算法来提取网页内容。但这些软件存在着模板维护难、抽取效率低等问题,通常只能抽取一类网站的数据,使得它们在现实中很难被广泛应用。本文研究的重点是如何优化NFA,改进传统的构建NFA的算法。另外也系统分析了Web信息抽取技术中网页预处理和三层开发框架整合等问题,并最终实现Web房屋数据抽取系统,该系统主要是为一些房地产评税系统提供样本数据。本文的主要工作如下:1.针对NFA(非确定型有限状态自动机)的研究,提出了用扩展方式构建NFA的算法,并设计了减少构建NFA时间和节省存储空间的一些优化方法。2.在基于NFA的正则表达式引擎下,提出了构造较优化的正则表达式的方法,比较优化前后的网页内容抽取效率,为后续制定各类网站的抽取规则提供优化策略。3.对于网页预处理给出了自动识别网页编码的方法,提出了基于模板的网页去噪算法,该算法能去除网页的可见和不可见噪音。4.在Ext Js、Spring和Hibernate框架的基础上,提出结合MVC+DAO的开发模式,解决了以往Web信息抽取软件模板维护难的弊端。通过引入Io C技术和AOP思想,分离了业务逻辑代码和基础代码,并减少了代码的冗余。5.基于以上的方法,设计并实现了一个Web房屋数据抽取系统。本系统可以多任务定时地对各类房屋信息网站进行页面源码解析、去噪、去重,并利用抽取规则和改进的基于NFA的正则表达式匹配算法来通用地抓取全国范围内的房屋数据。

基于优化NFA正则匹配的Web信息抽取技术及应用研究

这是一篇关于NFA,网页去噪,正则表达式,抽取规则,Ext Js框架的论文, 主要内容为随着网络技术的快速发展,互联网已经成为我们日常生活中必不可少的一部分。如何从海量的、半结构化万维网(Web)信息中挖掘出人们所感兴趣的信息变得越来越重要。以往基于网页模板实现的Web信息抽取软件,绝大多数是利用传统的基于NFA的正则表达式匹配算法来提取网页内容。但这些软件存在着模板维护难、抽取效率低等问题,通常只能抽取一类网站的数据,使得它们在现实中很难被广泛应用。本文研究的重点是如何优化NFA,改进传统的构建NFA的算法。另外也系统分析了Web信息抽取技术中网页预处理和三层开发框架整合等问题,并最终实现Web房屋数据抽取系统,该系统主要是为一些房地产评税系统提供样本数据。本文的主要工作如下:1.针对NFA(非确定型有限状态自动机)的研究,提出了用扩展方式构建NFA的算法,并设计了减少构建NFA时间和节省存储空间的一些优化方法。2.在基于NFA的正则表达式引擎下,提出了构造较优化的正则表达式的方法,比较优化前后的网页内容抽取效率,为后续制定各类网站的抽取规则提供优化策略。3.对于网页预处理给出了自动识别网页编码的方法,提出了基于模板的网页去噪算法,该算法能去除网页的可见和不可见噪音。4.在Ext Js、Spring和Hibernate框架的基础上,提出结合MVC+DAO的开发模式,解决了以往Web信息抽取软件模板维护难的弊端。通过引入Io C技术和AOP思想,分离了业务逻辑代码和基础代码,并减少了代码的冗余。5.基于以上的方法,设计并实现了一个Web房屋数据抽取系统。本系统可以多任务定时地对各类房屋信息网站进行页面源码解析、去噪、去重,并利用抽取规则和改进的基于NFA的正则表达式匹配算法来通用地抓取全国范围内的房屋数据。

基于ASP.NET的综合BBS系统设计与实现

这是一篇关于在线论坛,面向对象,B/S结构,ASP.NET技术,正则表达式的论文, 主要内容为随着计算机技术,特别是网络通信技术的发展,网络文化中出现了新型的文化形式BBS。网络论坛提供给我们可以同任何人交流信息的机会,她向网友提供开放性的分类专题讨论区服务,可以在此发表自己的观感、交流技术、经验乃至人生的感悟与忧欢,也可以作为网友们的交流渠道。论坛已成为我们参与学习、社交及智慧发挥的一个舞台。然而,随着网络的发展,论坛也出现了很多的分支,开发一个实用性广、成本低并且维护简单的论坛成为网络论坛的主要方向。本文讨论的就是一个实用性高的网上论坛系统的设计与实现过程。论文首先概略介绍课题提出的背景及意义,分析国内外BBS系统的发展现状及存在的问题,提出课题研究的主要目的,从可行性和功能两方面对系统需求进行了分析,并提出了技术难点分析,为有效的建立ASP.NET论坛系统奠定基础后,进一步说明了系统的总体设计目标及设计原则,介绍了各个功能模块的实现,最后说明系统数据库的设计和系统的详细设计过程和系统的主要功能实现。完成系统开发后,对系统的性能进行了详细测试。通过对论坛系统开发过程的描述,论文详细地讲述了开发一个基于Web的通用BBS(Bullitin Board System)网站系统所用到的技术和方法。将系统划分为五大功能模块,其分别为:1.用户注册登录模块,2.公告栏模块,3.讨论区模块,4.友情链接模块,5.管理员模块。并对各个模块进行了详细设计与实现。该系统使用了当前使用最多的Microsoft Visual Studio 2008作为开发工具,SQL Server 2008作为底层数据库,引用了软件工程的相关理论知识,使用B/S结构的开发模式系统来开发本系统。该系统用到的技术主要包括ASP.NET技术,RegExp(Regular Expression正则表达式)技术等。经过详细的功能系统测试,本系统基本能够完成用户需求,实现基本功能,基本可以正常运行。

PAI系统的设计与实现

这是一篇关于CAI,动态演示,多媒体,数据库,正则表达式的论文, 主要内容为在教学过程中,利用计算机进行辅助教学逐渐成为主流,相应软件的研究与开发逐渐成为教学改革的重要组成部分,各学校都把教师利用计算机进行辅助教学,作为考核工作的重要内容。 一个优秀的教学辅助软件它应符合以下几个特点: 1.符合教育学理论,根据学生的特点找到符合大多数学生能力的理论方法,使教学过程更符合学生学习的习惯,使学生真正做到高效掌握知识技能。 2.符合学科规律,每个学科都有它们自身的特点规律,只有深入的理解本学科,才能找到比较恰当的表现本学科内容体系结构,从而帮助学生构建自身的知识系统。 3.符合心理认知的规律,综合利用多种因素强化学习效果,增强学生的长效记忆,减少学生的短期记忆的负担,使学生变被动为主动的学习,积极参与到教学过程中来。 根据以上对计算机辅助教学软件的要求,开发了PAI系统。PAI(Program Assisted Instruction)系统即程序设计辅助教学系统是为“高级语言程序设计”这门基础课设计的。本论文研究的主要内容包括以下几部分: 一、根据辅助教学活动的基本要求,设计了本系统的基本目标。它必须满足以下3方面的要求:必须符合教学原理,达到辅助教学的目的;必须很好地支持教学过程的反馈,使教学变得可控;作为一个应用系统,它的开发设计必须符合软件的开发设计规律,延长系统的生命周期。 二、为了实现上述目标,本系统共分成3个主要的功能模块来完成。第一个模块是为了帮助教师完成基本的理论教学工作;第二个模块是实现对课堂及平时学生学习情况的跟踪反馈;第三个模块则是提供一个输入的环境,给学生一个实践的平台。 为了保证系统的研发能按时顺利的完成,本系统在开发时采用敏捷的思想来指导研发工作,即每一个阶段都有一部分系统可交付使用,逐步完成系统,同时根据教学实践的要求,随时调整设计计划与设计需求,保证系统按时、高质量的完成设计。 三、教学理论的演示是学生掌握知识的起始点,它设计的好坏直接影响学生对问题的理解与掌握情况。它的设计也可利用软件工程中的螺旋模型进行开发,从而缩短了开发周期,提高了效率。 为了更好地体现需求、组织本学科的知识结构,使其在内容上趋于合理分布,本论文采用树型结构来组织逻辑很强的“程序设计”这门课。另一个比较关键的问题是以何种形式更好的表现展示自身的特性,即如何组织素材,及用何种软件来更好的将素材元素进行整理、汇总。本论文采用Photoshop、Flash 及Premiere进行素材的整理、加工与创造,为进一步的创作打下良好的基础。最后合成时采用Flash MX进行再创作,利用它的时间帧进行动画处理与内容的合理切换。 四、输入模块的设计与实现,本章完全借助于编译原理的基本思想和基本处理策略完成。特别是它在词法与语法分析阶段所用到正则表达式和正则描述(它利用标准的形式化方法,来进行词法分析),可大大提高编程的效率。利用正则表达是可实现在输入程序时的动态演示过程,从而提高学生的实践能力。它是利用了.NET的System命名空间中地String类加以实现。 五、学生信息跟踪反馈模块是利用关系数据库进行管理的。在数据库设计过程中,按照数据库设计的基本原则,借助软件工程的一些方法与工具模型,在充分理解需求的基础上,完成数据库的设计工作,最后在数据库产品中加以实现。而信息跟踪反馈模块的程序设计部分,也是利用软件工程的数据流图与系统流图的分析结果,确定了本模块的基本子功能模块,具体分为3个模块:平时学生学习状况跟踪子模块,用于考查学生平时的出勤与作业情况;课堂学 生学习情况的跟踪子模块,以课堂提问的形式加以量化;以及为了完成上述子模块的功能,而设立的基本信息维护模块,保证信息的完整性、有效性。 其中,课堂提问子模块在实现与设计时,充分考虑了教学过程中对知识反馈的要求,根据学生不同的课堂反应情况,来控制下一步的教学走向。在实现的时候利用题库中试题序号字段的编码规则,来对试题进行分类,最终根据学生课堂反馈的结果,利用序号引导下一次提问。 六、由于系统中包括以上三个模块,其功能不同且使用不同的工具软件或技术进行开发,本论文重点讨论了系统的集成问题。本系统利用了VB.NET中的线程类,及窗体类来完成系统的集成工作。 PAI系统是对教学辅助系统设计与实现的一种尝试,综合利用了多媒体技术、数据库管理模式与编译原理,较为完备的实现了系统的辅助教学功能,为系统的进一步升级与改进打下良好的基础。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码项目助手 ,原文地址:https://m.bishedaima.com/lunwen/51732.html

相关推荐

发表回复

登录后才能评论