7篇关于TextCNN的计算机毕业论文

今天分享的是关于TextCNN的7篇计算机毕业论文范文, 如果你的论文涉及到TextCNN等主题,本文能够帮助到你 基于关系强度机制的领域知识图谱系统设计 这是一篇关于知识图谱

今天分享的是关于TextCNN的7篇计算机毕业论文范文, 如果你的论文涉及到TextCNN等主题,本文能够帮助到你

基于关系强度机制的领域知识图谱系统设计

这是一篇关于知识图谱,关系强度机制,句法依存分析,TextCNN,问答系统的论文, 主要内容为知识图谱的知识数据表达能力是其最重要的评价指标之一,为了进一步扩展与延伸数据表达能力,本文提出知识图谱关系强度机制的定义与表示方法,提出关系强度,关系时序的概念,旨在提高实体间关系的数据化表达能力,为知识计算提供更多数据支持,并设计了基于句法依存分析Dependency Parsing的关系强度因子的提取流程,并在医疗领域进行了实际应用。社会进步的一个显著特征就是人们的知识保有量在不断提高,在众多评价社会进步的标准中,医疗健康知识是非常重要的一个。然而,医疗健康领域也遇到了许多棘手的问题:医疗支出过高,医疗基础设施更迭成本过于昂贵,医疗从业人员技术要求过高等等。在这个人工智能技术大放异彩的时代,医疗健康领域也迎来了新的生机,知识图谱的出现更是推动了医疗知识问答系统的快速发展。本文构建了一个中文的医疗知识图谱,并在该知识库的基础上实现了医疗知识问答系统,提出了从互联网站点知识数据构建医疗知识图谱的完整技术方案,透过自然语言处理的诸多相关技术,建立相关语言模型,从互联网站点中的半结构化数据中提取医疗知识,并实现医疗知识检索与问答。本文通过python脚本收集整理互联网站点中的医疗知识数据,经由数据预处理后,转化为结构化的知识数据。根据医疗知识特点设计了知识图谱的本体数据规范,并基于NEO4J图形数据库完成知识数据的导入工作,最终构建出医疗领域知识图谱;通过解析用户自然语言问句的特征空间,通过Text CNN模型完成问题意图识别,建立AC自动机,识别问句的基本类型,再由问题转写器将问句翻译为CYPHER查询语句,检索知识图谱并优选问题答案,完成医疗知识数据的检索与问答,已支持多种问题类型,并实现了多问题类型的同步识别;并实现了关系强度机制在医疗知识问答系统中的实际应用,由FLASK容器完成了人机交互前端,方便用户使用与操作。

域名知识图谱的构建与绘制系统的设计与实现

这是一篇关于域名,知识图谱,ALBERT_ZH,TextCNN,搜索引擎的论文, 主要内容为随着互联网的快速发展和网络用户的急速增加,以及各种网络应用服务的广泛使用,逐渐使得网络空间成为了人类生产生活的主要空间,所以需要加强对网络空间的合法规范化管理,而域名作为人们通向网络空间的入口,其安全性对拥有良好的网络空间环境起着决定性作用,因此网络监管部门应该加大对网站域名安全性的监测管理力度。但是由于目前全世界注册的域名数量多达几亿,无法对所有域名进行监测管理,因此,基于工信部工业互联网创新发展工程新型标识项目,本文构建了专属于域名信息领域的知识图谱,并基于构建的域名数据设计开发了域名绘制系统,作为该项目的应用支撑子系统,来监测管理网络空间中的国内重点中文网站域名。本系统主要以项目中的异常预警和访问量高的域名,以及国内的重点域名作为目标对象,构建专属于重点域名领域内的知识图谱,设计实现域名信息领域内的搜索引擎,并对域名属性信息关联性进行分析展现。通过对国内重点域名属性信息的采集管理、精准检索和分析,有助于国家网络安全管理局等网络空间监管部门及时精准的获取国内重点域名的管理信息,并全面的了解国内互联网中重点域名服务的分布情况、域名间的关系、及企业拥有的重点域名规模等域名的运行发展情况,为网络空间的安全管理监测提供有力支撑。本文的主要工作内容如下:(1)构建专属于域名属性信息领域的知识图谱。首先以主被动结合的方式获取国内重点域名,通过解析出项目系统中产生的异常预警域名解析日志和访问量较高的域名日志中的域名,以及爬取国内部分重点域名的方式获取国内重点域名作为本系统中的域名主体。然后利用Scrapy爬虫框架对域名的whois信息、网站备案信息、IP地址和域名证书信息等多维属性信息进行采集。最后合理设计三元组关系,利用图数据库Neo4j对采集处理后的域名信息数据进行存储,完成知识图谱的构建。(2)本文以构建的域名知识图谱为基础,设计实现了专属于域名信息领域的搜索引擎,为了提高搜索引擎的准确度,本文对文本分类模型Text CNN进行了研究和优化。通过对域名领域的问题文本特征的分析得出,该领域文本具有文本短、字数少、特征稀疏和文本数据专业性强、数据集较少的特征,基于这些文本特征,本文从Text CNN模型输入层的文本向量表示和卷积层的模型参数调整这两方面对模型进行了优化。首先针对文本中专业词语对文本分类的影响,本文提出采用关键词词典方式将文本中的专业词语替换为固定词后,再对文本进行向量化表示;然后针对文本特征稀疏、数据集规模有限和传统word2vec方式不能对文本中的多义词进行动态表示的问题,本文引入ALBERT_ZH模型对输入文本的特征进行提取;最后针对Text CNN模型卷积核大小对具体文本任务执行效果的影响,本文通过先找出最佳的单个卷积核的大小后,然后探索该值附近和距离较远的几个不同的区域大小下该模型的分类效果,最终得到适用于域名问题分类的最佳区域值,进一步了提高Text CNN模型的文本分类效果。(3)基于构建的域名知识图谱,进行域名信息搜索引擎的设计和域名属性信息的分析,完成对域名信息的绘制。通过利用Django框架,并结合实验对比得出的文本分类算法,设计实现域名信息领域的高性能搜索引擎,同时通过对域名多维度属性信息的分析,获取并可视化的展现重点域名之间的域名关系、域名备案单位拥有的域名规模、域名应用类型占比和IP地域分布等情况,直观的了解域名的动态发展规律。

基于关系强度机制的领域知识图谱系统设计

这是一篇关于知识图谱,关系强度机制,句法依存分析,TextCNN,问答系统的论文, 主要内容为知识图谱的知识数据表达能力是其最重要的评价指标之一,为了进一步扩展与延伸数据表达能力,本文提出知识图谱关系强度机制的定义与表示方法,提出关系强度,关系时序的概念,旨在提高实体间关系的数据化表达能力,为知识计算提供更多数据支持,并设计了基于句法依存分析Dependency Parsing的关系强度因子的提取流程,并在医疗领域进行了实际应用。社会进步的一个显著特征就是人们的知识保有量在不断提高,在众多评价社会进步的标准中,医疗健康知识是非常重要的一个。然而,医疗健康领域也遇到了许多棘手的问题:医疗支出过高,医疗基础设施更迭成本过于昂贵,医疗从业人员技术要求过高等等。在这个人工智能技术大放异彩的时代,医疗健康领域也迎来了新的生机,知识图谱的出现更是推动了医疗知识问答系统的快速发展。本文构建了一个中文的医疗知识图谱,并在该知识库的基础上实现了医疗知识问答系统,提出了从互联网站点知识数据构建医疗知识图谱的完整技术方案,透过自然语言处理的诸多相关技术,建立相关语言模型,从互联网站点中的半结构化数据中提取医疗知识,并实现医疗知识检索与问答。本文通过python脚本收集整理互联网站点中的医疗知识数据,经由数据预处理后,转化为结构化的知识数据。根据医疗知识特点设计了知识图谱的本体数据规范,并基于NEO4J图形数据库完成知识数据的导入工作,最终构建出医疗领域知识图谱;通过解析用户自然语言问句的特征空间,通过Text CNN模型完成问题意图识别,建立AC自动机,识别问句的基本类型,再由问题转写器将问句翻译为CYPHER查询语句,检索知识图谱并优选问题答案,完成医疗知识数据的检索与问答,已支持多种问题类型,并实现了多问题类型的同步识别;并实现了关系强度机制在医疗知识问答系统中的实际应用,由FLASK容器完成了人机交互前端,方便用户使用与操作。

基于BERT的商品分类方法研究

这是一篇关于商品分类,短文本分类,BERT,TextCNN,TextRCNN的论文, 主要内容为根据GPC(Global Product Classification)分类标准,商品类别有几千种,实现快速准确的商品自动分类可以有效减轻工作人员负担。商品分类可通过商品图片、商品名称以及商品描述信息进行分类,本文通过商品名称对商品进行分类,由于商品名称属于文本且长度较短,因此本文着重研究对短文本分类方法改进并应用于商品分类任务。本文选择BERT模型进行微调并将BERT和其他模型结合应用于商品分类任务,所做主要工作如下:(1)微调BERT并应用于商品分类任务。重点研究BERT模型结构及工作原理,通过对BERT模型进行微调用于商品分类任务,并在自制数据集和北大开放研究数据平台获取的电商数据集上训练BERT模型和其他基准模型,在进行比较后,得出BERT模型相比于其他基准模型在商品分类任务的泛化能力更强的结论。(2)将BERT模型与TextCNN结合缓解微调后的BERT模型在商品分类任务存在的灾难性遗忘问题。TextCNN使用双通道输入,第一个通道采用BERT模型词嵌入得到的词向量作为输入,该词向量不会随着训练而更新;第二个通道采用Word2Vec词嵌入方式得到的词向量作为输入,该词向量作为参数会随着网络的训练不断更新,以此弥补BERT模型词嵌入过程中遗忘的信息。通过实验结果可知BERT-TextCNN的泛化能力好于微调后的BERT模型。(3)将BERT模型与TextRCNN结合缓解微调后的BERT模型在商品分类任务存在的灾难性遗忘问题。TextRCNN采用Bi LSTM,由于LSTM具有长时记忆能力,可以选择记忆序列在不同状态下的信息,因此可缓解BERT模型在商品分类任务中存在的灾难性遗忘问题。通过实验结果可知BERT-TextRCNN模型在商品分类任务的泛化能力最强。(4)实现商品自动分类系统。本文基于Spring Boot框架,接入通过Flask框架部署BERT-TextRCNN模型提供的分类接口,设计与实现了商品批量自动分类系统。

基于深度学习的社交平台情感分析系统设计

这是一篇关于深度学习,情感分析,文本分析,TextCNN,RNN,LSTM的论文, 主要内容为随着互联网技术的迅猛发展,微博等社交平台日渐成熟,用户量剧增导致文本数据爆炸式增长,并且用户所发表的言论简短,口语化严重,导致准确地识别文本中隐含的情感信息更加困难。传统的情感分析方法主要依靠人工构建情感词典,并且需要针对不同领域的语料选择不同的特征选择方法,费时费力,已无法满足短文本情感分析的需求。因此,本文结合深度学习的方法,开发了一个基于深度学习的社交平台情感分析系统。主要研究工作如下:1)进行了数据获取并对数据进行了类别标注。停用词列表采用“哈工大停用词词库”。数据集一部分从网站直接下载,分析整理,另一部分使用Scrapy框架,结合Beautiful soup解析网页,爬取微博评论短文本,最后采用人工标注的方法完成实验数据集的整理。2)建立了基于深度学习的情感分析模型。首先利用嵌入模块将处理好的实验数据,生成嵌入矩阵。然后利用LSTM捕获长距离依赖关系,利用TextCNN捕获单词之间的依赖关系。最后输出文本具体情感类别。分别与基于TextCNN的情感分析模型、基于RNN的情感分析模型、基于LSTM的情感分析模型在同一数据集上进行对比实验,结果表明,基于LSTM+TextCNN的情感分析模型,分类效果最好,准确率高达91.22%。3)开发了社交平台情感分析系统。以微博短文本情感分析为应用场景,以本文中实验方法为基础,设计并实现了一个文本情感分析系统。首先对系统进行需求分析,根据需求分析设计系统整体架构,主要包括数据的获取及存储、数据处理、模型训练、分类预测、人机交互五部分,采用Vue、Django、Scrapy框架进行搭建,Java、Python语言进行编写,最后利用ECharts实现系统可视化。

基于知识图谱的苹果病虫害智能问答系统研究

这是一篇关于苹果病虫害,知识图谱,问答系统,BiLSTM-CRF,TextCNN的论文, 主要内容为现如今,我国作为世界上最大的苹果生产国和消费国,其种植区域广、覆盖种类多,苹果病虫害的发生是直接影响苹果产量和品质的关键因素。由于种植模式的变化和种植区域的不断扩展,导致苹果病虫害种类逐渐增多,病虫害的威胁逐渐上升。从业者在遇到苹果病虫害问题时,如何快速准确地获取苹果病虫害相关知识并解答问题成为主要任务。然而利用问答系统对这些自然语言问题进行认识和分析,可得到最直观的回答。知识图谱的产生与发展为智能化问答系统的高品质知识库奠定了坚实的基础,促进了其在各行各业的广泛运用。基于此,本研究以苹果病虫害知识图谱为基础,融合深度学习技术在苹果病虫害自然语言领域的应用,设计并开发了一种智能化的苹果病虫害问答系统。主要进行的工作及成果如下:(1)苹果病虫害知识图谱的构建研究。本文的知识图谱构建基于自顶向下的设计理念,由模式层构建、数据采集、数据层构建和知识存储四个阶段组成。模式层构建根据领域数据不同特征抽象形成苹果病虫害知识本体和关系概念层。数据采集则利用书籍文本资料得到非结构化数据,利用Scrapy爬虫技术得到半结构化数据。数据层通过BIOES标注法使用Bi LSTM-CRF模型对非结构化的文本数据提取实体,建立苹果病虫害三元组。最后使用Load CSV的方法将三元组形式存入Neo4j库中完成知识存储。通过试验调整模型的训练参数指标,苹果病虫害实体识别使用Bi LSTM-CRF模型的F1值为85.97%,与传统的HMM模型和CRF模型相比,分别增加了10.64%和8.85%。(2)问答系统算法设计研究。在苹果病虫害知识图谱建立之上,使用基于Word2Vec词向量模型构造文本向量集,通过Text CNN模型进行问句意图的分类,再使用AhoCorasick算法和Bi LSTM+CRF的形式对问句实体进行提取,将意图和问句实体组合为问句三元组,最后使用Cypher构建查询语句对问句三元组检索答案。对实体类、实体关系类、实体属性类问句分别进行试验评估,其F1平均值为85.08%。(3)基于苹果病虫害知识图谱的问答系统搭建研究。本系统采用MVC模式并结合Flask、D3可视化等技术,针对知识图谱问答模块、关系检索模块、可视化模块完成前后端的构建与交互。实现了对用户苹果病虫害领域中危害症状、危害部位、防治方法、治疗药剂等方面的解答及可视化。

基于知识图谱的问答系统

这是一篇关于问答系统,知识图谱,文档向量,词向量,TextCNN的论文, 主要内容为近年来,基于自然语言的问答系统吸引了人工智能及其相关产业的关注,成为人机交互的新趋势。相比于传统的搜索引擎获取知识的方式,智能问答系统更加友好,自然语言交互的方式更符合人的习惯。随着知识图谱的快速发展,知识图谱已经被广泛引用到各大领域中,可作为问答系统一个高质量的数据源,对问答系统在各领域的应用起到了推进作用。基于知识图谱的问答系统(Question Answering System based on Knowledge Graphs,KGQA)需要解决两个关键点:问题的理解、问题到知识图谱的语义关联。问题的理解从问题出发,对问题进行解析,表示成计算机可以理解的形式,而语义关联指的是将问题的表示转化为知识图谱上的查询语句。以现有的飞行器关系型数据库和网页数据构建知识图谱,然后用基于模板的方法实现了基于知识图谱的问答系统。用基于朴素贝叶斯分类器的方法进行问题理解,理解询问的实体、属性或关系,生成结构化的查询语句从知识图谱找到答案。针对问题理解,又尝试了两种改进算法:使用doc2vec模型将问句转为分布式表示进行问题理解;训练词向量word2vec模型,用文本分类网络TextCNN进行问题理解。根据实验测试,基于word2vec和TextCNN的方法取得了较好的效果,在手工标注的测试集上取得了94.2%的精确率。结果表明,使用word2vec和TextCNN算法,较好地学习了词以及句子的语义特征,根据语义特征进行问题理解的方法取得了较好的问答性能。实现的飞行器知识图谱问答系统可以满足飞行器信息检索的需求,具有一定的科研价值和社会意义。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码货栈 ,原文地址:https://m.bishedaima.com/lunwen/48045.html

相关推荐

发表回复

登录后才能评论